本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
任務並行和佇列
從 Amazon 7.0.0 版及更新EMR版本開始,您可以為應用程式指定任務執行佇列逾時和並行組態。當您指定此組態時,Amazon EMR Serverless 會從佇列您的任務開始,並根據應用程式的並行使用率開始執行。例如,如果您的任務執行並行為 10,您的應用程式一次只會執行十個任務。剩餘的任務會排入佇列,直到其中一個執行中的任務終止為止。如果提早達到佇列逾時,您的任務會逾時。如需詳細資訊,請參閱任務執行狀態 。
並行和佇列的主要優點
當需要提交許多任務時,任務並行和佇列提供下列優點:
它有助於控制並行執行任務,以有效地使用您的應用程式層級容量限制。
佇列可以包含突增的任務提交,並具有可設定的逾時設定。
並行和佇列入門
下列程序顯示實作並行和佇列的幾種不同方法。
使用 AWS CLI
建立具有佇列逾時和並行任務執行的 Amazon EMR Serverless 應用程式:
aws emr-serverless create-application \ --release-label emr-7.0.0 \ --type SPARK \ --scheduler-configuration '{"maxConcurrentRuns": 1, "queueTimeoutMinutes": 30}'
更新應用程式以變更任務佇列逾時和並行:
aws emr-serverless update-application \ --application-id
application-id
\ --scheduler-configuration '{"maxConcurrentRuns": 5, "queueTimeoutMinutes": 30}'注意
您可以更新現有的應用程式,以啟用任務並行和佇列。若要這麼做,應用程式必須具有版本標籤 emr-7.0.0 或更新版本。
使用 AWS Management Console
下列步驟說明如何使用 開始使用任務並行和佇列 AWS Management Console:
前往 EMR Studio 並選擇建立版本標籤為 EMR-7.0.0 或更高版本的應用程式。
在應用程式設定選項 下,選取使用自訂設定 選項。
在其他組態下,有任務執行設定 的區段。選取啟用任務並行選項以啟用 功能。
選取後,您可以同時選取任務執行和佇列逾時,以分別設定並行任務執行和佇列逾時的數量。如果您未輸入這些設定的值,則會使用預設值。
選擇建立應用程式,然後會在啟用此功能的情況下建立應用程式。若要驗證,請前往儀表板,選取您的應用程式,並檢查屬性索引標籤下的 ,以判斷功能是否已啟用。
在組態之後,您可以在啟用此功能的情況下提交任務。
並行和佇列的考量
當您實作並行和佇列時,請考慮下列事項:
Amazon 7.0.0 版及更新EMR版本支援任務佇列和並行。
您可以為 STARTED 狀態中的應用程式更新並行。
的有效範圍
maxConcurrentRuns
為 1 到 1000,queueTimeoutMinutes
而 的有效範圍為 15 到 720。帳戶最多可有 2000 個任務處於 QUEUED 狀態。
並行和佇列適用於批次和串流任務。它不能用於互動式任務。如需詳細資訊,請參閱透過 EMR Studio 使用 EMR Serverless 執行互動式工作負載。