任務並行和佇列 - Amazon EMR

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

任務並行和佇列

從 Amazon 7.0.0 版及更新EMR版本開始,您可以為應用程式指定任務執行佇列逾時和並行組態。當您指定此組態時,Amazon EMR Serverless 會從佇列您的任務開始,並根據應用程式的並行使用率開始執行。例如,如果您的任務執行並行為 10,您的應用程式一次只會執行十個任務。剩餘的任務會排入佇列,直到其中一個執行中的任務終止為止。如果提早達到佇列逾時,您的任務會逾時。如需詳細資訊,請參閱任務執行狀態

並行和佇列的主要優點

當需要提交許多任務時,任務並行和佇列提供下列優點:

  • 它有助於控制並行執行任務,以有效地使用您的應用程式層級容量限制。

  • 佇列可以包含突增的任務提交,並具有可設定的逾時設定。

並行和佇列入門

下列程序顯示實作並行和佇列的幾種不同方法。

使用 AWS CLI

  1. 建立具有佇列逾時和並行任務執行的 Amazon EMR Serverless 應用程式:

    aws emr-serverless create-application \ --release-label emr-7.0.0 \ --type SPARK \ --scheduler-configuration '{"maxConcurrentRuns": 1, "queueTimeoutMinutes": 30}'
  2. 更新應用程式以變更任務佇列逾時和並行:

    aws emr-serverless update-application \ --application-id application-id \ --scheduler-configuration '{"maxConcurrentRuns": 5, "queueTimeoutMinutes": 30}'
    注意

    您可以更新現有的應用程式,以啟用任務並行和佇列。若要這麼做,應用程式必須具有版本標籤 emr-7.0.0 或更新版本。

使用 AWS Management Console

下列步驟說明如何使用 開始使用任務並行和佇列 AWS Management Console:

  1. 前往 EMR Studio 並選擇建立版本標籤為 EMR-7.0.0 或更高版本的應用程式。

  2. 應用程式設定選項 下,選取使用自訂設定 選項。

  3. 在其他組態下,有任務執行設定 的區段。選取啟用任務並行選項以啟用 功能。

  4. 選取後,您可以同時選取任務執行佇列逾時,以分別設定並行任務執行和佇列逾時的數量。如果您未輸入這些設定的值,則會使用預設值。

  5. 選擇建立應用程式,然後會在啟用此功能的情況下建立應用程式。若要驗證,請前往儀表板,選取您的應用程式,並檢查屬性索引標籤下的 ,以判斷功能是否已啟用。

在組態之後,您可以在啟用此功能的情況下提交任務。

並行和佇列的考量

當您實作並行和佇列時,請考慮下列事項:

  • Amazon 7.0.0 版及更新EMR版本支援任務佇列和並行。

  • 您可以為 STARTED 狀態中的應用程式更新並行。

  • 的有效範圍maxConcurrentRuns為 1 到 1000,queueTimeoutMinutes而 的有效範圍為 15 到 720。

  • 帳戶最多可有 2000 個任務處於 QUEUED 狀態。

  • 並行和佇列適用於批次和串流任務。它不能用於互動式任務。如需詳細資訊,請參閱透過 EMR Studio 使用 EMR Serverless 執行互動式工作負載