控制傳送給工作者的資料物件流程 - Amazon SageMaker

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

控制傳送給工作者的資料物件流程

根據您建立的標籤任務類型,Amazon SageMaker Ground Truth 會以批次或串流方式將資料物件傳送給工作者。您可以使用下列方式,控制資料物件到工作者的流程:

  • 對於這兩種類型的標籤工作,您可以使用MaxConcurrentTaskCount控制標籤工作正在執行時,指定時間點所有工作者可用的資料物件總數。

  • 對於串流標籤工作,您可以透過監控和控制傳送至與標籤工作SQS相關聯的 Amazon 的資料物件數量,來控制資料物件流向工作者。

使用以下各章節以進一步了解這些選項。

使用 MaxConcurrentTaskCount 控制資料物件的流程

MaxConcurrentTaskCount 定義工作者入口網站任務佇列中一次可用的資料物件數量上限。如果您使用主控台,則此參數會設定為 1,000。如果您使用 CreateLabelingJob,您可以將此參數設定為 1 到 5,000 之間的任何整數,包括 。

使用下列範例,以更了解清單檔案中的項目數量、 NumberOfHumanWorkersPerDataObject和 如何MaxConcurrentTaskCount定義工作者在其任務佇列中的工作者入口網站 UI 中看到的任務。

  1. 您有 600 個項目的輸入資訊清單檔案。

  2. 對於輸入資訊清單檔案中的每個項目,您可以使用 NumberOfHumanWorkersPerDataObject 來定義從輸入資訊清單檔案中標記項目的人力工作者數量。在此範例中,您將 設定為NumberOfHumanWorkersPerDataObject等於 3。這將為輸入資訊清單檔案中的每個項目建立 3 個不同的任務。此外,若要標記為成功標記,至少 3 個不同的工作者必須標記物件。這總共會建立 1,800 個由工作者完成的任務 (600 x 3)。

  3. 您希望工作者在工作者入口網站 UI 中的佇列中一次只能看到 100 個任務。若要這麼做,請將 設定為MaxConcurrentTaskCount等於 100。Ground Truth 會為每個工作者填入 100 個任務。

  4. 接下來會發生什麼情況取決於您要建立的標籤任務類型,以及是否為串流標籤任務。

    • 串流標籤工作 :只要工作者可用的物件總數等於 MaxConcurrentTaskCount,輸入資訊清單檔案中所有剩餘的資料集物件,以及您使用 Amazon 即時傳送的物件SNS都會放置在 Amazon SQS佇列中。當工作者可用的物件總數低於MaxConcurrentTaskCount減 時NumberOfHumanWorkersPerDataObject,佇列中的新資料物件會用來建立 NumberOfHumanWorkersPerDataObject任務,這些任務會即時傳送給工作者。

    • 非串流標籤工作:當工作者完成標籤一組物件後,最多會將MaxConcurrentTaskCount乘以NumberOfHumanWorkersPerDataObject件新任務傳送給工作者。這個程序會重複執行,直到輸入資訊清單檔案中的所有資料物件完成標籤為止。

使用 Amazon SQS控制資料物件至串流標籤任務的流程

當您建立串流標籤工作時,會自動在帳戶中建立 Amazon SQS佇列。只有在傳送給工作者的物件總數超過 時,才會將資料物件新增至 Amazon SQS佇列MaxConcurrentTaskCount。否則,物件會直接傳送給工作者。

您可以使用此佇列來管理資料物件到標籤工作的流程。如需進一步了解,請參閱 使用 Amazon SQS佇列管理標籤請求