本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
控制傳送給工作者的資料物件流程
根據您建立的標籤任務類型,Amazon SageMaker Ground Truth 會以批次或串流方式將資料物件傳送給工作者。您可以使用下列方式,控制資料物件到工作者的流程:
-
對於這兩種類型的標籤工作,您可以使用
MaxConcurrentTaskCount
控制標籤工作正在執行時,指定時間點所有工作者可用的資料物件總數。 -
對於串流標籤工作,您可以透過監控和控制傳送至與標籤工作SQS相關聯的 Amazon 的資料物件數量,來控制資料物件流向工作者。
使用以下各章節以進一步了解這些選項。
使用 MaxConcurrentTaskCount 控制資料物件的流程
MaxConcurrentTaskCount
定義工作者入口網站任務佇列中一次可用的資料物件數量上限。如果您使用主控台,則此參數會設定為 1,000。如果您使用 CreateLabelingJob
,您可以將此參數設定為 1 到 5,000 之間的任何整數,包括 。
使用下列範例,以更了解清單檔案中的項目數量、 NumberOfHumanWorkersPerDataObject
和 如何MaxConcurrentTaskCount
定義工作者在其任務佇列中的工作者入口網站 UI 中看到的任務。
-
您有 600 個項目的輸入資訊清單檔案。
-
對於輸入資訊清單檔案中的每個項目,您可以使用
NumberOfHumanWorkersPerDataObject
來定義從輸入資訊清單檔案中標記項目的人力工作者數量。在此範例中,您將 設定為NumberOfHumanWorkersPerDataObject
等於 3。這將為輸入資訊清單檔案中的每個項目建立 3 個不同的任務。此外,若要標記為成功標記,至少 3 個不同的工作者必須標記物件。這總共會建立 1,800 個由工作者完成的任務 (600 x 3)。 -
您希望工作者在工作者入口網站 UI 中的佇列中一次只能看到 100 個任務。若要這麼做,請將 設定為
MaxConcurrentTaskCount
等於 100。Ground Truth 會為每個工作者填入 100 個任務。 -
接下來會發生什麼情況取決於您要建立的標籤任務類型,以及是否為串流標籤任務。
-
串流標籤工作 :只要工作者可用的物件總數等於
MaxConcurrentTaskCount
,輸入資訊清單檔案中所有剩餘的資料集物件,以及您使用 Amazon 即時傳送的物件SNS都會放置在 Amazon SQS佇列中。當工作者可用的物件總數低於MaxConcurrentTaskCount
減 時NumberOfHumanWorkersPerDataObject
,佇列中的新資料物件會用來建立NumberOfHumanWorkersPerDataObject
任務,這些任務會即時傳送給工作者。 -
非串流標籤工作:當工作者完成標籤一組物件後,最多會將
MaxConcurrentTaskCount
乘以NumberOfHumanWorkersPerDataObject
件新任務傳送給工作者。這個程序會重複執行,直到輸入資訊清單檔案中的所有資料物件完成標籤為止。
-
使用 Amazon SQS控制資料物件至串流標籤任務的流程
當您建立串流標籤工作時,會自動在帳戶中建立 Amazon SQS佇列。只有在傳送給工作者的物件總數超過 時,才會將資料物件新增至 Amazon SQS佇列MaxConcurrentTaskCount
。否則,物件會直接傳送給工作者。
您可以使用此佇列來管理資料物件到標籤工作的流程。如需進一步了解,請參閱 使用 Amazon SQS佇列管理標籤請求。