本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
視您建立的標籤工作類型而定,Amazon SageMaker Ground Truth 會以批次或串流方式將資料物件傳送給員工。您可以使用下列方式,控制資料物件到工作者的流程:
-
對於這兩種類型的標籤工作,您可以使用
MaxConcurrentTaskCount
控制標籤工作正在執行時,指定時間點所有工作者可用的資料物件總數。 -
如為串流標籤工作,您可以透過監控和控制傳送至與標籤工作相關聯之 Amazon SQS 的資料物件數量,來控制資料物件到工作者的流程。
請參閱以下各節,進一步了解這些選項。
使用 MaxConcurrentTaskCount 控制資料物件的流程
MaxConcurrentTaskCount
定義工作者入口網站任務佇列中一次可用的資料物件數量上限。如果您使用主控台,則此參數會設定為 1,000。如果您使用 CreateLabelingJob
,您可以將此參數設定為 1 到 5,000 之間的任何整數,包括在內。
使用下列範例,以更了解資訊清單檔案中的項目數量、 NumberOfHumanWorkersPerDataObject
和 如何MaxConcurrentTaskCount
定義工作者在工作者入口網站 UI 的任務佇列中看到的任務。
-
您有 600 個項目的輸入資訊清單檔案。
-
對於輸入資訊清單檔案中的每個項目,您可以使用
NumberOfHumanWorkersPerDataObject
來定義從輸入資訊清單檔案中標記項目的人力工作者數量。在此範例中,您將 設定為NumberOfHumanWorkersPerDataObject
等於 3。這將針對輸入資訊清單檔案中的每個項目建立 3 個不同的任務。此外,若要標記為成功標記,至少 3 個不同的工作者必須標記物件。這會建立總共 1,800 個由工作者完成的任務 (600 x 3)。 -
您希望工作者在工作者入口網站 UI 中的佇列中一次只能看到 100 個任務。若要這樣做,請將 設定為
MaxConcurrentTaskCount
等於 100。然後,Ground Truth 會將每個工作者的 100 個任務填入工作者入口網站任務佇列。 -
接下來會發生什麼情況,取決於您要建立的標籤任務類型,以及是否為串流標籤任務。
-
串流標籤工作:只要工作者可用的物件總數等於
MaxConcurrentTaskCount
,輸入資訊清單檔案中所有剩餘的資料集物件,以及您使用 Amazon SNS 即時傳送的物件都會放置在 Amazon SQS 佇列上。當工作者可用的物件總數低於MaxConcurrentTaskCount
減 時NumberOfHumanWorkersPerDataObject
,佇列中的新資料物件會用來建立NumberOfHumanWorkersPerDataObject
任務,並即時傳送給工作者。 -
非串流標籤工作:當工作者完成標籤一組物件後,最多會將
MaxConcurrentTaskCount
乘以NumberOfHumanWorkersPerDataObject
件新任務傳送給工作者。這個程序會重複執行,直到輸入資訊清單檔案中的所有資料物件完成標籤為止。
-
使用 Amazon SQS 來控制資料物件到串流標籤任務的流程
建立串流標籤工作時,系統會在您的帳戶中自動建立 Amazon SQS 佇列。只有當傳送給工作者的物件總數超過MaxConcurrentTaskCount
時,資料物件才會新增至 Amazon SQS 佇列。否則,物件會直接傳送給工作者。
您可以使用此佇列來管理資料物件到標籤工作的流程。如需進一步了解,請參閱 使用 Amazon SQS 佇列管理標籤請求。