使用 Amazon Mechanical Turk 人力資源 - Amazon SageMaker AI

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

使用 Amazon Mechanical Turk 人力資源

Amazon Mechanical Turk (Mechanical Turk) 人力資源為您的 Amazon SageMaker Ground Truth 標籤工作和 Amazon Augmented AI 人工審核任務提供最多工作者。Amazon Mechanical Turk 人力資源是全球級資源。每週 7 天、每天 24 小時都可提供工作者。當您使用 Amazon Mechanical Turk 人力資源時,人工審核任務和標籤工作的周轉時間通常最快。

任何 Amazon Mechanical Turk 人力資源的計費都會以 Ground Truth 或 Amazon 增強版 AI 計費的一部分進行處理。您不需要建立個別的 Mechanical Turk 帳戶,即可使用 Amazon Mechanical Turk 人力資源。

重要

請勿與此人力資源分享機密資訊、個人資訊或受保護的醫療資訊。當您將 Amazon A2I 與 AWS HIPAAAmazon Textract 和 Amazon Rekognition 等合格服務搭配使用時,不應使用 Amazon Mechanical Turk 人力資源,用於包含受保護健康資訊的工作負載。

當您建立 Ground Truth 標籤工作或 Amazon A2I 人工審核工作流程 (流程定義) 時,您可以選擇 Mechanical Turk 作為您的人力資源。您可以使用 SageMaker AI 主控台和 建立標籤工作和人工審核工作流程API。

當您使用 API操作來建立標籤工作或人工審核工作流程時,您可以將下列項目ARN用於 的 Amazon Mechanical Turk 人力資源WorkteamArnregion 將 取代為您 AWS 用來建立標籤工作或人工循環的區域。例如,如果您在美國西部 (奧勒岡) 建立標籤工作,請將 region 取代為 us-west-2

  • arn:aws:sagemaker:region:394669845002:workteam/public-crowd/default

當您使用 Mechanical Turk 時,Ground Truth 和 Amazon A2I 要求輸入資料不含個人身分識別資訊 (PII)。如果您使用 Mechanical Turk 人力資源,且未指定輸入資料不含 PII,則 Ground Truth 標記任務和增強版 AI 任務將會失敗。當您建立 Ground Truth 標籤任務PII,以及使用內建整合或 StartHumanLoop操作建立 Amazon A2I 人工循環時,您可以指定輸入資料是沒有的。

請參閱以下各節,了解如何搭配這些服務使用 Mechanical Turk。

使用搭載 Ground Truth 的 Mechanical Turk

當您使用主控台或 CreateLabelingJob 操作建立標籤工作時,您可以使用搭載 Ground Truth 的 Mechanical Turk。

建立標籤工作時,建議您根據工作的複雜性和所需的品質,調整註釋每個資料物件的工作者數量。Amazon SageMaker Ground Truth 使用註釋合併來改善標籤的品質。對於較複雜的標籤工作,較多的工作者可以提升標籤品質,但對於較簡單的工作可能沒有差別。如需詳細資訊,請參閱註釋合併。Amazon A2I 人工審核工作流程不支援註釋合併。

如要在建立標籤工作 (主控台) 時使用 Mechanical Turk:
  1. 使用下列項目,使用 SageMaker AI 主控台的 Ground Truth 區域建立標籤工作:建立標籤工作 (主控台)

  2. 工作者區段中選取工作者類型時,請選取 Amazon Mechanical Turk

  3. 使用任務逾時指定工作者必須完成任務的總時間。

  4. 指定任務結束時,工作者仍可使用的總時間。這是工作者必須在任務失敗之前經手任務的時間。

  5. 使用下拉式清單選擇 Price per task (按任務收費)。這是工作者完成單一任務所獲得的金額。

  6. (選用) 如果適用,請選取資料集不包含成人內容。SageMaker AI 可能會限制可在包含成人內容時檢視任務的 Mechanical Turk 工作者。

  7. 您必須選取核取方塊來閱讀並確認以下聲明,才能使用 Mechanical Turk 人力資源。如果您輸入的資料包含機密資訊、個人資訊或受保護的健康資訊,您必須選擇其他人力資源。

    您了解並同意,Mechanical Turk 人力資源由位於世界各地的獨立承包商組成,您不應與此人力資源共享機密資訊、個人資訊或受保護的健康資訊。

  8. (選用) 如要啟用自動化資料標籤,請選取 Enable automated data labeling (啟用自動化資料標籤) 旁邊的核取方塊。若要進一步了解此功能,請參閱自動化資料標籤

  9. 您可以在其他組態底下指定 每個資料集物件的工作者數量。例如,如果您在此欄位中輸入 3,則每個資料物件將由 3 個工作者標籤。

透過選擇 建立來建立標籤工作時,您的標籤任務將傳送給 Mechanical Turk 工作者。

若要在建立標籤工作時使用 Mechanical Turk (API):
  1. 若要使用 CreateLabelingJob 作業來建立標籤工作,請使用下列步驟:建立標籤任務 (API)

  2. 針對 WorkteamArn 使用下列步驟。region 將 取代為您 AWS 用來建立標籤任務的區域。

    arn:aws:sagemaker:region:394669845002:workteam/public-crowd/default

  3. TaskTimeLimitInSeconds 指定工作者完成任務所需的總時間。

  4. TaskAvailabilityLifetimeInSeconds 指定工作者仍可進行任務的總時間。這是工作者必須在任務失敗之前經手任務的時間。

  5. NumberOfHumanWorkersPerDataObject 指定每個資料集物件的工作者數量。

  6. PublicWorkforceTaskPrice 設定按任務收費。這是工作者完成單一任務所獲得的金額。

  7. DataAttributes 註明您輸入的資料不含機密資訊、個人資訊或受保護的健康資訊。

    如果您使用 Mechanical Turk 人力資源,Ground Truth 要求輸入資料不含個人身分識別資訊 (PII)。如果您使用 Mechanical Turk 且未指定您的輸入資料未使用PIIFreeOfPersonallyIdentifiableInformation旗標,則您的標籤工作將會失敗。

    使用 FreeOfAdultContent旗標宣告您的輸入資料不含成人內容。AI SageMaker 可能會限制如果包含成人內容,可以檢視任務的 Mechanical Turk 工作者。

您可以在下列筆記本API中查看如何使用的範例,請參閱 GitHub:Ground Truth Jupyter 筆記本範例。您可以在筆記本執行個體中的 SageMaker AI 存取範例筆記本 下存取這些筆記本。 https://docs.aws.amazon.com/sagemaker/latest/dg/nbi.html

搭配 Amazon A2I 使用 Mechanical Turk

您可以在建立人工檢閱工作流程時,指定要搭配 Amazon A2I 使用 Mechanical Turk,也稱為流程定義、在主控台中,或搭配 CreateFlowDefinitionAPI操作。當您使用此人工審核工作流程設定人工循環時,您必須指定您的輸入資料不含 PII。

如要在建立人工審核工作流程時使用 Mechanical Turk (主控台):
  1. 使用下列項目,在 AI 主控台的擴增 SageMaker AI 區段中建立人工審核工作流程:建立人工審核工作流程 (主控台)

  2. 工作者區段中選取工作者類型時,請選取 Amazon Mechanical Turk

  3. 使用下拉式清單選擇 Price per task (按任務收費)。這是工作者完成單一任務所獲得的金額。

  4. (選用) 您可以在其他組態底下指定每個資料集物件的工作者數量。例如,如果您在此欄位中輸入 3,則每個資料物件將由 3 個工作者標籤。

  5. (選用) 使用任務逾時,指定工作者必須完成任務的總時間。

  6. (選用) 透過 任務結束,指定任務在到期時,工作者仍可使用的總時間。這是工作者必須在任務失敗之前經手任務的時間。

  7. 建立人工審核工作流程後,您可以使用它在 參數 中提供其 Amazon Resource Name (ARN) 來設定人工循環FlowDefinitionArn。您可以使用內建任務類型的其中一個API操作或 Amazon A2I 執行時間API操作 來設定人工迴圈StartHumanLoop。如需進一步了解,請參閱 建立和啟動人工循環

    當您設定人工迴圈時,您必須使用 中的FreeOfPersonallyIdentifiableInformation內容分類器,指定輸入資料不含個人身分識別資訊 (PII)DataAttributes。如果您使用 Mechanical Turk 且未指定您的輸入資料不含 PII,則人工審核任務將會失敗。

    使用 FreeOfAdultContent旗標宣告您的輸入資料不含成人內容。AI SageMaker 可能會限制如果包含成人內容,可以檢視任務的 Mechanical Turk 工作者。

若要在建立人工檢閱工作流程 () 時使用 Mechanical TurkAPI:
  1. 透過下列步驟,建立使用 CreateFlowDefinition 操作的人工審核工作流程:建立人工審核工作流程 (API)

  2. 針對 WorkteamArn 使用下列步驟。region 將 取代為您 AWS 用來建立標籤任務的區域。

    arn:aws:sagemaker:region:394669845002:workteam/public-crowd/default

  3. TaskTimeLimitInSeconds 指定工作者完成任務所需的總時間。

  4. TaskAvailabilityLifetimeInSeconds 指定工作者仍可進行任務的總時間。這是工作者必須在任務失敗之前經手任務的時間。

  5. TaskCount 指定每個資料集物件的工作者數量。例如,如果您為此參數指定 3,則每個資料物件將由 3 個工作者標籤。

  6. PublicWorkforceTaskPrice 設定按任務收費。這是工作者完成單一任務所獲得的金額。

  7. 建立人工審核工作流程後,您可以使用它在 參數 中提供其 Amazon Resource Name (ARN) 來設定人工循環FlowDefinitionArn。您可以使用內建任務類型的其中一個API操作或 Amazon A2I 執行時間API操作 來設定人工迴圈StartHumanLoop。如需進一步了解,請參閱 建立和啟動人工循環

    當您設定人工迴圈時,您必須使用 中的FreeOfPersonallyIdentifiableInformation內容分類器,指定輸入資料不含個人身分識別資訊 (PII)DataAttributes。如果您使用 Mechanical Turk 且未指定您的輸入資料不含 PII,則人工審核任務將會失敗。

    使用 FreeOfAdultContent旗標宣告您的輸入資料不含成人內容。AI SageMaker 可能會限制如果包含成人內容,可以檢視任務的 Mechanical Turk 工作者。

您可以在下列筆記本API中查看如何使用的範例,請參閱 GitHub:Amazon A2I Jupyter 筆記本範例

什麼情況下系統不支援 Mechanical Turk?

在下列情況下,系統將不支援此人力資源。在每個案例中,您都必須使用私有廠商人力資源。

  • Ground Truth 影片影格標籤工作和 3D 點雲標籤工作不支援此人力資源。

  • 如果您的輸入資料包含個人識別資訊 (),則無法使用此人力資源PII。

  • 某些 AWS 特殊區域不提供 Mechanical Turk。若適用,請參閱您特殊區域的文件,以取得更多資訊。