本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
使用 Amazon Mechanical Turk 人力
Amazon Mechanical Turk(土耳其人機械)勞動力為您的 Amazon SageMaker Ground Truth 標籤任務和 Amazon 增強人工智能人工審查任務提供了最多的工作人員。Amazon Mechanical Turk 人力是全球級資源。每週 7 天、每天 24 小時都可提供工作者。當您使用 Amazon Mechanical Turk 人力時,人工檢閱任務和標記任務的周轉時間通常最快。
任何 Amazon Mechanical Turk 人力的計費都會以 Ground Truth 或 Amazon 擴增 AI 計費的一部分進行處理。您不需要建立個別的 Mechanical Turk 帳戶,即可使用 Amazon Mechanical Turk 人力。
重要
請勿與此人力分享機密資訊、個人資訊或受保護的醫療資訊。當您將 Amazon A2I 與 AWS 符合 HIPAA 資格的服務 (例如 Amazon Textract 和 Amazon Rekognition) 搭配使用時,不應使用 Amazon 機械土耳其人員工作負載來處理包含受保護醫療資訊的工作負載。
當您建立 Ground Truth 標記任務或 Amazon A2I 人工檢閱工作流程 (流程定義) 時,您可以選擇 Mechanical Turk 作為您的人力。您可以使用 SageMaker 主控台和 API 建立標籤任務和人工審核工作流程。
當您使用 API 操作建立標記任務或人工檢閱工作流程時,您可以為您的WorkteamArn
針對 Amazon Mechanical Turk 人力使用以下 ARN。取代
為您用來建立標籤工作或人工迴圈的 AWS 區域。例如,如果您在美國西部 (奧勒岡) 建立標記任務,請將 region
替換為 region
us-west-2
。
-
arn:aws:sagemaker:
region
:394669845002:workteam/public-crowd/default
Ground Truth 和 Amazon A2I 要求您在使用 Mechanical Turk 時,輸入的資料不含個人身分識別資訊 (PII)。如果您使用 Mechanical Turk 人力,但未註明您的輸入資料不含 PII,則您的 Ground Truth 標記任務和擴增 AI 任務將會失敗。當您建立 Ground Truth 標記任務,以及使用內建整合或 StartHumanLoop
操作建立 Amazon A2I 人工迴路時,請註明您的輸入資料不含 PII。
請參閱以下各節,了解如何搭配這些服務使用 Mechanical Turk。
使用搭載 Ground Truth 的 Mechanical Turk
當您使用主控台或 CreateLabelingJob
操作建立標記任務時,您可以使用搭載 Ground Truth 的 Mechanical Turk。
建立標記任務時,建議您根據任務的複雜性和所需的品質,調整註釋每個資料物件的工作者數量。Amazon SageMaker Ground Truth 使用註釋整合來提高標籤的質量。對於較複雜的標記任務,較多的工作者可以提升標籤品質,但對於較簡單的任務可能沒有差別。如需詳細資訊,請參閱 註釋合併。Amazon A2I 人工檢閱工作流程不支援註釋整合。
如要在建立標記任務 (主控台) 時使用 Mechanical Turk:
-
使用以下命令,使用 SageMaker控制台的「基本真相」區域創建標籤工作:建立標記任務 (主控台)。
-
在工作者區段中選取工作者類型時,請選取 Amazon Mechanical Turk。
-
使用任務逾時指定工作者必須完成任務的總時間。
-
指定任務結束時,工作者仍可使用的總時間。這是工作者必須在任務失敗之前經手任務的時間。
-
使用下拉式清單選擇 Price per task (按任務收費)。這是工作者完成單一任務所獲得的金額。
-
(選擇性) 如果適用,請選取資料集不包含成人內容。 SageMaker 如果包含成人內容,則可能會限制可以查看您的任務的 Mechanical Turk 工作人員。
-
您必須選取核取方塊來閱讀並確認以下聲明,才能使用 Mechanical Turk 人力。如果您輸入的資料包含機密資訊、個人資訊或受保護的健康資訊,您必須選擇其他人力。
您了解並同意,Mechanical Turk 人力由位於世界各地的獨立承包商組成,您不應與該人力共享機密資訊、個人資訊或受保護的健康資訊。
-
(選用) 如要啟用自動化資料標記,請選取 Enable automated data labeling (啟用自動化資料標記) 旁邊的核取方塊。若要進一步了解此功能,請參閱 自動化資料標籤。
-
您可以在 Additional configuration (其他設定) 底下指定 Number of workers per dataset object (每個資料集物件的工作者數量)。例如,如果您在此欄位中輸入 3,則每個資料物件將由 3 個工作者標記。
透過選擇 Create (建立) 來建立標記任務時,您的標記任務將傳送給 Mechanical Turk 工作者。
如要在建立標記任務 (API) 時使用 Mechanical Turk:
-
若要使用
CreateLabelingJob
操作來建立標記任務,請使用下列步驟:建立標記任務 (API)。 -
針對
WorkteamArn
使用下列步驟。以您用來建立標籤工作的 AWS 區域取
代。region
arn:aws:sagemaker:
region
:394669845002:workteam/public-crowd/default -
用
TaskTimeLimitInSeconds
指定工作者完成任務所需的總時間。 -
用
TaskAvailabilityLifetimeInSeconds
指定工作者仍可進行任務的總時間。這是工作者必須在任務失敗之前經手任務的時間。 -
用
NumberOfHumanWorkersPerDataObject
指定每個資料集物件的工作者數量。 -
用
PublicWorkforceTaskPrice
設定按任務收費。這是工作者完成單一任務所獲得的金額。 -
用
DataAttributes
註明您輸入的資料不含機密資訊、個人資訊或受保護的健康資訊。如果您使用 Mechanical Turk 人力,Ground Truth 會要求您的輸入資料不含個人身分識別資訊 (PII)。如果您使用 Mechanical Turk,並且沒有使用
FreeOfPersonallyIdentifiableInformation
旗標指定輸入資料沒有 PII,則標記任務將失敗。使用
FreeOfAdultContent
旗標來宣告您的輸入資料不含成人內容。 SageMaker 如果包含成人內容,則可能會限制可以查看您的任務的 Mechanical Turk 工作人員。
您可以在下列筆記本中查看如何使用此 API 的範例,請參閱 GitHub:Ground Truth Jupyter 筆記本
搭配 Amazon A2I 使用 Mechanical Turk
您可以在主控台或 CreateFlowDefinition
API 操作中建立人工檢閱工作流程 (亦稱為流程定義) 時,指定要將 Mechanical Turk 與 Amazon A2I 搭配使用。當您使用此人工檢閱工作流程來設定人工迴圈時,必須指定您的輸入資料不含 PII。
如要在建立人工檢閱工作流程時使用 Mechanical Turk (主控台):
-
使用以下內容在 SageMaker 主控台的「Augmented AI」區段中建立人工審核工作流程:建立人工檢閱工作流程 (主控台)
-
在工作者區段中選取 Worker types (工作者類型) 時,請選取 Amazon Mechanical Turk。
-
使用下拉式清單選擇 Price per task (按任務收費)。這是工作者完成單一任務所獲得的金額。
-
(選用) 您可以在 Additional configuration (其他組態) 底下指定每個資料集物件的工作者數量。例如,如果您在此欄位中輸入 3,則每個資料物件將由 3 個工作者標記。
-
(選用) 使用 Task timeout (任務逾時),指定工作者必須完成任務的總時間。
-
(選用) 透過 Task expiration (任務結束),指定任務在到期時,工作者仍可使用的總時間。這是工作者必須在任務失敗之前經手任務的時間。
-
建立人工檢閱工作流程後,您可以在參數
FlowDefinitionArn
中提供其 Amazon Resource Name (ARN),藉此設定人工迴圈。您可以使用內建任務類型的其中一個 API 操作或 Amazon A2I 執行時間 API 操作 (StartHumanLoop
),來設定人工迴圈。如需進一步了解,請參閱 建立和啟動人工迴圈。設定人工迴圈時,您必須使用
DataAttributes
中的FreeOfPersonallyIdentifiableInformation
內容分類器,註明您的輸入資料不含個人身分識別資訊 (PII)。如果您使用 Mechanical Turk,而並未註明您的輸入資料沒有 PII,則人工檢閱任務將失敗。使用
FreeOfAdultContent
旗標來宣告您的輸入資料不含成人內容。 SageMaker 如果包含成人內容,則可能會限制可以查看您的任務的 Mechanical Turk 工作人員。
如要在建立人工檢閱工作流程 (API) 時使用 Mechanical Turk:
-
透過下列步驟,建立使用
CreateFlowDefinition
操作的人工檢閱工作流程:建立人工檢閱工作流程 (API)。 -
針對
WorkteamArn
使用下列步驟。以您用來建立標籤工作的 AWS 區域取
代。region
arn:aws:sagemaker:
region
:394669845002:workteam/public-crowd/default -
用
TaskTimeLimitInSeconds
指定工作者完成任務所需的總時間。 -
用
TaskAvailabilityLifetimeInSeconds
指定工作者仍可進行任務的總時間。這是工作者必須在任務失敗之前經手任務的時間。 -
用
TaskCount
指定每個資料集物件的工作者數量。例如,如果您為此參數指定 3,則每個資料物件將由 3 個工作者標記。 -
用
PublicWorkforceTaskPrice
設定按任務收費。這是工作者完成單一任務所獲得的金額。 -
建立人工檢閱工作流程後,您可以在參數
FlowDefinitionArn
中提供其 Amazon Resource Name (ARN),藉此設定人工迴圈。您可以使用內建任務類型的其中一個 API 操作或 Amazon A2I 執行時間 API 操作 (StartHumanLoop
),來設定人工迴圈。如需進一步了解,請參閱 建立和啟動人工迴圈。設定人工迴圈時,您必須使用
DataAttributes
中的FreeOfPersonallyIdentifiableInformation
內容分類器,註明您的輸入資料不含個人身分識別資訊 (PII)。如果您使用 Mechanical Turk,而並未註明您的輸入資料沒有 PII,則人工檢閱任務將失敗。使用
FreeOfAdultContent
旗標來宣告您的輸入資料不含成人內容。 SageMaker 如果包含成人內容,則可能會限制可以查看您的任務的 Mechanical Turk 工作人員。
您可以在下列筆記本中查看如何使用此 API 的範例,請參閱 GitHub:Amazon A2I Jupy
什麼情況下系統不支援 Mechanical Turk?
在下列情況下,系統將不支援此人力。在每個案例中,您都必須使用私有或廠商人力。
-
Ground Truth 影片影格標記任務和 3D 點雲標記任務不支援此人力。
-
如果您的輸入資料包含個人身分識別資訊 (PII),則無法使用此人力。
-
某些 AWS 特殊地區不提供 Mechanical Turk。若適用,請參閱您特殊區域的文件,以取得更多資訊。