本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
使用 Amazon SageMaker Ground Truth 加標記數據
Amazon SageMaker Ground Truth Plus 是一種統包式資料標籤服務,它使用專家人力快速交付高品質的註釋,並將成本降低高達 40%。使用 SageMaker Ground Truth Plus,資料科學家和業務經理 (例如資料作業經理和方案經理) 可以建立高品質的訓練資料集,而無需自行建置標籤應用程式和管理標籤工作人員。您可以透過上傳資料以及 Amazon S3 中的標籤要求,開始使用 Amazon G SageMaker round Truth 加版。
為什麼要使用 SageMaker Ground Truth 加?
若要訓練機器學習 (ML) 模型,資料科學家需要大型、高品質、標記化的資料集。隨著機器學習的採用率成長,標記需求也隨著增加。這迫使資料科學家花費數週的時間來建置資料標記工作流程和管理資料標記人力。不幸的是,這會減緩創新的速度並增加成本。為了確保資料科學家能夠花時間建置、訓練和部署 ML 模型,資料科學家通常會派任務給資料操作經理和計劃經理組成的其他內部團隊,以產生高品質的訓練資料集。不過,這些團隊通常不具備交付高品質訓練資料集所需技能的存取權,這會影響機器學習結果。因此,您需要尋找資料標記合作夥伴,這些合作夥伴在不會消耗團隊內部資源的情況下,可以協助團隊大規模建立高品質的訓練資料集。
當您上傳資料時, SageMaker Ground Truth Plus 會設定資料標籤工作流程,並代表您進行操作。從那裡,針對各種機器學習(ML)任務進行培訓的專家人員執行數據標籤。 SageMaker Ground Truth Plus 目前提供兩種類型的專家人力:Amazon 僱用的員工隊伍和精選的第三方供應商列表。 SageMaker Ground Truth Plus 為您提供了選擇標籤員工的靈活性。 AWS 專家會根據您的專案需求,選擇最佳的標籤人力。例如,如果您需要精通音頻文件標籤的人員,請在提供給 SageMaker Ground Truth Plus 的指南中指定,服務會自動選擇具有這些技能的貼標機。
重要
SageMaker Ground Truth 增強版不支援 PHI、PCI 或 FedRAMP 認證資料,您不應將此資料提供給 SageMaker Ground Truth 加強版。
SageMaker Ground Truth 加上如何工作?
工作流程有五個主要元件。
申請專案
建立專案團隊
存取專案入口網站以監控訓練資料集的進度,並檢閱已標記資料
建立批次
接收已標記的資料
我如何使用 SageMaker Ground Truth 加?
如果您是 SageMaker Ground Truth Plus 的首次使用者,請使用開Amazon SageMaker Ground Truth Plus 入門。始使用。若要使用 SageMaker 主控台存取 SageMaker Ground Truth Plus,您必須位於美國東部 (維吉尼亞北部) (us-east-1
)。