本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
Amazon SageMaker Ground Truth Plus 是一項統包式資料標籤服務,可使用專業人力資源快速交付高品質註釋,而且可以降低成本高達 40%。使用 SageMaker Ground Truth Plus,資料科學家和業務經理 (例如資料操作經理和計劃經理) 可以建立高品質的訓練資料集,無需自行建置標籤應用程式和管理標籤人力資源。您可以在 Amazon S3 中上傳資料以及標籤需求,開始使用 Amazon SageMaker Ground Truth Plus。
為什麼要使用 SageMaker Ground Truth Plus?
若要訓練機器學習 (ML) 模型,資料科學家需要大型、高品質、標籤化的資料集。隨著機器學習 (ML) 的採用率成長,標籤需求也隨著增加。這迫使資料科學家花費數週的時間來建置資料標籤工作流程和管理資料標籤人力資源。不幸的是,這會減緩創新的速度並增加成本。為了確保資料科學家能夠花時間建置、訓練和部署機器學習 (ML) 模型,資料科學家通常會派任務給資料操作經理和計劃經理組成的其他內部團隊,以產生高品質的訓練資料集。不過,這些團隊通常不具備交付高品質訓練資料集所需技能的存取權,這會影響機器學習 (ML) 結果。因此,您需要尋找資料標籤合作夥伴,這些合作夥伴在不會消耗團隊內部資源的情況下,可以協助團隊大規模建立高品質的訓練資料集。
當您上傳資料時,SageMaker Ground Truth Plus 會設定資料標籤工作流程,並代表您進行操作。在那裡,各種機器學習 (ML) 任務上所訓練的專業人力資源會執行資料標籤。SageMaker Ground Truth Plus 目前提供兩種類型的專業人力資源:Amazon 僱用的人力資源和第三方廠商策畫清單。SageMaker Ground Truth Plus 讓您可彈性選擇標籤工作人力資源。 AWS 專家會根據您的專案需求,選取最佳標籤人力資源。例如,如果您需要精通標籤音訊檔案的人員,請在提供給 SageMaker Ground Truth Plus 的指南中進行指定,服務就會自動選取具有這些技能的標籤器。
重要
SageMaker Ground Truth Plus 不支援 PHI、PCI 或 FedRAMP 認證資料,您不應將此資料提供給 SageMaker Ground Truth Plus。
SageMaker Ground Truth Plus 的運作方式
工作流程有五個主要元件。
申請專案
建立專案團隊
存取專案入口網站以監控訓練資料集的進度,並檢閱已標籤資料
建立批次
接收已標籤的資料
如何使用 SageMaker Ground Truth Plus?
如果您第一次 SageMaker Ground Truth Plus,請使用 開始使用 Amazon SageMaker Ground Truth Plus。 來開始使用。若要使用 SageMaker AI 主控台存取 SageMaker Ground Truth Plus,您必須位於美國東部 (維吉尼亞北部) (us-east-1
)。