建立標記任務 (主控台) - Amazon SageMaker

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

建立標記任務 (主控台)

您可以使用 Amazon SageMaker 主控台為所有 Ground Truth 內建任務類型和自訂標籤工作流程建立標籤任務。對於內建任務類型,建議您在您的任務類型頁面旁邊使用此頁面。每個任務類型頁面都包含使用該任務類型建立標記任務的特定詳細資訊。

您必須提供下列資訊,才能在 SageMaker 主控台中建立標籤工作:

  • Amazon S3 中的輸入資訊清單檔案。您可以將輸入資料集放在 Amazon S3 中,並使用 Ground Truth 主控台自動產生資訊清單檔案 (不支援 3D 點雲標記任務)。

    或者,您可以手動建立輸入資訊清單檔案。如要了解如何使用,請參閱 輸入資料

  • 用來儲存輸出資料的 Amazon S3 儲存貯體。

  • 具有存取 Amazon S3 中資源並附加 SageMaker執行政策之權限的 IAM 角色。對於一般解決方案,您可以將受管政策附加到 IAM 角色 AmazonSageMakerFullAccess,並包含sagemaker在值區名稱中。

    如需更精細的政策,請參閱 分配使用 Ground Truth 的IAM權限

    3D 點雲任務類型還有其他安全考量事項。進一步了解

  • 一個工作團隊。您可以從由 Amazon Mechanical Turk 工作者、供應商或您自己的私有工作者組成的人力建立工作團隊。若要了解更多,請參閱 建立和管理人力

    您不能使用 Mechanical Turk 人力來處理 3D 點雲標記任務。

  • 如果您使用自訂標記工作流程,則必須在 Amazon S3 中儲存工作者任務範本,並提供該範本的 Amazon S3 URI。如需詳細資訊,請參閱 步驟 2:建立您的自訂工作者任務範本

  • (選擇性) 如果您想要使用自己的 SageMaker 加密 AWS KMS 金鑰而非預設 Amazon S3 服務金鑰來 AWS KMS 加密標籤任務的輸出,請使用金鑰 ARN。

  • (選用) 您在標記任務中所使用資料集的現有標籤。如果您要讓工作者調整、或核准和拒絕標籤,請使用此選項。

  • 如果要建立調整或驗證標記任務,Amazon S3 中須有輸出資訊清單檔案,其中包含您要調整或驗證的標籤。此選項僅支援週框方塊和語義分隔影像標記任務,以及 3D 點雲和影片影格標記任務。建議您使用 驗證和調整標籤 上的指示建立驗證或調整標記任務。

重要

Amazon S3 中的工作團隊、輸入資訊清單檔案、輸出儲存貯體和其他資源必須位於建立標籤任務時所使用的相同 AWS 區域。

使用 SageMaker 主控台建立標籤工作時,您可以將工作者指示和標籤新增至 Ground Truth 提供的背景工作者 UI。在主控台建立標記任務時,您可以預覽工作者 UI 並與之互動。您也可以在內建任務類型頁面上查看工作者 UI 的預覽。

建立標記任務 (主控台)
  1. 請在以下位置登入 SageMaker 主控台 https://console.aws.amazon.com/sagemaker/

  2. 在左側導覽窗格中,選擇 Labeling jobs (標記任務)

  3. Labeling jobs (標記任務) 頁面上,選擇 Create labeling job (建立標記任務)

  4. Job name (任務名稱) 中,輸入標記任務的名稱。

  5. (選擇性) 如果您要使用索引鍵來識別標籤,請選取 I want to specify a label attribute name different from the labeling job name (我想要指定與標記任務名稱不同的標籤屬性名稱)。如果您未選取此選項,則會使用您在上一個步驟中指定的標記任務名稱,以識別輸出資訊清單檔案中的標籤。

  6. 選擇資料設定,在輸入資料集和 Ground Truth 之間建立連線。

    • 對於自動化資料設定

    • 對於手動資料設定

      • 輸入資料集的位置中,提供輸入資訊清單檔案在 Amazon S3 中的位置。例如,如果輸入資訊清單檔案 manifest.json 位於 example-bucket 中,請輸入 s3://example-bucket/manifest.json

      • 對於輸出資料集位置,提供您希望 Ground Truth 將標記任務的輸出資料儲存在 Amazon S3 中的位置。

  7. 對於 IAM 角色,請選擇現有的 IAM 角色,或建立具有在 Amazon S3 中存取資源、寫入上述指定的輸出 Amazon S3 儲存貯體並附加 SageMaker 執行政策的權限的 IAM 角色。

  8. (選擇性) 對於其他設定,您可以指定要 Worker 標記多少資料集,以及是否 SageMaker 要使用加密金鑰為標籤工作 AWS KMS 加密輸出資料。若要加密輸出資料,您必須將必要的 AWS KMS 許可附加至您在上一步中提供的 IAM 角色。如需詳細資訊,請參閱分配使用 Ground Truth 的IAM權限

  9. 任務類型區段的任務類別下,使用下拉式清單來選取任務類別。

  10. Task selection (任務選擇) 中,選擇任務類型。

  11. (選擇性) 為標記任務提供標籤,以便後來在主控台更容易找到。

  12. 選擇下一步

  13. 工作者 區段中,選擇您要使用的員工類型。如需員工選項的更多詳細資訊,請參閱 建立和管理人力

  14. (選用) 選取人力後,請指定 Task timeout (任務逾時)。這是工作者可處理任務的最長時間。

    對於 3D 點雲註釋任務,預設任務逾時為 3 天。文字和影像分類及標籤驗證標記任務的預設逾時為 5 分鐘。其他所有標記任務的預設逾時為 60 分鐘。

  15. (選用) 對於週框方塊、語義分隔和點雲任務類型,如果您要顯示輸入資料集的標籤,讓工作者驗證或調整,則可以選取顯示現有標籤

    對於週框方塊和語義分隔標記任務,這會建立調整標記任務。

    對於 3D 點雲和影片影格標記任務:

    • 選取調整以建立調整標記任務。選取此選項時,您可以新增標籤,但無法移除或編輯先前任務中的現有標籤。或者,您可以選擇要工作者編輯的標籤類別屬性和影格屬性。若要使屬性可編輯,請選取該屬性的允許工作者編輯此屬性核取方塊。

      您可以選擇性地新增標籤類別和影格屬性。

    • 選取驗證以建立調整標記任務。選取此選項時,您無法新增、修改或移除先前任務中的現有標籤。或者,您可以選擇要工作者編輯的標籤類別屬性和影格屬性。若要使屬性可編輯,請選取該屬性的允許工作者編輯此屬性核取方塊。

      我們建議您可以在要工作者驗證的標籤中新增標籤類別屬性,或新增一或多個影格屬性,讓工作者提供有關整個影格的資訊。

    如需詳細資訊,請參閱 驗證和調整標籤

  16. 設定您的工作者 UI:

    • 如果您使用內建任務類型,請指定工作者指示和標籤。

      • 對於影像分類和文字分類 (單一標籤和多標籤),您必須至少指定兩個標籤類別。對於所有其他內建任務類型,您必須至少指定一個標籤類別。

      • (選用) 如果要建立 3D 點雲或影片影格標記任務,可指定標籤類別屬性 (3D 點雲語義分隔不支援) 和影格屬性。可以將標籤類別屬性指派給一個或多個標籤。影格屬性會出現在每個點雲或影片影格工作者標籤上。如需進一步了解 3D 點雲和影片影格,請分別參閱 工作者使用者界面 (UI)工作者使用者介面 (UI)

      • (選用) 新增其他指示以協助您的工作者完成任務。

    • 如果要建立自訂標籤工作流程,您必須:

      • 在程式碼方塊中輸入自訂範本。可使用 HTML、Liquid 範本語言和我們預先建立的 Web 元件組合來建立自訂範本。您也可以選擇從下拉式清單中,選擇開始使用的基本範本。

      • 指定註釋前和註解後 Lambda 函數。若要了解如何建立這些函數,請參閱 步驟 3:使用 AWS Lambda

  17. (選用) 您可以選取查看預覽,以預覽工作者指示、標籤,並與工作者 UI 互動。產生預覽之前,請確保已停用瀏覽器的彈出視窗封鎖程式。

  18. 選擇建立

成功建立標記任務後,您會重新導向至 Labeling jobs (標記任務) 頁面。您剛建立的標記任務狀態為進行中。此狀態會隨著工作者完成任務而逐漸更新。成功完成所有任務後,狀態會變成 Completed (已完成)

如果在建立標記任務時發生問題,則狀態會變更為失敗

若要檢視任務的詳細資訊,請選擇標記任務名稱。

後續步驟

標記任務狀態變更為已完成後,您可以在建立該標記任務時所指定的 Amazon S3 儲存貯體中,檢視輸出資料。如需輸出資料格式的詳細資訊,請參閱輸出資料