自動化資料設定 - Amazon SageMaker

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

自動化資料設定

您可以使用自動化資料設定,利用儲存在 Amazon S3 的映像、影片、影片影格、文字 (.txt) 檔案以及逗號分隔值 (.csv) 檔案,在 Ground Truth 主控台為標籤工作建立資訊清單檔案。當您使用自動化資料設定時,您可以指定儲存輸入資料的 Amazon S3 位置與輸入資料類型,然後 Ground Truth 會在您指定的位置尋找符合該類型的檔案。

注意

Ground Truth 不會使用 AWS KMS 金鑰存取您的輸入資料,或將輸入資訊清單檔案寫入您指定的 Amazon S3 位置。建立標籤工作的使用者或角色針對 Amazon S3 的輸入資料物件具存取許可。

在使用下列程序之前,請確保輸入映像或檔案的格式正確:

  • 映像檔案 – 映像檔案必須符合 輸入檔案大小配額 資料表所列出的大小與解析度限制。

  • 文字檔案 – 文字資料可以儲存在一或多個 .txt 檔案中。您要標籤的每個項目必須以標準分行符號分隔。

  • CSV檔案 — 文字資料可以儲存在一個或多個 .csv 檔案中。您要標籤的每個項目必須位於單獨一列。

  • 影片 – 影片檔案可以是以下任何格式:.mp4、.ogg、.webm。如果您要從影片檔案擷取影片影格以進行物件偵測或物件追蹤,請參閱提供影片檔案

  • 影片影格 - 影片影格是從影片擷取的映像。從單一影片擷取的所有影像都稱為一序列影片影格。在 Amazon S3,每個影片影格序列都必須具有唯一字首鍵。請參閱提供影片影格。如需此資料類型,請參閱自動化影片影格輸入資料設定

重要

如需資訊了解影片影格物件偵測及影片影格物件追蹤標籤工作,請參閱自動化影片影格輸入資料設定以了解如何使用自動化資料設定。

使用這些指示來自動設定您的輸入資料集連線 Ground Truth。

自動連線 Amazon S3 的資料與 Ground Truth
  1. 導覽至 Amazon SageMaker 主控台中的「建立標籤任務」頁面,位於https://console.aws.amazon.com/sagemaker/

    此連結可讓您前往北維吉尼亞州 (us-east-1) 區域。 AWS 如果您的輸入資料位於其他區域的 Amazon S3 儲存貯體中,請切換至該區域。若要變更您的 AWS 地區,請在導覽列上選擇目前顯示的區域名稱。

  2. 選取建立標籤工作

  3. 輸入工作名稱

  4. 輸入資料設定區段內,選取自動化資料設定

  5. URI為輸入資料集輸入 S3 位置輸入 Amazon S3。

  6. 指定輸出資料集在 S3 的位置。這是您輸出資料的儲存位置。

  7. 使用下拉式清單選擇資料類型

  8. 使用「角色」(IAMRole) 下的下拉式功能表選取執行角色。如果選取 Create a new role (建立新角色),請指定要授與此角色存取許可的 Amazon S3 儲存貯體。此角色必須針對您在步驟 5 與 6 指定的 S3 儲存貯體具存取許可。

  9. 選取 Complete data setup (完成資料設定)。

這會在 Amazon S3 位置為您在步驟 5 指定的輸入資料集建立輸入資訊清單。如果您要使用 SageMaker API或、或建立標籤任務 AWS CLI,請將 Amazon S3 用URI於此輸入資訊清單檔案作為參數的輸入ManifestS3Uri。 AWS SDK

以下GIF說明如何使用影像資料的自動化資料設定。此範例將在 Amazon S3 儲存貯體 example-groundtruth-images 建立檔案 dataset-YYMMDDTHHMMSS.manifest,其中 YYMMDDTHHmmSS 指示建立輸入資訊清單檔案的年 (YY)、月 (MM)、日 (DD),以及時間,以小時 (HH)、分鐘 (mm)、秒 (ss) 為單位。

GIF說明如何使用影像資料的自動化資料設定。