本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
建立包含影像的訓練和測試資料集
您可以從具有單一資料集的專案開始,或具有不同訓練和測試資料集的專案開始。如果您從單一資料集開始,Amazon Rekognition 自訂標籤會在培訓期間分割您的資料集,以便為您的專案建立培訓資料集 (80%) 和測試資料集 (20%)。如果您希望 Amazon Rekognition 自訂標籤決定影像用於訓練和測試的位置,請從單一資料集開始。為了完全控制培訓、測試和效能調整,我們建議您使用個別的培訓和測試資料集來啟動專案。
從下列其中一個位置匯入影像,即可為專案建立訓練和測試資料集:
如果您使用不同的訓練和測試資料集啟動專案,即可針對每個資料集使用不同的來源位置。
依據您匯入影像的位置而定,您的影像可能沒有標記。例如,從本機電腦匯入的影像即沒有標記。從 Amazon SageMaker Ground Truth 清單文件導入的圖像被標記。您可以使用 Amazon Rekognition 自訂標籤主控台來新增、變更和分配標籤。如需詳細資訊,請參閱標記檔案。
如果上傳的影像有錯誤、影像遺失或影像缺少標籤,請閱讀 偵錯失敗的模型訓練。
如需資料集的詳細資訊,請參閱 管理資料集。
建立訓練和測試資料集 (SDK)
您可以使用建 AWS SDK立訓練和測試資料集。
此CreateDataset
作業可讓您在建立新資料集時選擇性地指定標籤,以便分類和管理資源。
訓練資料集
您可以透過下列 AWS SDK方式使用建立訓練資料集。
-
搭CreateDataset配您提供的 Amazon Sageemaker 格式資訊清單檔案搭配使用。如需詳細資訊,請參閱建立清單檔案。如需範例程式碼,請參閱 使用 SageMaker Ground Truth 清單文件創建數據集(SDK)。
-
使用
CreateDataset
複製現有的 Amazon Rekognition 自訂標籤資料集。如需範例程式碼,請參閱 使用現有資料集 (SDK) 建立資料集。 -
使用建立空白資料集,
CreateDataset
並在稍後使用新增資料集項目UpdateDatasetEntries。若要建立空白資料集,請參閱 將資料集新增至專案。若要新增影像至資料集,請參閱 新增更多影像 (SDK)。您需要先新增資料集項目,才能訓練模型。
測試資料集
您可以使 AWS SDK用下列方式建立測試資料集:
-
搭CreateDataset配您提供的 Amazon Sageemaker 格式資訊清單檔案搭配使用。如需詳細資訊,請參閱建立清單檔案。如需範例程式碼,請參閱 使用 SageMaker Ground Truth 清單文件創建數據集(SDK)。
-
使用
CreateDataset
複製現有的 Amazon Rekognition 自訂標籤資料集。如需範例程式碼,請參閱 使用現有資料集 (SDK) 建立資料集。 -
使用
CreateDataset
建立空白資料集,並在稍後使用UpdateDatasetEntries
新增資料集項目。若要建立空白資料集,請參閱 將資料集新增至專案。若要新增影像至資料集,請參閱 新增更多影像 (SDK)。您需要先新增資料集項目,才能訓練模型。 -
將訓練資料集分割為不同的訓練和測試資料集。首先使用
CreateDataset
建立空白測試資料集。接著,透過呼叫,將 20% 的訓練資料集項目移至測試資料集DistributeDatasetEntries。若要建立空白資料集,請參閱 將資料集新增至專案 (SDK)。若要分割訓練資料集,請參閱發佈訓練資料集 (SDK)。