範例:檢視訓練和驗證曲線 - Amazon SageMaker AI

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

範例:檢視訓練和驗證曲線

一般而言,您會將訓練模型的資料分割成訓練和驗證資料集。您可以使用訓練組來訓練模型參數,以用來依據訓練資料集進行預測。然後,您可以計算驗證組的預測結果,以測試模型預測的準確度。若要分析訓練任務的效能,通常是繪製訓練曲線和驗證曲線。

檢視訓練組和驗證組隨著時間的準確度圖表,有助您改進模型的效能。好比說,如果訓練準確度隨著時間持續增加,但某個時間點的驗證準確度開始降低,您可能過度擬合模型。若要解決此問題,您可以調整模型,例如提高正規化

在此範例中,您可以在 SageMaker AI 筆記本執行個體的範例筆記本區段中使用 Image-classification-full-training 範例。如果您沒有 SageMaker 筆記本執行個體,請遵循建立教學課程的 Amazon SageMaker 筆記本執行個體的指示建立一個。您也可以遵循 GitHub 上範例筆記本中的端對端多類別影像分類範例。您也需要 Amazon S3 儲存貯體來存放訓練資料及用於模型輸出。

檢視訓練和驗證錯誤曲線
  1. 在 https://https://console.aws.amazon.com/sagemaker 開啟 SageMaker AI 主控台。

  2. 選擇筆記本,然後選擇筆記本執行個體

  3. 選擇您想要使用的筆記本執行個體,然後選擇開啟

  4. 在筆記本執行個體的儀表板上,選擇 SageMaker AI 範例

  5. 展開 Amazon 演算法簡介區段,然後選擇 Image-classification-fulltraining.ipynb 旁邊的使用

  6. 選擇建立複本。SageMaker AI 會在您的筆記本執行個體中建立 Image-classification-fulltraining.ipynb 筆記本的可編輯副本。

  7. 執行筆記本中的所有儲存格,直到推論區段。您不需要部署端點或取得此範例的推論。

  8. 啟動訓練任務後,在 https://console.aws.amazon.com/cloudwatch 開啟 CloudWatch 主控台。

  9. 選擇指標,然後選擇 /aws/sagemaker/TrainingJobs

  10. 選擇 TrainingJobName

  11. 所有指標標籤上,選擇您在筆記本中所建立之訓練任務的 train:accuracyvalidation:accuracy 指標。

  12. 在圖形上,選擇要放大指標值的區域。您應該會看到類似下列範例的內容。

    放大圖形中的區域。