範例:檢視訓練和驗證曲線 - Amazon SageMaker AI

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

範例:檢視訓練和驗證曲線

一般而言,您會將訓練模型的資料分割成訓練和驗證資料集。您可以使用訓練組來訓練模型參數,以用來依據訓練資料集進行預測。然後,您可以計算驗證組的預測結果,以測試模型預測的準確度。若要分析訓練任務的效能,通常是繪製訓練曲線和驗證曲線。

檢視訓練組和驗證組隨著時間的準確度圖表,有助您改進模型的效能。好比說,如果訓練準確度隨著時間持續增加,但某個時間點的驗證準確度開始降低,您可能過度擬合模型。若要解決此問題,您可以調整模型,例如提高正規化

在此範例中,您可以使用 SageMaker AI 筆記本執行個體範例筆記本區段中的 Image-classification-full-training 範例。如果您沒有 SageMaker 筆記本執行個體,請依照 的指示建立一個建立教學課程的 Amazon SageMaker Notebook 執行個體。如果您願意,可以跟隨範例筆記本中的End-to-End 多類別影像分類範例 GitHub。您也需要 Amazon S3 儲存貯體來存放訓練資料及用於模型輸出。

檢視訓練和驗證錯誤曲線
  1. https://console.aws.amazon.com/sagemaker 開啟 SageMaker AI 主控台。

  2. 選擇筆記本,然後選擇筆記本執行個體

  3. 選擇您想要使用的筆記本執行個體,然後選擇開啟

  4. 在筆記本執行個體的儀表板上,選擇 SageMaker AI 範例

  5. 展開 Amazon 演算法簡介區段,然後選擇 I.ipynb 旁的mage-classification-fulltraining使用

  6. 選擇建立 copy. SageMaker AI 會在您的筆記本執行個體中建立 Image-classification-fulltraining.ipynb 筆記本的可編輯複本。

  7. 執行筆記本中的所有儲存格,直到推論區段。您不需要部署端點或取得此範例的推論。

  8. 訓練任務開始後,在 https://console.aws.amazon.com/cloudwatch 開啟 CloudWatch 主控台。

  9. 選擇指標,然後選擇 /aws/sagemaker/TrainingJobs

  10. 選擇 TrainingJobName

  11. 所有指標標籤上,選擇您在筆記本中所建立之訓練任務的 train:accuracyvalidation:accuracy 指標。

  12. 在圖形上,選擇要放大指標值的區域。您應該會看到類似下列範例的內容。

    放大圖形中的區域。