設定 SageMaker Debugger 以儲存張量 - Amazon SageMaker AI

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

設定 SageMaker Debugger 以儲存張量

張量是從每個訓練迭代的向後和向前傳遞更新參數的資料集合。SageMaker Debugger 收集輸出張量,分析訓練任務的狀態。SageMaker Debugger 的 CollectionConfigDebuggerHookConfig API 作業,提供將張量分組為集合並將其儲存到目標 S3 儲存貯體的方法。下列主題說明如何使用 CollectionConfigDebuggerHookConfig API 操作,後面接著如何使用 Debugger hook 來儲存、存取和視覺化輸出張量的範例。

建構 SageMaker AI 估算器時,請指定 debugger_hook_config 參數來啟用 SageMaker Debugger。下列主題包括如何使用 CollectionConfigDebuggerHookConfig API debugger_hook_config 操作來設定 ,以從訓練任務中提取張量並儲存張量的範例。

注意

正確設定並啟動後,除非另有指定,否則 SageMaker Debugger 會將輸出張量儲存在預設 S3 儲存貯體。預設 S3 儲存貯體 URI 的格式為 s3://amzn-s3-demo-bucket-sagemaker-<region>-<12digit_account_id>/<training-job-name>/debug-output/