本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
為系統資源使用率的基本分析進行設定
若要調整收集使用率指標的時間間隔,請使用 ProfilerConfig
API 操作來建立參數物件,同時根據您的偏好設定建構 SageMaker AI 架構或一般估算器。
注意
根據預設,對於所有 SageMaker 訓練任務,Debugger 會每 500 毫秒從 Amazon EC2 執行個體收集資源使用率指標以進行系統監控,而不需要 SageMaker AI 估算器中指定的任何 Debugger 特定參數。
偵錯工具會將系統指標儲存在預設的 S3 儲存貯體中。預設 S3 儲存貯體 URI 的格式為 s3://sagemaker-<region>-<12digit_account_id>/<training-job-name>/profiler-output/
。
下列程式碼範例示範如何以 1000 毫秒的系統監控時間間隔來設定 profiler_config
參數。
from sagemaker.debugger import ProfilerConfig profiler_config=ProfilerConfig( system_monitor_interval_millis=
1000
)
-
system_monitor_interval_millis
(int) — 指定監控間隔 (以毫秒為單位) 記錄系統指標。可用的毫秒值為 100、200、500、1000 (1 秒)、5000 (5 秒) 和 60000 (1 分鐘)。預設值為 500 毫秒。
若要查看系統監控的進度,請參閱開啟 Amazon SageMaker Debugger 深入分析儀表板。