訓練工作正在執行時更新偵錯工具系統監控和架構分析組態 - Amazon SageMaker

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

訓練工作正在執行時更新偵錯工具系統監控和架構分析組態

如果您想要為目前正在執行的訓練任務啟用或更新偵錯工具監控組態,請使用下列 SageMaker 估算器延伸方法:

  • 若要針對執行中的訓練工作啟動偵錯工具系統監控,並接收偵錯工具分析報告,請使用下列方式:

    estimator.enable_default_profiling()

    當您使用 enable_default_profiling 方法時,偵錯工具會初始化預設的系統監控和 ProfileReport 內建規則,這會在訓練工作結束時產生全方位的分析報告。只有在目前的訓練工作在沒有偵錯工具監控和效能分析的情況下執行時,才能呼叫此方法。

    如需詳細資訊,請參閱 Amazon SageMaker Python SDK中的 estimator.enable_default_profiling

  • 若要更新系統監控組態,請使用下列步驟:

    estimator.update_profiler( system_monitor_interval_millis=500 )

    如需詳細資訊,請參閱 Amazon SageMaker Python SDK中的 estimator.update_profiler