目標步驟或目標時間範圍的預設系統監控和自訂架構分析 - Amazon SageMaker AI

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

目標步驟或目標時間範圍的預設系統監控和自訂架構分析

如果您想要指定目標步驟或目標時間間隔來分析訓練工作,則需要指定 FrameworkProfile 類別的參數。下列程式碼範例示範如何指定分析以及系統監控的目標範圍。

  • 針對目標步驟範圍

    使用下列範例組態,偵錯工具會每 500 毫秒監控整個訓練工作 (預設監控),並分析目標步驟範圍,從步驟 5 到步驟 15 (10 個步驟)。

    from sagemaker.debugger import ProfilerConfig, FrameworkProfile profiler_config=ProfilerConfig( framework_profile_params=FrameworkProfile(start_step=5, num_steps=10) )

    使用下列範例組態,Debugger 會每 1000 毫秒監控整個訓練工作,並分析目標步驟範圍,從步驟 5 到步驟 15 (10 個步驟)。

    from sagemaker.debugger import ProfilerConfig, FrameworkProfile profiler_config=ProfilerConfig( system_monitor_interval_millis=1000, framework_profile_params=FrameworkProfile(start_step=5, num_steps=10) )
  • 針對目標時間範圍

    使用下列範例組態,Debugger 會每 500 毫秒監控整個訓練工作 (預設監控),並分析目標時間範圍 (從目前的 Unix 時間起 600 秒)。

    import time from sagemaker.debugger import ProfilerConfig, FrameworkProfile profiler_config=ProfilerConfig( framework_profile_params=FrameworkProfile(start_unix_time=int(time.time()), duration=600) )

    使用下列範例組態,Debugger 會每 1000 毫秒監控整個訓練工作,並分析目標時間範圍 (從目前的 Unix 時間起 600 秒)。

    import time from sagemaker.debugger import ProfilerConfig, FrameworkProfile profiler_config=ProfilerConfig( system_monitor_interval_millis=1000, framework_profile_params=FrameworkProfile(start_unix_time=int(time.time()), duration=600) )

    架構分析會針對目標步驟或時間範圍內的所有分析選項進行。

    若要尋找可用設定檔選項的更多相關資訊,請參閱 SageMaker Debugger API — 框架設定檔 (位於 Amazon SageMaker Python SDK 中)。

    下一節為您示範如何編寫可用的分析選項指令碼。