翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
プロファイルデータにアクセスする
SMDebug TrainingJob
クラスは、システムおよびフレームワークのメトリクスが保存されている S3 バケットからデータを読み取ります。
TrainingJob
オブジェクトを設定し、トレーニングジョブのプロファイリングイベントファイルを取得するには
from smdebug.profiler.analysis.notebook_utils.training_job import TrainingJob tj = TrainingJob(training_job_name, region)
ヒント
training_job_name
と region
パラメータを指定して、トレーニングジョブにログを記録する必要があります。トレーニングジョブの情報を指定するには、2 つの方法があります。
-
推定器がまだトレーニングジョブにアタッチされている間は、 SageMaker Python SDK を使用します。
import sagemaker training_job_name=estimator.latest_training_job.job_name region=sagemaker.Session().boto_region_name
-
文字列を直接渡す。
training_job_name="
your-training-job-name-YYYY-MM-DD-HH-MM-SS-SSS
" region="us-west-2
"
注記
デフォルトでは、 SageMaker デバッガーはシステムメトリクスを収集して、ハードウェアリソースの使用率とシステムのボトルネックをモニタリングします。次の関数を実行すると、フレームワークメトリクスが使用できないというエラーメッセージが表示されることがあります。フレームワークプロファイリングデータを取得し、フレームワークオペレーションに関するインサイトを得るには、フレームワークプロファイリングを有効にする必要があります。
-
SageMaker Python SDK を使用してトレーニングジョブリクエストを操作する場合は、
framework_profile_params
を推定器のprofiler_config
引数に渡します。詳細については、 SageMaker 「デバッガーフレームワークプロファイリングの設定」を参照してください。 -
Studio Classic を使用する場合は、デバッガーインサイトダッシュボードのプロファイリングトグルボタンを使用してプロファイリングを有効にします。詳細については、SageMaker 「デバッガーインサイトダッシュボードコントローラー」を参照してください。
トレーニングジョブの説明とメトリクスデータが保存されている S3 バケット URI を取得するには
tj.describe_training_job() tj.get_config_and_profiler_s3_output_path()
システムおよびフレームワークのメトリクスが S3 URI から利用可能かどうかをチェックするには
tj.wait_for_sys_profiling_data_to_be_available() tj.wait_for_framework_profiling_data_to_be_available()
メトリクスデータが利用可能になった後にシステムおよびフレームワークのリーダーオブジェクトを作成するには
system_metrics_reader = tj.get_systems_metrics_reader() framework_metrics_reader = tj.get_framework_metrics_reader()
最新のトレーニングイベントファイルを更新して取得するには
リーダーオブジェクトには、最新のトレーニングイベントファイルを取得するための拡張メソッド refresh_event_file_list()
があります。
system_metrics_reader.refresh_event_file_list() framework_metrics_reader.refresh_event_file_list()