プロファイルデータにアクセスする - Amazon SageMaker

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

プロファイルデータにアクセスする

SMDebug TrainingJob クラスは、システムおよびフレームワークのメトリクスが保存されている S3 バケットからデータを読み取ります。

TrainingJob オブジェクトを設定し、トレーニングジョブのプロファイリングイベントファイルを取得するには

from smdebug.profiler.analysis.notebook_utils.training_job import TrainingJob tj = TrainingJob(training_job_name, region)
ヒント

training_job_nameregion パラメータを指定して、トレーニングジョブにログを記録する必要があります。トレーニングジョブの情報を指定するには、2 つの方法があります。

  • 推定器がまだトレーニングジョブにアタッチされている間は、 SageMaker Python SDK を使用します。

    import sagemaker training_job_name=estimator.latest_training_job.job_name region=sagemaker.Session().boto_region_name
  • 文字列を直接渡す。

    training_job_name="your-training-job-name-YYYY-MM-DD-HH-MM-SS-SSS" region="us-west-2"
注記

デフォルトでは、 SageMaker デバッガーはシステムメトリクスを収集して、ハードウェアリソースの使用率とシステムのボトルネックをモニタリングします。次の関数を実行すると、フレームワークメトリクスが使用できないというエラーメッセージが表示されることがあります。フレームワークプロファイリングデータを取得し、フレームワークオペレーションに関するインサイトを得るには、フレームワークプロファイリングを有効にする必要があります。

トレーニングジョブの説明とメトリクスデータが保存されている S3 バケット URI を取得するには

tj.describe_training_job() tj.get_config_and_profiler_s3_output_path()

システムおよびフレームワークのメトリクスが S3 URI から利用可能かどうかをチェックするには

tj.wait_for_sys_profiling_data_to_be_available() tj.wait_for_framework_profiling_data_to_be_available()

メトリクスデータが利用可能になった後にシステムおよびフレームワークのリーダーオブジェクトを作成するには

system_metrics_reader = tj.get_systems_metrics_reader() framework_metrics_reader = tj.get_framework_metrics_reader()

最新のトレーニングイベントファイルを更新して取得するには

リーダーオブジェクトには、最新のトレーニングイベントファイルを取得するための拡張メソッド refresh_event_file_list() があります。

system_metrics_reader.refresh_event_file_list() framework_metrics_reader.refresh_event_file_list()