AWS リージョンカスタムコンテナと共にデバッガーを使用するデバッガーのオープンソース GitHub リポジトリ

サポート対象のフレームワークとアルゴリズム

次の表は、デバッガーがサポートする SageMaker AI 機械学習フレームワークとアルゴリズムを示しています。

SageMaker AI-supported frameworks and algorithms	Debugging output tensors
TensorFlow	AWS TensorFlow 深層学習コンテナ 1.15.4 以降
PyTorch	AWS PyTorch 深層学習コンテナ 1.5.0 以降
MXNet	AWS MXNet 深層学習コンテナ 1.6.0 以降
XGBoost	1.0-1、1.2-1、1.3-1
SageMaker AI 汎用推定器	カスタムトレーニングコンテナ (手動フック登録により TensorFlow、PyTorch、MXNet、XGBoost で使用可能)

出力テンソルのデバッグ - トレーニングジョブの重み、勾配、バイアス、スカラー値などのモデルパラメータを追跡およびデバッグします。利用可能な深層学習フレームワークは、Apache MXNet、TensorFlow、PyTorch、XGBoost です。

重要
Keras を使用した TensorFlow フレームワークについては、SageMaker デバッガーは、TensorFlow 2.6 以降の tf.keras モジュールを使って構築されたモデルのデバッグに対するゼロコード変更サポートを廃止します。これは、TensorFlow 2.6.0 リリースノートで発表された重大な変更によるものです。トレーニングスクリプトを更新する手順については、「TensorFlow トレーニングスクリプトを適応させる」を参照してください。

重要
PyTorch v1.12.0 以降から、SageMaker Debugger はデバッグモデルのゼロコード変更サポートを廃止します。
これは、SageMaker Debugger が torch.jit の機能を妨害する原因となる重大な変更によるものです。トレーニングスクリプトを更新する手順については、「PyTorch トレーニングスクリプトを適合させる」を参照してください。

トレーニングやデバッグを行いたいフレームワークまたはアルゴリズムが表に載っていない場合は、AWS ディスカッションフォーラムにアクセスして、SageMaker デバッガーに関するフィードバックを残してください。

AWS リージョン

Amazon SageMaker Debugger は、Amazon SageMaker AI が稼働しているすべてのリージョンで使用できます。ただし、次のリージョンは除きます。

アジアパシフィック (ジャカルタ): ap-southeast-3

Amazon SageMaker AI がで稼働しているかどうかを確認するには AWS リージョン、AWS 「リージョン別サービス」を参照してください。

カスタムトレーニングコンテナと共にデバッガーを使用する

トレーニングコンテナを SageMaker AI に取り込み、デバッガーを使用してトレーニングジョブに関するインサイトを取得します。モニタリングとデバッグの機能を使って Amazon EC2 インスタンスでモデルを最適化することで、作業効率を最大化します。

sagemaker-debugger クライアントライブラリを使ってトレーニングコンテナを構築し、それを Amazon Elastic Container Registry (Amazon ECR) にプッシュし、モニタリングとデバッグを行う方法の詳細については、「カスタムトレーニングで Debugger を使用する」を参照してください。

デバッガーのオープンソース GitHub リポジトリ

デバッガー APIs は SageMaker Python SDK を通じて提供され、SageMaker AI CreateTrainingJob および DescribeTrainingJob API オペレーションのデバッガーフックとルール設定を構築するように設計されています。sagemaker-debugger クライアントライブラリは、フックを登録しトライアル機能を使ってトレーニングデータにアクセスするためのツールを、すべて柔軟で強力な API オペレーションを通じて提供します。Python 3.6 以降で、機械学習フレームワーク TensorFlow、PyTorch、MXNet、XGBoost をサポートしています。

デバッガーと sagemaker-debugger API オペレーションに関する直接のリソースについては、次のリンクを参照してください。

SDK for Java を使って SageMaker トレーニングジョブを実行し、デバッガー API を設定する場合は、次のリファレンスを参照してください。

ブラウザで JavaScript が無効になっているか、使用できません。

AWS ドキュメントを使用するには、JavaScript を有効にする必要があります。手順については、使用するブラウザのヘルプページを参照してください。

ドキュメントの表記規則

SageMaker Debugger

Debugger アーキテクチャ

サポート対象のフレームワークとアルゴリズム

重要

重要

AWS リージョン

カスタムトレーニングコンテナと共にデバッガーを使用する

デバッガーのオープンソース GitHub リポジトリ