翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
サポート対象のフレームワークとアルゴリズム
次の表は、デバッガーがサポートする SageMaker AI 機械学習フレームワークとアルゴリズムを示しています。
SageMaker AI-supported frameworks and algorithms | Debugging output tensors |
---|---|
AWS TensorFlow 深層学習コンテナ |
|
AWS PyTorch 深層学習コンテナ |
|
AWS MXNet 深層学習コンテナ |
|
1.0-1、1.2-1、1.3-1 |
|
カスタムトレーニングコンテナ (手動フック登録により TensorFlow、PyTorch、MXNet、XGBoost で使用可能) |
-
出力テンソルのデバッグ - トレーニングジョブの重み、勾配、バイアス、スカラー値などのモデルパラメータを追跡およびデバッグします。利用可能な深層学習フレームワークは、Apache MXNet、TensorFlow、PyTorch、XGBoost です。
重要
Keras を使用した TensorFlow フレームワークについては、SageMaker デバッガーは、TensorFlow 2.6 以降の
tf.keras
モジュールを使って構築されたモデルのデバッグに対するゼロコード変更サポートを廃止します。これは、TensorFlow 2.6.0 リリースノートで発表された重大な変更によるものです。トレーニングスクリプトを更新する手順については、「TensorFlow トレーニングスクリプトを適応させる」を参照してください。 重要
PyTorch v1.12.0 以降から、SageMaker Debugger はデバッグモデルのゼロコード変更サポートを廃止します。
これは、SageMaker Debugger が
torch.jit
の機能を妨害する原因となる重大な変更によるものです。トレーニングスクリプトを更新する手順については、「PyTorch トレーニングスクリプトを適合させる」を参照してください。
トレーニングやデバッグを行いたいフレームワークまたはアルゴリズムが表に載っていない場合は、AWS ディスカッションフォーラム
AWS リージョン
Amazon SageMaker Debugger は、Amazon SageMaker AI が稼働しているすべてのリージョンで使用できます。ただし、次のリージョンは除きます。
アジアパシフィック (ジャカルタ):
ap-southeast-3
Amazon SageMaker AI が で稼働しているかどうかを確認するには AWS リージョン、AWS 「リージョン別サービス
カスタムトレーニングコンテナと共にデバッガーを使用する
トレーニングコンテナを SageMaker AI に取り込み、デバッガーを使用してトレーニングジョブに関するインサイトを取得します。モニタリングとデバッグの機能を使って Amazon EC2 インスタンスでモデルを最適化することで、作業効率を最大化します。
sagemaker-debugger
クライアントライブラリを使ってトレーニングコンテナを構築し、それを Amazon Elastic Container Registry (Amazon ECR) にプッシュし、モニタリングとデバッグを行う方法の詳細については、「カスタムトレーニングで Debugger を使用する」を参照してください。
デバッガーのオープンソース GitHub リポジトリ
デバッガー APIs は SageMaker Python SDK を通じて提供され、SageMaker AI CreateTrainingJob および DescribeTrainingJob API オペレーションのデバッガーフックとルール設定を構築するように設計されています。sagemaker-debugger
クライアントライブラリは、フックを登録しトライアル機能を使ってトレーニングデータにアクセスするためのツールを、すべて柔軟で強力な API オペレーションを通じて提供します。Python 3.6 以降で、機械学習フレームワーク TensorFlow、PyTorch、MXNet、XGBoost をサポートしています。
デバッガーと sagemaker-debugger
API オペレーションに関する直接のリソースについては、次のリンクを参照してください。
SDK for Java を使って SageMaker トレーニングジョブを実行し、デバッガー API を設定する場合は、次のリファレンスを参照してください。