サポート対象のフレームワークとアルゴリズム - Amazon SageMaker AI

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

サポート対象のフレームワークとアルゴリズム

次の表は、デバッガーがサポートする SageMaker AI 機械学習フレームワークとアルゴリズムを示しています。

SageMaker AI-supported frameworks and algorithms Debugging output tensors

TensorFlow

AWS TensorFlow 深層学習コンテナ 1.15.4 以降

PyTorch

AWS PyTorch 深層学習コンテナ 1.5.0 以降

MXNet

AWS MXNet 深層学習コンテナ 1.6.0 以降

XGBoost

1.0-1、1.2-1、1.3-1

SageMaker AI 汎用推定器

カスタムトレーニングコンテナ (手動フック登録により TensorFlow、PyTorch、MXNet、XGBoost で使用可能)

  • 出力テンソルのデバッグ - トレーニングジョブの重み、勾配、バイアス、スカラー値などのモデルパラメータを追跡およびデバッグします。利用可能な深層学習フレームワークは、Apache MXNet、TensorFlow、PyTorch、XGBoost です。

    重要

    Keras を使用した TensorFlow フレームワークについては、SageMaker デバッガーは、TensorFlow 2.6 以降の tf.keras モジュールを使って構築されたモデルのデバッグに対するゼロコード変更サポートを廃止します。これは、TensorFlow 2.6.0 リリースノートで発表された重大な変更によるものです。トレーニングスクリプトを更新する手順については、「TensorFlow トレーニングスクリプトを適応させる」を参照してください。

    重要

    PyTorch v1.12.0 以降から、SageMaker Debugger はデバッグモデルのゼロコード変更サポートを廃止します。

    これは、SageMaker Debugger が torch.jit の機能を妨害する原因となる重大な変更によるものです。トレーニングスクリプトを更新する手順については、「PyTorch トレーニングスクリプトを適合させる」を参照してください。

トレーニングやデバッグを行いたいフレームワークまたはアルゴリズムが表に載っていない場合は、AWS ディスカッションフォーラムにアクセスして、SageMaker デバッガーに関するフィードバックを残してください。

AWS リージョン

Amazon SageMaker Debugger は、Amazon SageMaker AI が稼働しているすべてのリージョンで使用できます。ただし、次のリージョンは除きます。

  • アジアパシフィック (ジャカルタ): ap-southeast-3

Amazon SageMaker AI が で稼働しているかどうかを確認するには AWS リージョン、AWS 「リージョン別サービス」を参照してください。

カスタムトレーニングコンテナと共にデバッガーを使用する

トレーニングコンテナを SageMaker AI に取り込み、デバッガーを使用してトレーニングジョブに関するインサイトを取得します。モニタリングとデバッグの機能を使って Amazon EC2 インスタンスでモデルを最適化することで、作業効率を最大化します。

sagemaker-debugger クライアントライブラリを使ってトレーニングコンテナを構築し、それを Amazon Elastic Container Registry (Amazon ECR) にプッシュし、モニタリングとデバッグを行う方法の詳細については、「カスタムトレーニングで Debugger を使用する」を参照してください。

デバッガーのオープンソース GitHub リポジトリ

デバッガー APIs は SageMaker Python SDK を通じて提供され、SageMaker AI CreateTrainingJob および DescribeTrainingJob API オペレーションのデバッガーフックとルール設定を構築するように設計されています。sagemaker-debugger クライアントライブラリは、フックを登録しトライアル機能を使ってトレーニングデータにアクセスするためのツールを、すべて柔軟で強力な API オペレーションを通じて提供します。Python 3.6 以降で、機械学習フレームワーク TensorFlow、PyTorch、MXNet、XGBoost をサポートしています。

デバッガーと sagemaker-debugger API オペレーションに関する直接のリソースについては、次のリンクを参照してください。

SDK for Java を使って SageMaker トレーニングジョブを実行し、デバッガー API を設定する場合は、次のリファレンスを参照してください。