SageMaker 汎用推定器を使用して構築済みの DLC コンテナを拡張する - Amazon SageMaker

SageMaker 汎用推定器を使用して構築済みの DLC コンテナを拡張する

SageMaker の構築済みコンテナはカスタマイズまたは拡張が可能で、構築済み SageMaker Docker イメージではサポートされていないアルゴリズムやモデルに対するどのような追加の機能要件でも扱うことができます。構築済みコンテナを拡張する方法の例については、「構築済みコンテナを拡張する」を参照してください。

ビルド済みコンテナの拡張や、独自のコンテナをライブラリを使用するよう適応させるには、「サポートされるフレームワーク」に記載されているイメージのいずれかを使用する必要があります。

注記

TensorFlow 2.4.1 および PyTorch 1.8.1 から、SageMaker フレームワーク DLC は EFA 対応のインスタンスタイプをサポートしています。TensorFlow 2.4.1 以降および PyTorch 1.8.1 以降を含む DLC イメージを使用することをお勧めします。

例えば、PyTorch を使用している場合、Dockerfile には次のような FROM ステートメントを記述する必要があります。

# SageMaker PyTorch image FROM 763104351884.dkr.ecr.<aws-region>.amazonaws.com/pytorch-training:<image-tag> ENV PATH="/opt/ml/code:${PATH}" # this environment variable is used by the SageMaker PyTorch container to determine our user code directory. ENV SAGEMAKER_SUBMIT_DIRECTORY /opt/ml/code # /opt/ml and all subdirectories are utilized by SageMaker, use the /code subdirectory to store your user code. COPY train.py /opt/ml/code/train.py # Defines cifar10.py as script entrypoint ENV SAGEMAKER_PROGRAM train.py

SageMaker Training toolkit と SageMaker 分散データ並列ライブラリのバイナリファイルを使用して、SageMaker で動作するように独自の Docker コンテナをさらにカスタマイズできます。詳細については、次のセクションを参照してください。