

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

# SageMaker 分散モデル並列トレーニングジョブの実行
<a name="model-parallel-use-api"></a>

SageMaker Python SDK と SageMaker モデル並列ライブラリを使用して、独自のトレーニングスクリプトのモデル並列トレーニングジョブを実行する方法について説明します。

SageMaker トレーニングジョブを実行するには、次の 3 つのユースケースシナリオがあります。

1. TensorFlow および PyTorch 用に構築済みの AWS 深層学習コンテナのいずれかを使用できます。このオプションは、モデル並列ライブラリを初めて使用する場合に推奨されます。SageMaker モデルの並列トレーニングジョブの実行方法に関するチュートリアルについては、[Amazon SageMaker AI のモデル並列処理ライブラリを使用した PyTorch のトレーニング](https://github.com/aws/amazon-sagemaker-examples/tree/main/training/distributed_training/pytorch/model_parallel)のサンプルノートブックを参照してください。

1. 構築済みのコンテナを拡張して、構築済みの SageMaker Docker イメージではサポートされていない、アルゴリズムやモデルに対する追加の機能要件に対応することができます。構築済みのコンテナを拡張する方法の例については、「[構築済みコンテナを拡張する](prebuilt-containers-extend.md)」を参照してください。

1. [SageMaker トレーニングツールキット](https://github.com/aws/sagemaker-training-toolkit)を使って、独自の Docker コンテナを SageMaker AI で動作するように適応させることができます。例については、「[独自のトレーニングコンテナを適応させる](https://docs.aws.amazon.com/sagemaker/latest/dg/adapt-training-container.html)」を参照してください。

上記のリストのオプション 2 と 3 については、「[SageMaker の分散モデル並列ライブラリを含む事前構築済みの Docker コンテナを拡張する](model-parallel-sm-sdk.md#model-parallel-customize-container)」を参照して、拡張またはカスタマイズされた Docker コンテナにモデル並列ライブラリをインストールする方法を確認してください。

いずれの場合も、SageMaker `TensorFlow` または `PyTorch` 推定器 を設定してトレーニングジョブを起動し、ライブラリをアクティブにします。詳細については、以下のトピックを参照してください。

**Topics**
+ [ステップ 1: SageMaker の分散モデル並列ライブラリを使用して独自のトレーニングスクリプトを変更する](model-parallel-customize-training-script.md)
+ [ステップ 2: SageMaker Python SDK を使用してトレーニングジョブを起動する](model-parallel-sm-sdk.md)