(アーカイブ済み) SageMaker モデル並列処理ライブラリ v1.x - Amazon SageMaker

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

(アーカイブ済み) SageMaker モデル並列処理ライブラリ v1.x

重要

2023 年 12 月 19 日に、 SageMaker モデル並列処理 (SMP) ライブラリ v2 がリリースされました。SMP ライブラリ v2 を優先するため、SMP v1 の機能future リリースではサポートされなくなります。以下のセクションとトピックはアーカイブされており、SMP ライブラリ v1 の使用に特化したものです。SMP ライブラリ v2 の使用方法については、を参照してください。 SageMaker モデル並列処理ライブラリ v2 について説明します。

Amazon SageMaker のモデルparallel ライブラリを使用して、GPU メモリの制限によりトレーニングが難しい大規模なディープラーニング (DL) モデルをトレーニングします。ライブラリは、モデルを複数の GPU およびインスタンス間で自動的かつ効率的に分割します。ライブラリを使用すると、数十億または数兆のパラメータを使って大規模な DL モデルを効率的にトレーニングすることで、目標予測精度をより速く達成できます。

このライブラリを使用すると、コードの変更を最小限に抑えながら、 TensorFlow PyTorch 独自のモデルとモデルを複数の GPU や複数のノードに自動的に分割できます。 SageMaker Python SDK を介してライブラリの API にアクセスできます。

以下のセクションを使用して、モデル並列処理とモデルparallel ライブラリについて詳しく学んでください。 SageMaker このライブラリの API ドキュメントは SageMaker Python SDK v2.199.0 ドキュメントの「分散型トレーニング API」にあります。