Amazon SageMaker Training Compiler リリースノート - Amazon SageMaker AI

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

Amazon SageMaker Training Compiler リリースノート

重要

Amazon Web Services (AWS) は、SageMaker Training Compiler の新しいリリースやバージョンがないことを発表しました。SageMaker Training の既存の AWS Deep Learning Containers (DLCs) を通じて、引き続き SageMaker Training Compiler を利用できます。既存の DLCs は引き続きアクセス可能ですが、 AWS Deep Learning Containers Framework サポートポリシーに従って AWS、 からパッチや更新プログラムを受け取ることはできなくなります。

Amazon SageMaker Training Compiler の最新の更新を追跡するには、次のリリースノートを参照してください。

SageMaker Training Compiler リリースノート: 2023 年 2 月 13 日

通貨の更新
  • PyTorch v1.13.1 のサポートが追加されました

バグ修正
  • Vision Transformer (ViT) モデルなどの一部のモデルで NAN 損失を引き起こしていた GPU の競合状態の問題を修正しました。

その他の変更
  • SageMaker Training Compiler により、torch.optim または torch_xla.amp.syncfree (torch_xla.amp.syncfree.SGDtorch_xla.amp.syncfree.Adamtorch_xla.amp.syncfree.AdamW など) の syncfree バージョンを使用する transformers.optimization のオプティマイザ (SGD、Adam、AdamW など) が自動的にオーバーライドされ、パフォーマンスが向上します。トレーニングスクリプト内でオプティマイザを定義しているコード行を変更する必要はありません。

深 AWS 層学習コンテナへの移行

このリリースはベンチマークテストに合格し、次の AWS Deep Learning Container に移行されます。

SageMaker Training Compiler リリースノート: 2023 年 1 月 9 日

重要な変更

  • tf.keras.optimizers.Optimizer は、TensorFlow 2.11.0 以降の新しいオプティマイザを指すようになりました。古いオプティマイザは tf.keras.optimizers.legacy に移動しました。次のことを行うと、重要な変更によりジョブにエラーが発生する可能性があります。

    • 古いオプティマイザからチェックポイントをロードする。レガシーオプティマイザを使用するように切り替えることをお勧めします。

    • TensorFlow v1 を使用する。TensorFlow v2 に移行するか、TensorFlow v1 を引き続き使用する必要がある場合はレガシーオプティマイザに切り替えることをお勧めします。

    オプティマイザの変更による重要な変更の詳細なリストについては、「TensorFlow GitHub リポジトリ」の「official TensorFlow v2.11.0 release notes」を参照してください。

深 AWS 層学習コンテナへの移行

このリリースはベンチマークテストに合格し、次の AWS Deep Learning Container に移行されます。

SageMaker Training Compiler リリースノート: 2022 年 12 月 8 日

バグ修正

  • PyTorch v1.12 以降の PyTorch トレーニングジョブのシードを修正して、異なるプロセス間でモデルの初期化に不一致がないようにしました。「PyTorch Reproducibility」も参照してください。

  • G4dn および G5 インスタンスの PyTorch 分散型トレーニングジョブがデフォルトで PCIe を介した通信に設定されない問題を修正しました。

既知の問題

  • Hugging Face の Vision Transformers で PyTorch/XLA API を不適切に使用すると、収束の問題が発生する可能性があります。

その他の変更

深 AWS 層学習コンテナへの移行

このリリースはベンチマークテストに合格し、次の AWS Deep Learning Container に移行されます。

SageMaker Training Compiler リリースノート: 2022 年 10 月 4 日

通貨の更新
  • TensorFlow v2.10.0 のサポートが追加されました。

その他の変更
  • TensorFlow フレームワークのテストに Transformers ライブラリを使用する Hugging Face NLP モデルが追加されました。テスト済みの Transformer モデルを検索するには、「テスト済みモデル」を参照してください。

深 AWS 層学習コンテナへの移行

このリリースはベンチマークテストに合格し、次の AWS Deep Learning Container に移行されます。

SageMaker Training Compiler リリースノート: 2022 年 9 月 1 日

通貨の更新
  • Hugging Face Transformers v4.21.1 と PyTorch v1.11.0 のサポートが追加されました。

改良点
深 AWS 層学習コンテナへの移行

このリリースはベンチマークテストに合格し、次の AWS Deep Learning Container に移行されます。

SageMaker Training Compiler リリースノート: 2022 年 6 月 14 日

新機能
深 AWS 層学習コンテナへの移行

このリリースはベンチマークテストに合格し、次の AWS Deep Learning Container に移行されます。

SageMaker Training Compiler リリースノート: 2022 年 4 月 26 日

改良点
  • 深層学習コンテナ AWS リージョン が稼働している中国リージョンを除くすべての のサポートが追加されました。 AWS

SageMaker Training Compiler リリースノート: 2022 年 4 月 12 日

通貨の更新
  • TensorFlow v2.6.3 と PyTorch v1.10.2 を使用した Hugging Face Transformers v4.17.0 のサポートを追加しました。

SageMaker Training Compiler リリースノート: 2022 年 2 月 21 日

改良点
  • ベンチマークテストを完了し、ml.g4dn インスタンスタイプでのトレーニングのスピードアップを確認しました。テスト済みの ml インスタンスの完全なリストを見つけるには、「サポートされるインスタンスタイプ」を参照してください。

SageMaker Training Compiler リリースノート: 2021 年 12 月 1 日

新機能
  • AWS re:Invent 2021 で Amazon SageMaker Training Compiler を起動しました。

深 AWS 層学習コンテナへの移行