Amazon SageMaker Training Compiler リリースノート - Amazon SageMaker

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

Amazon SageMaker Training Compiler リリースノート

重要

Amazon Web Services (AWS) は、 SageMaker Training Compiler の新しいリリースやバージョンがないことを発表しました。Training SageMaker Compiler は、既存の AWS Deep Learning Containers (DLCs) for SageMaker Training を通じて引き続き利用できます。既存の DLCs は引き続きアクセス可能ですが、 AWS Deep Learning Containers Framework サポートポリシー に従って AWS、 からパッチや更新プログラムを受信しなくなることに注意してください。

Amazon SageMaker Training Compiler の最新の更新を追跡するには、次のリリースノートを参照してください。

SageMaker Training Compiler リリースノート: 2023 年 2 月 13 日

通貨の更新
  • PyTorch v1.13.1 のサポートを追加

バグ修正
  • Vision Transformer (ViT) モデルなどの一部のモデルで NAN 損失を引き起こしていた GPU の競合状態の問題を修正しました。

その他の変更:
  • SageMaker Training Compiler は、 PyTorch/XLA が torch.optimまたは のオプティマイザ (SGD、Adam、AdamW など) を の同期フリーバージョン torch_xla.amp.syncfree (torch_xla.amp.syncfree.SGD、、 など) transformers.optimizationで自動的に上書きできるようにすることでtorch_xla.amp.syncfree.Adam、パフォーマンスを向上させますtorch_xla.amp.syncfree.AdamW。トレーニングスクリプト内でオプティマイザを定義しているコード行を変更する必要はありません。

AWS 深層学習コンテナへの移行

このリリースはベンチマークテストに合格し、次の AWS Deep Learning Container に移行されました。

SageMaker Training Compiler リリースノート: 2023 年 1 月 9 日

重要な変更

  • tf.keras.optimizers.Optimizer は TensorFlow 2.11.0 以降の新しいオプティマイザを指します。古いオプティマイザは tf.keras.optimizers.legacy に移動しました。次のことを行うと、重要な変更によりジョブにエラーが発生する可能性があります。

    • 古いオプティマイザからチェックポイントをロードする。レガシーオプティマイザを使用するように切り替えることをお勧めします。

    • TensorFlow v1 を使用します。 TensorFlow v2 に移行するか、v1 を引き続き使用 TensorFlowする必要がある場合はレガシーオプティマイザに切り替えることをお勧めします。

    オプティマイザの変更による重大な変更の詳細なリストについては、 リポジトリの公式 TensorFlow v2.11.0 リリースノート TensorFlow GitHubを参照してください。

AWS 深層学習コンテナへの移行

このリリースはベンチマークテストに合格し、次の AWS Deep Learning Container に移行されました。

SageMaker Training Compiler リリースノート: 2022 年 12 月 8 日

バグ修正

  • PyTorch v1.12 以降の PyTorch トレーニングジョブのシードを修正し、異なるプロセス間でモデルの初期化に不一致がないことを確認しました。PyTorch 「再現性」も参照してください

  • G4dn インスタンスと G5 インスタンスの PyTorch 分散トレーニングジョブがデフォルトで PCIe

既知の問題

  • Hugging Face のビジョントランスフォーマーで PyTorch/XLA APIs を不適切に使用すると、収束の問題が発生する可能性があります。

その他の変更

AWS 深層学習コンテナへの移行

このリリースはベンチマークテストに合格し、次の AWS Deep Learning Container に移行されました。

SageMaker Training Compiler リリースノート: 2022 年 10 月 4 日

通貨の更新
  • TensorFlow v2.10.0 のサポートが追加されました。

その他の変更:
  • Transformers ライブラリを使用する Hugging Face NLP モデルをフレームワークテストに追加しました TensorFlow。テスト済みの Transformer モデルを検索するには、「テスト済みモデル」を参照してください。

AWS 深層学習コンテナへの移行

このリリースはベンチマークテストに合格し、次の AWS Deep Learning Container に移行されました。

SageMaker Training Compiler リリースノート: 2022 年 9 月 1 日

通貨の更新
  • Hugging Face Transformers v4.21.1 と PyTorch v1.11.0 のサポートが追加されました。

改良点
AWS 深層学習コンテナへの移行

このリリースはベンチマークテストに合格し、次の AWS Deep Learning Container に移行されました。

SageMaker Training Compiler リリースノート: 2022 年 6 月 14 日

新機能
AWS 深層学習コンテナへの移行

このリリースはベンチマークテストに合格し、次の AWS Deep Learning Container に移行されました。

SageMaker Training Compiler リリースノート: 2022 年 4 月 26 日

改良点
  • 深層学習コンテナ AWS リージョン が稼働している中国リージョンを除くすべての のサポートが追加されました。 AWS

SageMaker Training Compiler リリースノート: 2022 年 4 月 12 日

通貨の更新
  • Hugging Face Transformers v4.17.0 と TensorFlow v2.6.3 および PyTorch v1.10.2 のサポートが追加されました。

SageMaker Training Compiler リリースノート: 2022 年 2 月 21 日

改良点
  • ベンチマークテストを完了し、ml.g4dn インスタンスタイプでのトレーニングのスピードアップを確認しました。テスト済みの ml インスタンスの完全なリストを見つけるには、「サポートされるインスタンスタイプ」を参照してください。

SageMaker Training Compiler リリースノート: 2021 年 12 月 1 日

新機能
  • AWS re:Invent 2021 で Amazon SageMaker Training Compiler を起動しました。

AWS 深層学習コンテナへの移行