翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
異種クラスターでのトレーニングジョブの実行
Training の異種クラスター機能を使用すると、複数のタイプの ML インスタンスでトレーニングジョブを実行して、さまざまな ML SageMaker トレーニングタスクや目的に合わせてリソースのスケーリングと使用率を向上させることができます。例えば、 集約CPU型のタスクが原因でGPU、インスタンスがあるクラスターでトレーニングジョブのGPU使用率が低くCPUボトルネックの問題が発生した場合、異種クラスターを使用すると、コスト効率の高いCPUインスタンスグループを追加し、このようなボトルネックの問題を解決し、GPU使用率を向上させることで、 CPU集約型のタスクをオフロードするのに役立ちます。
注記
この機能は、Python SageMaker v2.98.0 SDK 以降で使用できます。
注記
この機能は、 SageMaker AI PyTorch
ブログ「Amazon SageMaker AI 異種クラスターを使用したモデルトレーニングの料金パフォーマンスの向上」も参照してください