Amazon によってオーケストレーションされた SageMaker HyperPod クラスターでのジョブの実行 EKS - Amazon SageMaker

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

Amazon によってオーケストレーションされた SageMaker HyperPod クラスターでのジョブの実行 EKS

以下のトピックでは、Amazon とオーケストレーションされたプロビジョニングされた SageMaker HyperPod クラスターでコンピューティングノードにアクセスし、ML ワークロードを実行する手順と例を示しますEKS。 HyperPod クラスターで環境を設定する方法に応じて、 HyperPod クラスターで ML ワークロードを実行する方法は多数あります。

ヒント

Amazon とオーケストレーションされた SageMaker HyperPod クラスターをセットアップして使用する方法に関する実践的な経験とガイダンスについてはEKS、この Amazon EKS サポートをワークショップで SageMaker HyperPod受講することをお勧めします。

データサイエンティストユーザーは、EKSクラスターセットを SageMaker HyperPod クラスターのオーケストレーターとして使用して、基礎モデルをトレーニングできます。科学者は、 SageMaker HyperPod CLIとネイティブkubectlコマンドを活用して、使用可能な SageMaker HyperPod クラスターを検索し、トレーニングジョブ (ポッド) を送信し、ワークロードを管理します。は、トレーニングジョブスキーマファイルを使用してジョブの送信 SageMaker HyperPod CLIを有効にし、ジョブのリスト、説明、キャンセル、実行の機能を提供します。科学者は、Kubeflow Training Operator Kueue (ジョブキュー用の K8s ツール)、 SageMakerマネージドMLflowを使用して、ML 実験とトレーニング実行を管理できます。