本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
叢集特定的組態
SageMaker HyperPod 提供在不同叢集環境中執行訓練任務的彈性。每個環境都有自己的組態需求和設定程序。本節概述在 SageMaker HyperPod Slurm、 SageMaker HyperPod k8s 和訓練任務中執行 SageMaker 訓練任務所需的步驟和組態。了解這些組態對於有效利用所選環境中分散式訓練的強大功能至關重要。
您可以在下列叢集環境中使用配方:
-
SageMaker HyperPod Slurm 協調
-
SageMaker HyperPod Amazon Elastic Kubernetes Service Orchestration
-
SageMaker 訓練任務
若要在叢集中啟動訓練任務,請設定並安裝對應的叢集組態和環境。