Buat SageMaker HyperPod klaster pada rencana pelatihan menggunakan SageMaker API, atau AWS CLI - Amazon SageMaker AI

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Buat SageMaker HyperPod klaster pada rencana pelatihan menggunakan SageMaker API, atau AWS CLI

Untuk menggunakan rencana SageMaker pelatihan untuk SageMaker HyperPod klaster Amazon Anda, tentukan ARN dari rencana pelatihan yang ingin Anda gunakan dalam TrainingPlanArnparameter ClusterInstanceGroupSpecificationsaat memanggil operasi CreateClusterAPI.

Pastikan subnet yang terkait dengan AZ yang ditunjuk dari paket Anda disertakan dalam konfigurasi klaster Anda. VPCConfig Anda dapat mengambil rencana pelatihan dalam respons panggilan DescribeTrainingPlanAPI. AvailabilityZone

Contoh berikut mengilustrasikan cara membuat SageMaker HyperPod cluster baru dan menyediakan grup instance dengan rencana pelatihan dalam --instance-groups atribut create-cluster AWS CLI perintah.

# Create a cluster aws sagemaker create-cluster \ --cluster-name cluster-name \ --instance-groups '[ \ { \ "InstanceCount": 1,\ "InstanceGroupName": "controller-nodes",\ "InstanceType": "ml.t3.xlarge",\ "LifeCycleConfig": {"SourceS3Uri": source_s3_uri, "OnCreate": "on_create.sh"},\ "ExecutionRole": "arn:aws:iam::customer_account_id:role/execution_role",\ "ThreadsPerCore": 1,\ },\ { \ "InstanceCount": 2, \ "InstanceGroupName": "worker-nodes",\ "InstanceType": "p4d.24xlarge",\ "LifeCycleConfig": {"SourceS3Uri": source_s3_uri, "OnCreate": "on_create.sh"},\ "ExecutionRole": "arn:aws:iam::customer_account_id}:role/execution_role}",\ "ThreadsPerCore": 1,\ "TrainingPlanArn": training_plan_arn,\ }]'

Untuk informasi tentang cara membuat HyperPod klaster menggunakan AWS CLI, lihat create-cluster.

Setelah membuat klaster, Anda dapat memverifikasi bahwa grup instans Anda telah menetapkan kapasitas dengan benar dari rencana pelatihan dengan memanggil DescribeCluster API.

aws sagemaker describe-cluster --cluster-name cluster-name