Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Cree un SageMaker HyperPod clúster
Aprenda a crear SageMaker HyperPod clústeres orquestados por Amazon EKS mediante el AWS CLI.
-
Antes de crear un SageMaker HyperPod clúster:
-
Asegúrese de tener un EKS clúster de Amazon existente en funcionamiento. Para obtener instrucciones detalladas sobre cómo configurar un EKS clúster de Amazon, consulta Crear un EKS clúster de Amazon en la Guía del EKS usuario de Amazon.
-
Instale el diagrama de Helm tal y como se indica enInstalar paquetes en el EKS clúster de Amazon con Helm.
-
-
Prepare un script de configuración del ciclo de vida y cárguelo en un bucket de Amazon S3, como
s3://sagemaker-amzn-s3-demo-bucket>/<lifecycle-script-directory>/src/
.Para empezar rápidamente, descargue el script
on_create.sh
de muestra del GitHub repositorio de formación distribuida de AWS ome y cárguelo en el bucket de S3. Este script configura el archivo de registro /var/log/provision/provisioning.log
necesario CloudWatch para recopilar los registros de los contenedores Pod. También puedes incluir instrucciones de configuración adicionales, una serie de scripts de configuración o comandos para que se ejecuten durante la fase de aprovisionamiento del HyperPod clúster.importante
Si crea un IAMrol para SageMaker HyperPod adjunto solo para los gestionados
AmazonSageMakerClusterInstanceRolePolicy
, su clúster tendrá acceso a los buckets de Amazon S3 con el prefijo específico.sagemaker-
-
Prepare un archivo de CreateClusterAPIsolicitud en formato. JSON Para
ExecutionRole
ello, proporciona ARN el IAM rol que creaste con el gestionadoAmazonSageMakerClusterInstanceRolePolicy
de la secciónIAMrol para SageMaker HyperPod.nota
Asegúrese de que su SageMaker HyperPod clúster esté desplegado en la misma nube privada virtual (VPC) que su EKS clúster de Amazon. Las subredes y los grupos de seguridad especificados en la configuración del SageMaker HyperPod clúster deben permitir la conectividad de red y la comunicación con el punto final del API servidor del EKS clúster de Amazon.
// create_cluster.json
{ "ClusterName":"string"
, "InstanceGroups": [{ "InstanceGroupName":"string"
, "InstanceType":"string"
, "InstanceCount":number
, "LifeCycleConfig": { "SourceS3Uri":"s3://sagemaker-amzn-s3-demo-bucket>/<lifecycle-script-directory>/src/"
, "OnCreate":"on_create.sh"
}, "ExecutionRole":"string"
, "ThreadsPerCore":number
, "OnStartDeepHealthChecks": ["InstanceStress", "InstanceConnectivity"
] }], "VpcConfig": { "SecurityGroupIds": ["string"
], "Subnets": ["string"
] }, "Tags": [{ "Key":"string"
, "Value":"string"
}], "Orchestrator": { "Eks": { "ClusterArn":"string"
, } }, "NodeRecovery": "Automatic" }Tenga en cuenta lo siguiente al configurar la creación de un nuevo SageMaker HyperPod clúster que se asocie a un EKS clúster.
-
Puedes configurar hasta 20 grupos de instancias con el
InstanceGroups
parámetro. -
Para
Orchestator.Eks.ClusterArn
ello, especifica ARN el EKS clúster que quieres usar como orquestador. -
Para
OnStartDeepHealthChecks
, añadaInstanceStress
yInstanceConnectivity
habilite. Controles de estado exhaustivos -
Para
NodeRecovery
, especifique siAutomatic
desea habilitar la recuperación automática de nodos. SageMaker HyperPod reemplaza o reinicia las instancias (nodos) cuando el agente de supervisión del estado detecta problemas. -
Para el
Tags
parámetro, puede agregar etiquetas personalizadas para administrar el SageMaker HyperPod clúster como un AWS recurso. Puede agregar etiquetas a su clúster de la misma manera que las agrega en otros AWS servicios que admiten el etiquetado. Para obtener más información sobre el etiquetado de AWS los recursos en general, consulte la Guía del usuario de AWS los recursos de etiquetado. -
Para el
VpcConfig
parámetro, especifique la información del elemento VPC utilizado en el EKS clúster. Las subredes deben ser privadas.
-
-
Ejecute el comando create-cluster de la siguiente manera.
aws sagemaker create-cluster \ --cli-input-json
file://complete/path/to/create_cluster.json
Esto debería devolver el ARN del nuevo clúster.