Cree un SageMaker HyperPod clúster - Amazon SageMaker

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Cree un SageMaker HyperPod clúster

Aprenda a crear SageMaker HyperPod clústeres orquestados por Amazon EKS mediante el AWS CLI.

  1. Antes de crear un SageMaker HyperPod clúster:

    1. Asegúrese de tener un EKS clúster de Amazon existente en funcionamiento. Para obtener instrucciones detalladas sobre cómo configurar un EKS clúster de Amazon, consulta Crear un EKS clúster de Amazon en la Guía del EKS usuario de Amazon.

    2. Instale el diagrama de Helm tal y como se indica enInstalar paquetes en el EKS clúster de Amazon con Helm.

  2. Prepare un script de configuración del ciclo de vida y cárguelo en un bucket de Amazon S3, comos3://sagemaker-amzn-s3-demo-bucket>/<lifecycle-script-directory>/src/.

    Para empezar rápidamente, descargue el script on_create.shde muestra del GitHub repositorio de formación distribuida de AWS ome y cárguelo en el bucket de S3. Este script configura el archivo de registro /var/log/provision/provisioning.log necesario CloudWatch para recopilar los registros de los contenedores Pod. También puedes incluir instrucciones de configuración adicionales, una serie de scripts de configuración o comandos para que se ejecuten durante la fase de aprovisionamiento del HyperPod clúster.

    importante

    Si crea un IAMrol para SageMaker HyperPod adjunto solo para los gestionados AmazonSageMakerClusterInstanceRolePolicy, su clúster tendrá acceso a los buckets de Amazon S3 con el prefijo específico. sagemaker-

  3. Prepare un archivo de CreateClusterAPIsolicitud en formato. JSON Para ExecutionRole ello, proporciona ARN el IAM rol que creaste con el gestionado AmazonSageMakerClusterInstanceRolePolicy de la secciónIAMrol para SageMaker HyperPod.

    nota

    Asegúrese de que su SageMaker HyperPod clúster esté desplegado en la misma nube privada virtual (VPC) que su EKS clúster de Amazon. Las subredes y los grupos de seguridad especificados en la configuración del SageMaker HyperPod clúster deben permitir la conectividad de red y la comunicación con el punto final del API servidor del EKS clúster de Amazon.

    // create_cluster.json { "ClusterName": "string", "InstanceGroups": [{ "InstanceGroupName": "string", "InstanceType": "string", "InstanceCount": number, "LifeCycleConfig": { "SourceS3Uri": "s3://sagemaker-amzn-s3-demo-bucket>/<lifecycle-script-directory>/src/", "OnCreate": "on_create.sh" }, "ExecutionRole": "string", "ThreadsPerCore": number, "OnStartDeepHealthChecks": [ "InstanceStress", "InstanceConnectivity" ] }], "VpcConfig": { "SecurityGroupIds": ["string"], "Subnets": ["string"] }, "Tags": [{ "Key": "string", "Value": "string" }], "Orchestrator": { "Eks": { "ClusterArn": "string", } }, "NodeRecovery": "Automatic" }

    Tenga en cuenta lo siguiente al configurar la creación de un nuevo SageMaker HyperPod clúster que se asocie a un EKS clúster.

    • Puedes configurar hasta 20 grupos de instancias con el InstanceGroups parámetro.

    • Para Orchestator.Eks.ClusterArn ello, especifica ARN el EKS clúster que quieres usar como orquestador.

    • ParaOnStartDeepHealthChecks, añada InstanceStress y InstanceConnectivity habilite. Controles de estado exhaustivos

    • ParaNodeRecovery, especifique si Automatic desea habilitar la recuperación automática de nodos. SageMaker HyperPod reemplaza o reinicia las instancias (nodos) cuando el agente de supervisión del estado detecta problemas.

    • Para el Tags parámetro, puede agregar etiquetas personalizadas para administrar el SageMaker HyperPod clúster como un AWS recurso. Puede agregar etiquetas a su clúster de la misma manera que las agrega en otros AWS servicios que admiten el etiquetado. Para obtener más información sobre el etiquetado de AWS los recursos en general, consulte la Guía del usuario de AWS los recursos de etiquetado.

    • Para el VpcConfig parámetro, especifique la información del elemento VPC utilizado en el EKS clúster. Las subredes deben ser privadas.

  4. Ejecute el comando create-cluster de la siguiente manera.

    aws sagemaker create-cluster \ --cli-input-json file://complete/path/to/create_cluster.json

    Esto debería devolver el ARN del nuevo clúster.