Cree un SageMaker HyperPod clúster - Amazon SageMaker

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Cree un SageMaker HyperPod clúster

Consulta las siguientes instrucciones sobre cómo crear un SageMaker HyperPod clúster nuevo mediante la interfaz de usuario de la SageMaker HyperPod consola.

  1. Abre la SageMaker consola de Amazon en https://console.aws.amazon.com/sagemaker/.

  2. Selecciona HyperPod los clústeres en el panel de navegación izquierdo.

  3. En la página de SageMaker HyperPod inicio, selecciona Crear HyperPod clúster.

  4. En el menú desplegable de Crear HyperPod clúster, selecciona Orchestrated by Amazon EKS.

  5. En la lista de EKS clústeres de Amazon, elige el EKS clúster con el que quieres configurar el nuevo HyperPod clúster.

    1. Si necesita crear un EKS clúster nuevo, elija Crear EKS clúster. Puedes crearlo desde la página de lista de EKS clústeres sin tener que abrir la EKS consola de Amazon.

      nota

      La VPC subred que elijas HyperPod debe ser privada.

    2. Tras enviar una nueva solicitud de creación de EKS clúster, espere a que el EKS clúster se active.

    3. Instale el diagrama de Helm tal y como se indica enInstalar paquetes en el EKS clúster de Amazon con Helm.

    4. Una vez finalizada la creación del EKS clúster, selecciona Crear HyperPod clúster y, a continuación, Orchestrated by de EKS nuevo. Deberías poder buscar y seleccionar el nuevo EKS clúster. Para continuar, elija Seleccionar.

  6. En la página Configurar un nuevo HyperPod clúster, configure la información básica del clúster, como el nombre, las opciones para habilitar las funciones de resiliencia del HyperPod clúster y las etiquetas.

  7. En Nombre del clúster, especifique un nombre para el nuevo clúster.

  8. En Resiliencia del clúster: recuperación de nodos, especifique si desea Automatic habilitar la recuperación automática de nodos. SageMaker HyperPodreemplaza o reinicia las instancias (nodos) cuando el agente de supervisión del estado detecta problemas.

  9. En el caso de las etiquetas, añada pares de claves y valores al nuevo clúster y gestione el clúster como un AWS recurso. Para obtener más información, consulte Etiquetar AWS los recursos.

  10. En el paso 2: Configurar grupos de instancias, selecciona Crear grupo de instancias. Cada grupo de instancias se puede configurar de forma diferente y puedes crear un clúster heterogéneo compuesto por varios grupos de instancias con varios tipos de instancias. En la ventana emergente Crear una configuración de grupo de instancias, completa la información de configuración del grupo de instancias.

    Crea una página emergente de grupos de instancias y configura un nuevo grupo de instancias siguiendo las instrucciones de la interfaz de usuario.

    1. En Nombre del grupo de instancias, especifica un nombre para el grupo de instancias.

    2. En Seleccionar tipo de instancia, elige la instancia para el grupo de instancias.

    3. En Cantidad, especifica un número entero que no exceda la cuota de instancias para el uso del clúster.

    4. Prepare un script de configuración del ciclo de vida y cárguelo en un bucket de Amazon S3, comos3://sagemaker-amzn-s3-demo-bucket>/<lifecycle-script-directory>/src/.

      Para empezar rápidamente, descargue el script on_create.shde muestra del GitHub repositorio de formación distribuida de AWS ome y cárguelo en el bucket de S3. Este script configura el archivo de registro /var/log/provision/provisioning.log necesario CloudWatch para recopilar los registros de los contenedores Pod. También puedes incluir instrucciones de configuración adicionales, una serie de scripts de configuración o comandos para que se ejecuten durante la fase de aprovisionamiento del HyperPod clúster.

    5. En el caso del bucket de S3 URI para los scripts del ciclo de vida, introduzca la ruta de Amazon S3 en la que se almacenan los scripts del ciclo de vida.

    6. Para Ruta de directorio al script de punto de entrada en la ruta base de Amazon S3, introduzca el nombre de archivo del script de ciclo de vida en Ruta de Amazon S3 a los archivos de script de ciclo de vida. Si utiliza el script de ejemplo proporcionado, introdúzcalo. on_create.sh

    7. Para el IAM rol, elija el IAM rol que ha creado para SageMaker HyperPod los recursos, siguiendo la secciónIAMrol para SageMaker HyperPod.

    8. En Configuración avanzada, puede configurar las siguientes configuraciones opcionales.

      1. (Opcional) Para los subprocesos por núcleo, especifique si se deshabilitan 1 los subprocesos múltiples y 2 si se habilitan los subprocesos múltiples. Para saber qué tipo de instancia admite subprocesos múltiples, consulta la tabla de referencia de CPUnúcleos y subprocesos por CPU núcleo y por tipo de instancia en la Guía EC2del usuario de Amazon.

      2. (Opcional) Para configuraciones de almacenamiento de instancias adicionales, especifica un número entero entre 1 y 16384 para establecer el tamaño de un volumen adicional de Elastic Block Store (EBS) en gigabytes (GB). El EBS volumen se adjunta a cada instancia del grupo de instancias. La ruta de montaje predeterminada para el EBS volumen adicional es/opt/sagemaker. Una vez que el clúster se haya creado correctamente, puede acceder SSH a las instancias del clúster (nodos) y comprobar si el EBS volumen está montado correctamente ejecutando el df -h comando. Adjuntar un EBS volumen adicional proporciona un almacenamiento estable, fuera de la instancia y persistente de forma independiente, tal y como se describe en la sección de EBSvolúmenes de Amazon de la Guía del usuario de Amazon Elastic Block Store.

  11. Para realizar una comprobación de estado profunda, selecciona las comprobaciones de estado avanzadas que quieras ejecutar en las instancias. Para obtener más información, consulte Controles de estado exhaustivos.

  12. En el paso 3: Configuración avanzada, configure los ajustes de red dentro y in-and-out fuera del clúster. Para la orquestación del SageMaker HyperPod clúster con AmazonEKS, VPC se establece automáticamente en el que se configuró con el EKS clúster que seleccionaste.

  13. En el paso 4: revisar y crear, revise la configuración que ha establecido del paso 1 al paso 3 y termine de enviar la solicitud de creación del clúster.

  14. Cuando el estado del clúster cambie aInService, podrá empezar a iniciar sesión en los nodos del clúster. Para acceder a los nodos del clúster y empezar a ejecutar cargas de trabajo de aprendizaje automático, consultePuestos de trabajo en SageMaker HyperPod clústeres.