Actualice la configuración del SageMaker HyperPod clúster - Amazon SageMaker

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Actualice la configuración del SageMaker HyperPod clúster

Ejecute update-cluster para actualizar la configuración de un clúster.

nota

No puede cambiar la información del EKS clúster a la que está asociado su HyperPod clúster una vez creado el clúster.

nota

Si se están realizando comprobaciones de estado exhaustivas en el clúster, esto no API funcionará como se esperaba. Es posible que aparezca un mensaje de error que indique que se están realizando comprobaciones de estado exhaustivas. Para actualizar el clúster, debe esperar a que finalicen las comprobaciones de estado exhaustivas.

  1. Cree un archivo de UpdateCluster solicitud en JSON formato. Asegúrate de especificar el nombre del clúster y el nombre del grupo de instancias correctos para actualizarlos. Puedes cambiar el tipo de instancia, el número de instancias, el script de punto de entrada de la configuración del ciclo de vida y la ruta al script.

    1. Para ClusterName ello, especifique el nombre del clúster que desea actualizar.

    2. En InstanceGroupName

      1. Para actualizar un grupo de instancias existente, especifica el nombre del grupo de instancias que deseas actualizar.

      2. Para agregar un nuevo grupo de instancias, especifica un nombre nuevo que no exista en tu clúster.

    3. En InstanceType

      1. Para actualizar un grupo de instancias existente, debes hacer coincidir el tipo de instancia que especificaste inicialmente con el grupo.

      2. Para añadir un nuevo grupo de instancias, especifica el tipo de instancia con el que quieras configurar el grupo.

    4. En InstanceCount

      1. Para actualizar un grupo de instancias existente, especifica un número entero mayor que el número actual de instancias. Actualmente, solo puedes aumentar el número de instancias.

      2. Para añadir un nuevo grupo de instancias, especifica un número entero mayor o igual a 1.

    5. En este casoLifeCycleConfig, puedes cambiar los valores de ambos SourceS3Uri y OnCreate cuando quieras actualizar el grupo de instancias.

    6. En ExecutionRole

      1. Para actualizar un grupo de instancias existente, sigue usando el mismo IAM rol que asignaste durante la creación del clúster.

      2. Para añadir un nuevo grupo de instancias, especifica IAM el rol que quieras adjuntar.

    7. En ThreadsPerCore

      1. Para actualizar un grupo de instancias existente, sigue usando el mismo valor que especificaste durante la creación del clúster.

      2. Para añadir un nuevo grupo de instancias, puedes elegir cualquier valor de las opciones permitidas por tipo de instancia. Para obtener más información, busca el tipo de instancia y consulta la columna Hilos válidos por núcleo en la tabla de referencia en CPUnúcleos y subprocesos por CPU núcleo por tipo de instancia en la Guía del EC2 usuario de Amazon.

    8. ParaOnStartDeepHealthChecks, añada InstanceStress y InstanceConnectivity habiliteControles de estado exhaustivos.

    9. ParaNodeRecovery, especifique si Automatic desea habilitar la recuperación automática de nodos. SageMaker HyperPod reemplaza o reinicia las instancias (nodos) cuando el agente de supervisión del estado detecta problemas.

    El siguiente fragmento de código es una plantilla de archivo de JSON solicitud que puede utilizar. Para obtener más información sobre la sintaxis de la solicitud y sus parámetrosAPI, consulta la UpdateClusterAPIreferencia.

    // update_cluster.json { // Required "ClusterName": "name-of-cluster-to-update", // Required "InstanceGroups": [{ "InstanceGroupName": "string", "InstanceType": "string", "InstanceCount": number, "LifeCycleConfig": { "SourceS3Uri": "string", "OnCreate": "string" }, "ExecutionRole": "string", "ThreadsPerCore": number, "OnStartDeepHealthChecks": [ "InstanceStress", "InstanceConnectivity" ] }], "NodeRecovery": "Automatic" }
  2. Ejecute el siguiente update-cluster comando para enviar la solicitud.

    aws sagemaker update-cluster \ --cli-input-json file://complete/path/to/update_cluster.json