Crear un grupo de nodos de cómputo en AWS PCS - AWS PCS

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Crear un grupo de nodos de cómputo en AWS PCS

En este tema se proporciona una descripción general de las opciones disponibles y se describe lo que se debe tener en cuenta al crear un grupo de nodos de procesamiento en AWS Parallel Computing Service (AWS PCS). Si es la primera vez que crea un grupo de nodos de cálculo en AWS PCS, le recomendamos que siga el tutorial que aparece enCómo empezar con AWS Parallel Computing Service. El tutorial puede ayudarle a crear un HPC sistema funcional sin necesidad de ampliar todas las opciones y arquitecturas de sistema disponibles.

Requisitos previos

  • Cuotas de servicio suficientes para lanzar el número deseado de EC2 instancias en su Región de AWS. Puede utilizarlas AWS Management Consolepara comprobar y solicitar aumentos en sus cuotas de servicio.

  • Una red existente VPC y una o varias subredes que cumplen con los requisitos AWS PCS de red. Le recomendamos que comprenda detenidamente estos requisitos antes de implementar un clúster para su uso en producción. Para obtener más información, consulte AWS PCSVPCy requisitos y consideraciones de subred. También puede usar una CloudFormation plantilla para crear subredes VPC y. AWS proporciona una HPC receta para la CloudFormation plantilla. Para obtener más información, consulte aws-hpc-recipesen GitHub.

  • Un perfil de IAM instancia con permisos para convocar la AWS PCS RegisterComputeNodeGroupInstance API acción y acceder a cualquier otro AWS recurso necesario para las instancias de tu grupo de nodos. Para obtener más información, consulte IAMperfiles de instancia para AWS Parallel Computing Service.

  • Una plantilla de lanzamiento para las instancias de tu grupo de nodos. Para obtener más información, consulte Uso de plantillas de EC2 lanzamiento de Amazon con AWS PCS.

  • Para crear un grupo de nodos de cómputo que utilice instancias de Amazon EC2 Spot, debe tener el rol AWSServiceRoleForEC2Spotvinculado al servicio en su. Cuenta de AWS Para obtener más información, consulte Función de Amazon EC2 Spot para AWS PCS.

Cree un grupo de nodos de cómputo en AWS PCS

Puede crear un grupo de nodos de procesamiento mediante el AWS Management Console o el AWS CLI.

AWS Management Console
Para crear su grupo de nodos de cómputo mediante la consola
  1. Abre la AWS PCSconsola.

  2. Seleccione el clúster en el que desee crear un grupo de nodos de procesamiento. Vaya a Grupos de nodos de cómputo y elija Crear.

  3. En la sección de configuración del grupo de nodos de Compute, proporciona un nombre para el grupo de nodos. El nombre solo puede contener caracteres alfanuméricos y guiones que distingan mayúsculas de minúsculas. Debe empezar por un carácter alfabético y no puede tener más de 25 caracteres. El nombre debe ser único en el clúster.

  4. En Configuración informática, introduzca o seleccione estos valores:

    1. EC2Plantilla de lanzamiento: seleccione una plantilla de lanzamiento personalizada para utilizarla en este grupo de nodos. Las plantillas de lanzamiento se pueden utilizar para personalizar la configuración de la red, como la subred y los grupos de seguridad, la configuración de supervisión y el almacenamiento a nivel de instancia. Si no tienes una plantilla de lanzamiento preparada, consulta Uso de plantillas de EC2 lanzamiento de Amazon con AWS PCS para aprender a crear una.

      importante

      AWS PCScrea una plantilla de lanzamiento gestionada para cada grupo de nodos de procesamiento. Se denominanpcs-identifier-do-not-delete. No los seleccione cuando cree o actualice un grupo de nodos de procesamiento, o el grupo de nodos no funcionará correctamente.

    2. EC2versión de la plantilla de lanzamiento: debe seleccionar una versión de su plantilla de lanzamiento personalizada. Si cambia la versión más adelante, debe actualizar el grupo de nodos de procesamiento para detectar cambios en la plantilla de lanzamiento. Para obtener más información, consulte Actualización de un grupo de nodos de AWS PCS cómputo.

    3. AMIID: si tu plantilla de lanzamiento no incluye un AMI ID o si quieres anular el valor de la plantilla de lanzamiento, introduce un AMI ID aquí. Tenga en cuenta que el AMI utilizado para el grupo de nodos debe ser compatible con AWS PCS. También puede seleccionar una muestra AMI proporcionada por AWS. Para obtener más información sobre este tema, consulteAmazon Machine Images (AMIs) para AWS PCS.

    4. IAMperfil de instancia: elija un perfil de instancia para el grupo de nodos. Un perfil de instancia otorga a la instancia permisos para acceder a AWS los recursos y servicios de forma segura. Si no tiene uno preparado, consulte IAMperfiles de instancia para AWS Parallel Computing Service para obtener información sobre cómo crear uno.

    5. Subredes: elija una o más subredes en el VPC lugar donde se implementa el AWS PCS clúster. Si seleccionas varias subredes, EFA las comunicaciones no estarán disponibles entre los nodos y la comunicación entre los nodos de distintas subredes podría aumentar la latencia. Asegúrese de que las subredes que especifique aquí coincidan con las que haya definido en la EC2 plantilla de lanzamiento.

    6. Instancias: elija uno o más tipos de instancias para cumplir con las solicitudes de escalado del grupo de nodos. Todos los tipos de instancias deben tener la misma arquitectura de procesador (x86_64 o arm64) y el mismo número de. vCPUs Si las instancias lo tienenGPUs, todos los tipos de instancias deben tener el mismo número de. GPUs

    7. Configuración de escalado: especifique la cantidad mínima y máxima de instancias para el grupo de nodos. Puede definir una configuración estática, en la que hay un número fijo de nodos en ejecución, o una configuración dinámica, en la que se pueden ejecutar hasta el número máximo de nodos. Para una configuración estática, defina el mínimo y el máximo en el mismo número, superior a cero. Para una configuración dinámica, establece el número mínimo de instancias en cero y el máximo en un número superior a cero. AWS PCSno admite grupos de nodos de cómputo con una combinación de instancias estáticas y dinámicas.

  5. (Opcional) En Configuración adicional, especifique lo siguiente:

    1. Opción de compra: seleccione entre instancias puntuales y bajo demanda.

    2. Estrategia de asignación: si ha seleccionado la opción de compra puntual, puede especificar cómo se eligen los grupos de capacidad puntuales al lanzar instancias en el grupo de nodos. Para obtener más información, consulte Estrategias de asignación para instancias puntuales en la Guía del usuario de Amazon Elastic Compute Cloud. Esta opción no tiene efecto si ha seleccionado la opción de compra bajo demanda.

  6. (Opcional) En el Slurm en la sección de configuración personalizada, proporcione estos valores:

    1. Peso: este valor establece la prioridad de los nodos del grupo para fines de programación. Los nodos con pesos más bajos tienen mayor prioridad y las unidades son arbitrarias. Para obtener más información, consulte Peso en el Slurm .

    2. Memoria real: este valor establece el tamaño (en GB) de la memoria real en los nodos del grupo de nodos. Está pensado para usarse junto con la CR_CPU_Memory opción del clúster Slurm configuración en AWS PCS. Para obtener más información, consulte RealMemoryen la Slurm .

  7. (Opcional) En Etiquetas, agrega cualquier etiqueta a tu grupo de nodos de cómputo.

  8. Selecciona Crear grupo de nodos de cómputo. El campo Estado muestra Creating mientras AWS PCS aprovisiona el grupo de nodos. Esto puede tardar varios minutos.

Siguiente paso recomendado
  • Agregue su grupo de nodos a una cola AWS PCS para que pueda procesar los trabajos.

AWS CLI
Para crear su grupo de nodos de cómputo mediante AWS CLI

Cree su cola con el siguiente comando. Antes de ejecutar el comando, realice los siguientes reemplazos:

  1. Reemplazar regioncon el ID del Región de AWS para crear el clúster, por ejemplo. us-east-1

  2. Reemplazar my-cluster con el nombre o el clusterId de tu clúster.

  3. Reemplazar my-node-groupcon el nombre de su grupo de nodos de procesamiento. El nombre solo puede contener caracteres alfanuméricos (con distinción de mayúsculas y minúsculas) y guiones. Debe empezar por un carácter alfabético y no puede tener más de 25 caracteres. El nombre debe ser único en el clúster.

  4. Reemplazar subnet-ExampleID1 con una o más subredes IDs del clústerVPC.

  5. Reemplazar lt-ExampleID1 con el ID de tu plantilla de lanzamiento personalizada. Si no tienes una preparada, consulta Uso de plantillas de EC2 lanzamiento de Amazon con AWS PCS para aprender a crearla.

    importante

    AWS PCScrea una plantilla de lanzamiento gestionado para cada grupo de nodos de procesamiento. Se denominanpcs-identifier-do-not-delete. No los seleccione cuando cree o actualice un grupo de nodos de procesamiento, o el grupo de nodos no funcionará correctamente.

  6. Reemplazar launch-template-version con una versión de plantilla de lanzamiento específica. AWS PCSasocia su grupo de nodos a esa versión específica de la plantilla de lanzamiento.

  7. Reemplazar arn:InstanceProfilecon el perfil ARN de su IAM instancia. Si no tiene uno preparado, consulte Uso de plantillas de EC2 lanzamiento de Amazon con AWS PCS para obtener orientación.

  8. Reemplazar min-instances y max-instances con valores enteros. Puede definir una configuración estática, en la que hay un número fijo de nodos en ejecución, o una configuración dinámica, en la que se puede ejecutar hasta el número máximo de nodos. Para una configuración estática, defina el mínimo y el máximo en el mismo número, superior a cero. Para una configuración dinámica, establece el número mínimo de instancias en cero y el máximo en un número superior a cero. AWS PCSno admite grupos de nodos de cómputo con una combinación de instancias estáticas y dinámicas.

  9. Reemplazar t3.large con otro tipo de instancia. Puede añadir más tipos de instancias especificando una lista de instanceType ajustes. Por ejemplo: --instance-configs instanceType=c6i.16xlarge,instanceType=c6a.16xlarge. Todos los tipos de instancias deben tener la misma arquitectura de procesador (x86_64 o arm64) y el mismo número de. vCPUs Si las instancias lo tienenGPUs, todos los tipos de instancias deben tener el mismo número de. GPUs

aws pcs create-compute-node-group --region region \ --cluster-identifier my-cluster \ --compute-node-group-name my-node-group \ --subnet-ids subnet-ExampleID1 \ --custom-launch-template id=lt-ExampleID1,version='launch-template-version' \ --iam-instance-profile arn=arn:InstanceProfile \ --scaling-config minInstanceCount=min-instances,maxInstanceCount=max-instance \ --instance-configs instanceType=t3.large

Hay varios ajustes de configuración opcionales que puedes añadir al create-compute-node-group comando.

  • Puede especificar --amiId si su plantilla de lanzamiento personalizada no incluye una referencia a un AMI valor o si desea anular ese valor. Ten en cuenta que la AMI utilizada para el grupo de nodos debe ser compatible con AWS PCS. También puede seleccionar una muestra AMI proporcionada por AWS. Para obtener más información sobre este tema, consulteAmazon Machine Images (AMIs) para AWS PCS.

  • Puede seleccionar entre instancias bajo demanda (ONDEMAND) y Spot (SPOT) utilizando--purchase-option. Bajo demanda es la opción predeterminada. Si elige las instancias puntuales, también puede utilizarlas --allocation-strategy para definir cómo se AWS PCS eligen los grupos de capacidad puntuales al lanzar instancias en el grupo de nodos. Para obtener más información, consulte Estrategias de asignación para instancias puntuales en la Guía del usuario de Amazon Elastic Compute Cloud.

  • Es posible proporcionar Slurm opciones de configuración para los nodos del grupo de nodos mediante--slurm-configuration. Puede establecer el peso (prioridad de programación) y la memoria real. Los nodos con pesos más bajos tienen mayor prioridad y las unidades son arbitrarias. Para obtener más información, consulte Peso en el Slurm . La memoria real establece el tamaño (en GB) de la memoria real en los nodos del grupo de nodos. Está diseñado para usarse junto con la CR_CPU_Memory opción para el clúster AWS PCS en su Slurm configuración. Para obtener más información, consulte RealMemoryen la Slurm .

importante

La creación del grupo de nodos de procesamiento puede tardar varios minutos.

Puede consultar el estado de su grupo de nodos con el siguiente comando. No podrás asociar el grupo de nodos a una cola hasta que se alcance ACTIVE su estado.

aws pcs get-compute-node-group --region region \ --cluster-identifier my-cluster \ --compute-node-group-identifier my-node-group