Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Creación de un clúster con contabilidad Slurmdbd externa
Aprenda cómo configurar y crear un clúster con contabilidad Slurmdbd externa. Para obtener más información, consulte Contabilidad de Slurm con AWS ParallelCluster.
Al utilizar la interfaz de la línea de comandos (CLI) o API de AWS ParallelCluster, solo paga por los recursos de AWS que se crean al crear o actualizar imágenes y clústeres de AWS ParallelCluster. Para obtener más información, consulte servicios de AWS utilizados por AWS ParallelCluster.
La interfaz de usuario de AWS ParallelCluster se basa en una arquitectura sin servidor y, en la mayoría de los casos, se puede utilizar en la categoría Free Tier de AWS. Para obtener más información, consulte Costos de IU de AWS ParallelCluster.
En este tutorial, se empleará una plantilla de creación rápida de AWS CloudFormation para crear los componentes necesarios para implementar una instancia Slurmdbd en la misma VPC que el clúster. La plantilla crea una configuración básica de red y seguridad para la conexión entre el clúster y la base de datos.
nota
A partir de la version 3.10.0
, AWS ParallelCluster admite el Slurmdbd externo con el parámetro de configuración del clúster SlurmSettings / ExternelSlurmdbd
.
nota
La plantilla de creación rápida sirve de ejemplo. Esta plantilla no cubre todos los casos de uso posibles. Es su responsabilidad crear una base de datos de Slurm externa con la configuración y la capacidad adecuadas para sus cargas de trabajo de producción.
Requisitos previos:
-
AWS ParallelCluster está instalado.
-
AWS CLI está instalado y configurado.
-
Tiene un rol de AWS Identity and Access Management con los permisos necesarios para ejecutar la CLI de pcluster.
-
Tiene una base de datos de contabilidad de Slurm. Para seguir un tutorial sobre cómo crear una base de datos de contabilidad de Slurm, siga los pasos 1 y 2 de Creación de la pila de la base de datos de contabilidad de Slurm.
Paso 1: Creación de la pila de Slurmdbd
En este tutorial, utilice una plantilla de creación rápida de CloudFormation (us-east-1
)
Red
-
vPCId: el identificador de VPC para lanzar la instancia de Slurmdbd.
-
SubnetId: el ID de subred para lanzar la instancia de Slurmdbd.
-
PrivatePrefix: el prefijo CIDR de la VPC.
-
PrivateIp: una IP privada secundaria para asignar a la instancia de Slurmdbd.
Conexión a la base de datos
-
DBMSClientSG: el grupo de seguridad que se va a adjuntar a la instancia de Slurmdbd. Este grupo de seguridad debe permitir las conexiones entre el servidor de base de datos y la instancia de Slurmdbd.
-
DBMSDatabaseName: el nombre de la base de datos.
-
DBMSUsername: el nombre de usuario de la base de datos.
-
DBMSPasswordSecretArn: el secreto que contiene la contraseña de la base de datos.
-
DBMSUri: el URI del servidor de la base de datos.
Configuraciones de la instancia
-
InstanceType: un tipo de instancia para usar en la instancia de slurmdbd.
-
KeyName: un par de claves de Amazon EC2 que se utilizará en la instancia de slurmdbd.
Configuración de Slurmdbd
-
AMIID: una AMI de la instancia de Slurmdbd. La AMI debe ser una AMI de ParallelCluster. La versión de la AMI de ParallelCluster determina la versión de Slurmdbd.
-
MungeKeySecretArn: el secreto que contiene la clave munge que se utiliza para autenticar las comunicaciones entre Slurmdbd y los clústeres.
-
SlurmdbdPort: número de puerto que utiliza el slurmdbd.
-
EnableSlurmdbdSystemService: habilita slurmdbd como servicio del sistema y lo ejecuta cuando se lanza una instancia.
aviso
Si la base de datos se creó con una versión diferente de SlurmDB, no utilice Slurmdbd como servicio del sistema.
Si la base de datos contiene un gran número de entradas, es posible que Slurm Database Daemon (SlurmDBD) tarde decenas de minutos en actualizarse y que no responda durante este intervalo de tiempo.
Antes de actualizar SlurmDB, haga una copia de seguridad de la base de datos. Para obtener más información, consulte la Documentación de Slurm
Paso 2: creación de un clúster con Slurmdbd externo habilitado
La plantilla de AWS CloudFormation proporcionada genera una pila de AWS CloudFormation con algunos resultados definidos.
Desde la AWS Management Console, consulte la pestaña Salidas de la pila de AWS CloudFormation para revisar las entidades creadas. Para habilitar la contabilidad de Slurm, algunas de estas salidas deben usarse en el archivo de configuración de AWS ParallelCluster:
-
SlurmdbdPrivateIp: se utiliza para el parámetro de configuración del clúster SlurmSettings / ExternalSlurmdbd / Host.
-
SlurmdbdPort: se utiliza para el valor del parámetro de configuración del clúster SlurmSettings / ExternalSlurmdbd / Port.
-
AccountingClientSecurityGroup: es el grupo de seguridad que está conectado al nodo principal del clúster y que se define en el parámetro de configuración HeadNode / Networking / AdditionalSecurityGroups.
Además, desde la pestaña Parámetros de la vista de pila de AWS CloudFormation:
-
MungeKeySecretArn: se utiliza para el valor del parámetro de configuración del clúster SlurmSettings / MungeKeySecretArn.
Actualice los parámetros de la base de datos del archivo de configuración del clúster con los valores de salida. Utilice la AWS CLI de pcluster para crear el clúster.
$
pcluster create-cluster -ncluster-3.x
-cpath/to/cluster-config.yaml
Una vez creado el clúster, puede empezar a utilizar comandos de contabilidad Slurm como sacctmgr
o sacct
.
aviso
El tráfico entre ParallelCluster
y el SlurmDB externo no está cifrado. Se recomienda ejecutar el clúster y el SlurmDB externo en una red de confianza.