Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Personalización de la configuración de Slurm
A partir de AWS ParallelCluster versión 3.6.0, puede personalizar la slurm.conf
configuración de Slurm en una configuración de clúster AWS ParallelCluster.
En la configuración del clúster, puede personalizar los parámetros Slurm de configuración mediante los siguientes ajustes de configuración del clúster:
-
Personalice los parámetros de Slurm de todo el clúster mediante el parámetro SlurmSettings / CustomSlurmSettings o el parámetro CustomSlurmSettingsIncludeFile. AWS ParallelCluster falla si se especifican ambos.
-
Personalice los parámetros de Slurm de una cola mediante SlurmQueues / CustomSlurmSettings (asignado a las particiones Slurm).
-
Personalice los parámetros de Slurm de un recurso informático mediante SlurmQueues / ComputeResources / CustomSlurmSettings (mapeados a los nodos Slurm).
Límites de personalización de la configuración de Slurm y consideraciones a tener en cuenta al usar AWS ParallelCluster
-
En cuanto a la configuración
CustomSlurmSettings
yCustomSlurmSettingsIncludeFile
, solo puede especificar y actualizar los parámetros deslurm.conf
que estén incluidos en la Slurmversión compatible con la versión AWS ParallelCluster que esté utilizando para configurar un clúster. -
Si especifica configuraciones de Slurm personalizadas en alguno de los parámetros de
CustomSlurmSettings
, AWS ParallelCluster realiza comprobaciones de validación e impide establecer o actualizar los parámetros de configuración de Slurm que entren en conflicto con la lógica AWS ParallelCluster. Los parámetros de configuración de Slurm con los que se sabe que entran en conflicto con AWS ParallelCluster se identifican en las listas de denegación. Las listas de denegación pueden cambiar en futuras versiones de AWS ParallelCluster si se añaden otras funciones de Slurm. Para obtener más información, consulte Parámetros de configuración de Slurm enumerados en denegación para CustomSlurmSettings. -
AWS ParallelCluster solo comprueba si un parámetro está en una lista de denegaciones. AWS ParallelCluster no valida la sintaxis ni la semántica de los parámetros de configuración personalizados de Slurm. Usted es responsable de validar los parámetros de configuración de Slurm personalizados. Los parámetros de configuración personalizados de Slurm no válidos pueden provocar errores en los daemons de Slurm y provocar errores en la creación y actualización del clúster.
-
Si especifica configuraciones personalizadas de Slurm en
CustomSlurmSettingsIncludeFile
, AWS ParallelCluster no realiza ninguna validación. -
Puede actualizar
CustomSlurmSettings
yCustomSlurmSettingsIncludeFile
sin detener ni iniciar la flota de cómputo. En este caso, AWS ParallelCluster reinicia el daemon deslurmctld
y ejecuta el comandoscontrol reconfigure
.Es posible que algunos parámetros de configuración de Slurm requieran operaciones diferentes antes de que se registre un cambio en todo el clúster. Por ejemplo, es posible que requieran el reinicio de todos los daemons del clúster. Usted es responsable de comprobar si las operaciones del AWS ParallelCluster son suficientes para propagar los parámetros de configuración personalizados de Slurm durante las actualizaciones. Si considera que las operaciones de AWS ParallelCluster no son suficientes, es su responsabilidad realizar las acciones adicionales necesarias para propagar la configuración actualizada, tal como se recomienda en la Slurmdocumentación
.
Parámetros de configuración de Slurm enumerados en denegación para CustomSlurmSettings
En las tablas siguientes se enumeran los parámetros con las versiones de AWS ParallelCluster que deniegan su uso, empezando por la versión 3.6.0. CustomSlurmSettings
no es compatible con versiones de AWS ParallelCluster anteriores a la 3.6.0.
Parámetro Slurm | Listado de denegación en las versiones de AWS ParallelCluster |
---|---|
CommunicationParameters |
3.6.0 |
Epilog |
3.6.0 |
GresTypes |
3.6.0 |
LaunchParameters |
3.6.0 |
Prolog |
3.6.0 |
ReconfigFlags |
3.6.0 |
ResumeFailProgram |
3.6.0 |
ResumeProgram |
3.6.0 |
ResumeTimeout |
3.6.0 |
SlurmctldHost |
3.6.0 |
SlurmctldLogFile |
3.6.0 |
SlurmctldParameters |
3.6.0 |
SlurmdLogfile |
3.6.0 |
SlurmUser |
3.6.0 |
SuspendExcNodes |
3.6.0 |
SuspendProgram |
3.6.0 |
SuspendTime |
3.6.0 |
TaskPlugin |
3.6.0 |
TreeWidth |
3.6.0 |
Parámetro Slurm | Listado de denegados en las versiones AWS ParallelCluster |
---|---|
AccountingStorageType |
3.6.0 |
AccountingStorageHost |
3.6.0 |
AccountingStoragePort |
3.6.0 |
AccountingStorageUser |
3.6.0 |
JobAcctGatherType |
3.6.0 |
Parámetro Slurm | Listado de denegados en las versiones AWS ParallelCluster |
---|---|
Nodos |
3.6.0 |
PartitionName |
3.6.0 |
ResumeTimeout |
3.6.0 |
State |
3.6.0 |
SuspendTime |
3.6.0 |
Parámetro Slurm | Incluido en la versión denegada de la versión AWS ParallelCluster y en las versiones posteriores |
---|---|
CPUs |
3.6.0 |
Características |
3.6.0 |
Gres |
3.6.0 |
NodeAddr |
3.6.0 |
NodeHostname |
3.6.0 |
NodeName |
3.6.0 |
Weight |
3.7.0 |