Slurmpersonnalisation de la configuration - AWS ParallelCluster

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Slurmpersonnalisation de la configuration

Commençant parAWS ParallelClusterversion 3.6.0, vous pouvez personnaliser leslurm.conf Slurmconfiguration dans unAWS ParallelClusterconfiguration du cluster.

Dans la configuration du cluster, vous pouvez personnaliserSlurmparamètres de configuration à l'aide des paramètres de configuration de cluster suivants :

Slurmconfiguration, personnalisation, limites et considérations lors de l'utilisationAWS ParallelCluster

  • PourCustomSlurmSettingsetCustomSlurmSettingsIncludeFileparamètres, vous pouvez uniquement spécifier et mettre à jourslurm.confparamètres inclus dansSlurmversionqui est soutenu par leAWS ParallelClusterversion que vous utilisez pour configurer un cluster.

  • Si vous spécifiez une option personnaliséeSlurmconfigurations dans l'un desCustomSlurmSettingsparamètres,AWS ParallelClustereffectue des contrôles de validation et empêche le réglage ou la mise à jourSlurmparamètres de configuration en conflit avecAWS ParallelClusterlogique. LeSlurmparamètres de configuration connus pour entrer en conflit avecAWS ParallelClustersont identifiés dans les listes de refus. Les listes de refus peuvent changer à l'avenirAWS ParallelClusterversions d'autresSlurmdes fonctionnalités sont ajoutées. Pour plus d'informations, veuillez consulter Listé par DenySlurmparamètres de configuration pourCustomSlurmSettings.

  • AWS ParallelClustervérifie uniquement si un paramètre figure dans une liste de refus.AWS ParallelClusterne valide pas votre personnalisationSlurmsyntaxe ou sémantique des paramètres de configuration. Vous êtes responsable de la validation de votre personnalisationSlurmparamètres de configuration. Personnalisation non valideSlurmles paramètres de configuration peuvent provoquerSlurmdéfaillances de daemon pouvant entraîner des échecs de création et de mise à jour de clusters.

  • Si vous spécifiez une option personnaliséeSlurmconfigurations dansCustomSlurmSettingsIncludeFile,AWS ParallelClustern'effectue aucune validation.

  • Vous pouvez mettre à jourCustomSlurmSettingsetCustomSlurmSettingsIncludeFilesans arrêter ni démarrer le parc informatique. Dans ce cas,AWS ParallelClusterredémarre leslurmctlddaemon et exécute lescontrol reconfigurecommande.

    CertainsSlurmles paramètres de configuration peuvent nécessiter différentes opérations avant qu'une modification ne soit enregistrée dans l'ensemble du cluster. Par exemple, ils peuvent nécessiter le redémarrage de tous les démons du cluster. Il est de votre responsabilité de vérifier siAWS ParallelClusterles opérations sont suffisantes pour propager votre personnalisationSlurmparamètres de configuration lors des mises à jour. Si tu trouves çaAWS ParallelClusterles opérations ne sont pas suffisantes, il est de votre responsabilité de fournir les actions supplémentaires nécessaires pour propager les paramètres mis à jour, comme recommandé dans leSlurmdocumentation.

Listé par DenySlurmparamètres de configuration pourCustomSlurmSettings

Les tableaux suivants répertorient les paramètres avecAWS ParallelClusterversions qui refusent leur utilisation, à commencer par la version 3.6.0.CustomSlurmSettingsn'est pas pris en charge pourAWS ParallelClusterversions antérieures à la version 3.6.0.

Paramètres refusés au niveau du cluster :
Slurm paramètre Listé par Deny dansAWS ParallelClusterversions

CommunicationParameters

3.6.0

Epilogue

3.6.0

GresTypes

3.6.0

LaunchParameters

3.6.0

Prologue

3.6.0

ReconfigFlags

3.6.0

ResumeFailProgram

3.6.0

ResumeProgram

3.6.0

ResumeTimeout

3.6.0

SlurmctldHost

3.6.0

SlurmctldLogFile

3.6.0

SlurmctldParameters

3.6.0

SlurmdLogfile

3.6.0

SlurmUser

3.6.0

SuspendExcNodes

3.6.0

SuspendProgram

3.6.0

SuspendTime

3.6.0

TaskPlugin

3.6.0

TreeWidth

3.6.0

Refuser les paramètres listés au niveau du cluster lorsquenatifSlurmintégration de la comptabilitéest configuré dans la configuration du cluster :
Slurm paramètre Listé par Deny dansAWS ParallelClusterversions

AccountingStorageType

3.6.0

AccountingStorageHost

3.6.0

AccountingStoragePort

3.6.0

AccountingStorageUser

3.6.0

JobAcctGatherType

3.6.0

Paramètres refusés au niveau de la file d'attente (partition) pour les files d'attente gérées parAWS ParallelCluster:
Slurm paramètre Listé par Deny dansAWS ParallelClusterversions

Nœuds

3.6.0

PartitionName

3.6.0

ResumeTimeout

3.6.0

État

3.6.0

SuspendTime

3.6.0

Paramètres listés par refus au niveau de la ressource de calcul (nœud) pour les ressources de calcul gérées parAWS ParallelCluster:
Slurm paramètre Listé par Deny dansAWS ParallelClusterversion et versions ultérieures

Processeurs

3.6.0

Fonctions

3.6.0

Gres

3.6.0

NodeAddr

3.6.0

NodeHostname

3.6.0

NodeName

3.6.0

Weight

3.7.0