Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Slurm personnalisation de la configuration
À partir de AWS ParallelCluster la version 3.6.0, vous pouvez personnaliser slurm.conf
Slurm configuration dans une configuration de AWS ParallelCluster cluster.
Dans la configuration du cluster, vous pouvez personnaliser Slurm paramètres de configuration à l'aide des paramètres de configuration de cluster suivants :
-
Personnalisation Slurm paramètres pour l'ensemble du cluster en utilisant le paramètre SlurmSettings/CustomSlurmSettingsou le CustomSlurmSettingsIncludeFileparamètre. AWS ParallelCluster échoue si vous spécifiez les deux.
-
Personnalisation Slurm paramètres d'une file d'attente en utilisant SlurmQueues/CustomSlurmSettings(mappé à Slurm cloisons).
-
Personnalisation Slurm paramètres d'une ressource de calcul en utilisant SlurmQueues/ComputeResources/CustomSlurmSettings(mappé à Slurm nœuds).
Slurm configuration, personnalisation, limites et considérations lors de l'utilisation AWS ParallelCluster
-
Pour
CustomSlurmSettingsIncludeFile
les paramètresCustomSlurmSettings
et les paramètres, vous pouvez uniquement spécifier et mettre à jour lesslurm.conf
paramètres inclus dans Slurm version prise en charge par la AWS ParallelCluster version que vous utilisez pour configurer un cluster. -
Si vous spécifiez une option personnalisée Slurm configure l'un des
CustomSlurmSettings
paramètres, AWS ParallelCluster effectue des contrôles de validation et empêche le réglage ou la mise à jour Slurm paramètres de configuration qui entrent en conflit avec AWS ParallelCluster la logique. Le Slurm les paramètres de configuration connus pour entrer en conflit AWS ParallelCluster sont identifiés dans les listes de refus. Les listes de refus peuvent changer dans les AWS ParallelCluster versions futures si d'autres Slurm des fonctionnalités sont ajoutées. Pour de plus amples informations, veuillez consulter Listé par Deny Slurm paramètres de configuration pour CustomSlurmSettings. -
AWS ParallelCluster vérifie uniquement si un paramètre figure dans une liste de refus. AWS ParallelCluster ne valide pas votre personnalisation Slurm syntaxe ou sémantique des paramètres de configuration. Vous êtes responsable de la validation de votre personnalisation Slurm paramètres de configuration. Personnalisation non valide Slurm les paramètres de configuration peuvent provoquer Slurm défaillances de daemon pouvant entraîner des échecs de création et de mise à jour de clusters.
-
Si vous spécifiez une option personnalisée Slurm configurations dans
CustomSlurmSettingsIncludeFile
, AWS ParallelCluster n'effectue aucune validation. -
Vous pouvez mettre à jour
CustomSlurmSettings
et ce,CustomSlurmSettingsIncludeFile
sans arrêter ni démarrer le parc informatique. Dans ce cas, AWS ParallelCluster redémarre leslurmctld
daemon et exécute lascontrol reconfigure
commande.Momentanée Slurm les paramètres de configuration peuvent nécessiter différentes opérations avant qu'une modification ne soit enregistrée dans l'ensemble du cluster. Par exemple, ils peuvent nécessiter le redémarrage de tous les démons du cluster. Vous êtes responsable de vérifier si les AWS ParallelCluster opérations sont suffisantes pour propager votre personnalisation Slurm réglages des paramètres de configuration lors des mises à jour. Si vous estimez que AWS ParallelCluster les opérations ne sont pas suffisantes, il est de votre responsabilité de fournir les actions supplémentaires nécessaires pour propager les paramètres mis à jour, conformément aux recommandations du Slurm documentation
.
Listé par Deny Slurm paramètres de configuration pour CustomSlurmSettings
Les tableaux suivants répertorient les paramètres avec les AWS ParallelCluster versions qui refusent leur utilisation, à partir de la version 3.6.0. CustomSlurmSettings
n'est pas pris en charge pour AWS ParallelCluster les versions antérieures à la version 3.6.0.
Slurm paramètre | Listé par DENY dans les versions AWS ParallelCluster |
---|---|
CommunicationParameters |
3.6.0 |
Epilogue |
3.6.0 |
GresTypes |
3.6.0 |
LaunchParameters |
3.6.0 |
Prologue |
3.6.0 |
ReconfigFlags |
3.6.0 |
ResumeFailProgram |
3.6.0 |
ResumeProgram |
3.6.0 |
ResumeTimeout |
3.6.0 |
SlurmctldHost |
3.6.0 |
SlurmctldLogFile |
3.6.0 |
SlurmctldParameters |
3.6.0 |
SlurmdLogfile |
3.6.0 |
SlurmUser |
3.6.0 |
SuspendExcNodes |
3.6.0 |
SuspendProgram |
3.6.0 |
SuspendTime |
3.6.0 |
TaskPlugin |
3.6.0 |
TreeWidth |
3.6.0 |
Slurm paramètre | Listé par DENY dans les versions AWS ParallelCluster |
---|---|
AccountingStorageType |
3.6.0 |
AccountingStorageHost |
3.6.0 |
AccountingStoragePort |
3.6.0 |
AccountingStorageUser |
3.6.0 |
JobAcctGatherType |
3.6.0 |
Slurm paramètre | Listé par DENY dans les versions AWS ParallelCluster |
---|---|
Nœuds |
3.6.0 |
PartitionName |
3.6.0 |
ResumeTimeout |
3.6.0 |
État |
3.6.0 |
SuspendTime |
3.6.0 |
Slurm paramètre | Répertorié dans la AWS ParallelCluster version et les versions ultérieures |
---|---|
CPUs |
3.6.0 |
Fonctionnalités |
3.6.0 |
Gres |
3.6.0 |
NodeAddr |
3.6.0 |
NodeHostname |
3.6.0 |
NodeName |
3.6.0 |
Weight |
3.7.0 |