Slurm personnalisation de la configuration - AWS ParallelCluster

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Slurm personnalisation de la configuration

À partir de AWS ParallelCluster la version 3.6.0, vous pouvez personnaliser slurm.conf Slurm configuration dans une configuration de AWS ParallelCluster cluster.

Dans la configuration du cluster, vous pouvez personnaliser Slurm paramètres de configuration à l'aide des paramètres de configuration de cluster suivants :

Slurm configuration, personnalisation, limites et considérations lors de l'utilisation AWS ParallelCluster

  • Pour CustomSlurmSettingsIncludeFile les paramètres CustomSlurmSettings et les paramètres, vous pouvez uniquement spécifier et mettre à jour les slurm.conf paramètres inclus dans Slurm version prise en charge par la AWS ParallelCluster version que vous utilisez pour configurer un cluster.

  • Si vous spécifiez une option personnalisée Slurm configure l'un des CustomSlurmSettings paramètres, AWS ParallelCluster effectue des contrôles de validation et empêche le réglage ou la mise à jour Slurm paramètres de configuration qui entrent en conflit avec AWS ParallelCluster la logique. Le Slurm les paramètres de configuration connus pour entrer en conflit AWS ParallelCluster sont identifiés dans les listes de refus. Les listes de refus peuvent changer dans les AWS ParallelCluster versions futures si d'autres Slurm des fonctionnalités sont ajoutées. Pour de plus amples informations, veuillez consulter Listé par Deny Slurm paramètres de configuration pour CustomSlurmSettings.

  • AWS ParallelCluster vérifie uniquement si un paramètre figure dans une liste de refus. AWS ParallelCluster ne valide pas votre personnalisation Slurm syntaxe ou sémantique des paramètres de configuration. Vous êtes responsable de la validation de votre personnalisation Slurm paramètres de configuration. Personnalisation non valide Slurm les paramètres de configuration peuvent provoquer Slurm défaillances de daemon pouvant entraîner des échecs de création et de mise à jour de clusters.

  • Si vous spécifiez une option personnalisée Slurm configurations dansCustomSlurmSettingsIncludeFile, AWS ParallelCluster n'effectue aucune validation.

  • Vous pouvez mettre à jour CustomSlurmSettings et ce, CustomSlurmSettingsIncludeFile sans arrêter ni démarrer le parc informatique. Dans ce cas, AWS ParallelCluster redémarre le slurmctld daemon et exécute la scontrol reconfigure commande.

    Momentanée Slurm les paramètres de configuration peuvent nécessiter différentes opérations avant qu'une modification ne soit enregistrée dans l'ensemble du cluster. Par exemple, ils peuvent nécessiter le redémarrage de tous les démons du cluster. Vous êtes responsable de vérifier si les AWS ParallelCluster opérations sont suffisantes pour propager votre personnalisation Slurm réglages des paramètres de configuration lors des mises à jour. Si vous estimez que AWS ParallelCluster les opérations ne sont pas suffisantes, il est de votre responsabilité de fournir les actions supplémentaires nécessaires pour propager les paramètres mis à jour, conformément aux recommandations du Slurm documentation.

Listé par Deny Slurm paramètres de configuration pour CustomSlurmSettings

Les tableaux suivants répertorient les paramètres avec les AWS ParallelCluster versions qui refusent leur utilisation, à partir de la version 3.6.0. CustomSlurmSettingsn'est pas pris en charge pour AWS ParallelCluster les versions antérieures à la version 3.6.0.

Paramètres refusés au niveau du cluster :
Slurm paramètre Listé par DENY dans les versions AWS ParallelCluster

CommunicationParameters

3.6.0

Epilogue

3.6.0

GresTypes

3.6.0

LaunchParameters

3.6.0

Prologue

3.6.0

ReconfigFlags

3.6.0

ResumeFailProgram

3.6.0

ResumeProgram

3.6.0

ResumeTimeout

3.6.0

SlurmctldHost

3.6.0

SlurmctldLogFile

3.6.0

SlurmctldParameters

3.6.0

SlurmdLogfile

3.6.0

SlurmUser

3.6.0

SuspendExcNodes

3.6.0

SuspendProgram

3.6.0

SuspendTime

3.6.0

TaskPlugin

3.6.0

TreeWidth

3.6.0

Refuser les paramètres listés au niveau du cluster lorsque le natif Slurm l'intégration de la comptabilité est configurée dans la configuration du cluster :
Slurm paramètre Listé par DENY dans les versions AWS ParallelCluster

AccountingStorageType

3.6.0

AccountingStorageHost

3.6.0

AccountingStoragePort

3.6.0

AccountingStorageUser

3.6.0

JobAcctGatherType

3.6.0

Paramètres refusés au niveau de la file d'attente (partition) pour les files d'attente gérées par : AWS ParallelCluster
Slurm paramètre Listé par DENY dans les versions AWS ParallelCluster

Nœuds

3.6.0

PartitionName

3.6.0

ResumeTimeout

3.6.0

État

3.6.0

SuspendTime

3.6.0

Paramètres listés par refus au niveau de la ressource de calcul (nœud) pour les ressources de calcul gérées par : AWS ParallelCluster
Slurm paramètre Répertorié dans la AWS ParallelCluster version et les versions ultérieures

CPUs

3.6.0

Fonctionnalités

3.6.0

Gres

3.6.0

NodeAddr

3.6.0

NodeHostname

3.6.0

NodeName

3.6.0

Weight

3.7.0