Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Slurmpersonnalisation de la configuration
Commençant parAWS ParallelClusterversion 3.6.0, vous pouvez personnaliser leslurm.conf
Slurmconfiguration dans unAWS ParallelClusterconfiguration du cluster.
Dans la configuration du cluster, vous pouvez personnaliserSlurmparamètres de configuration à l'aide des paramètres de configuration de cluster suivants :
-
PersonnaliserSlurmparamètres pour l'ensemble du cluster en utilisant soit leSlurmSettings/CustomSlurmSettingsou leCustomSlurmSettingsIncludeFileparamètre.AWS ParallelClusteréchoue si vous spécifiez les deux.
-
PersonnaliserSlurmparamètres d'une file d'attente en utilisantSlurmQueues/CustomSlurmSettings(mappé àSlurmcloisons).
-
PersonnaliserSlurmparamètres d'une ressource de calcul en utilisantSlurmQueues/ComputeResources/CustomSlurmSettings(mappé àSlurmnœuds).
Slurmconfiguration, personnalisation, limites et considérations lors de l'utilisationAWS ParallelCluster
-
Pour
CustomSlurmSettings
etCustomSlurmSettingsIncludeFile
paramètres, vous pouvez uniquement spécifier et mettre à jourslurm.conf
paramètres inclus dansSlurmversionqui est soutenu par leAWS ParallelClusterversion que vous utilisez pour configurer un cluster. -
Si vous spécifiez une option personnaliséeSlurmconfigurations dans l'un des
CustomSlurmSettings
paramètres,AWS ParallelClustereffectue des contrôles de validation et empêche le réglage ou la mise à jourSlurmparamètres de configuration en conflit avecAWS ParallelClusterlogique. LeSlurmparamètres de configuration connus pour entrer en conflit avecAWS ParallelClustersont identifiés dans les listes de refus. Les listes de refus peuvent changer à l'avenirAWS ParallelClusterversions d'autresSlurmdes fonctionnalités sont ajoutées. Pour plus d'informations, veuillez consulter Listé par DenySlurmparamètres de configuration pourCustomSlurmSettings. -
AWS ParallelClustervérifie uniquement si un paramètre figure dans une liste de refus.AWS ParallelClusterne valide pas votre personnalisationSlurmsyntaxe ou sémantique des paramètres de configuration. Vous êtes responsable de la validation de votre personnalisationSlurmparamètres de configuration. Personnalisation non valideSlurmles paramètres de configuration peuvent provoquerSlurmdéfaillances de daemon pouvant entraîner des échecs de création et de mise à jour de clusters.
-
Si vous spécifiez une option personnaliséeSlurmconfigurations dans
CustomSlurmSettingsIncludeFile
,AWS ParallelClustern'effectue aucune validation. -
Vous pouvez mettre à jour
CustomSlurmSettings
etCustomSlurmSettingsIncludeFile
sans arrêter ni démarrer le parc informatique. Dans ce cas,AWS ParallelClusterredémarre leslurmctld
daemon et exécute lescontrol reconfigure
commande.CertainsSlurmles paramètres de configuration peuvent nécessiter différentes opérations avant qu'une modification ne soit enregistrée dans l'ensemble du cluster. Par exemple, ils peuvent nécessiter le redémarrage de tous les démons du cluster. Il est de votre responsabilité de vérifier siAWS ParallelClusterles opérations sont suffisantes pour propager votre personnalisationSlurmparamètres de configuration lors des mises à jour. Si tu trouves çaAWS ParallelClusterles opérations ne sont pas suffisantes, il est de votre responsabilité de fournir les actions supplémentaires nécessaires pour propager les paramètres mis à jour, comme recommandé dans leSlurmdocumentation
.
Listé par DenySlurmparamètres de configuration pourCustomSlurmSettings
Les tableaux suivants répertorient les paramètres avecAWS ParallelClusterversions qui refusent leur utilisation, à commencer par la version 3.6.0.CustomSlurmSettings
n'est pas pris en charge pourAWS ParallelClusterversions antérieures à la version 3.6.0.
Slurm paramètre | Listé par Deny dansAWS ParallelClusterversions |
---|---|
CommunicationParameters |
3.6.0 |
Epilogue |
3.6.0 |
GresTypes |
3.6.0 |
LaunchParameters |
3.6.0 |
Prologue |
3.6.0 |
ReconfigFlags |
3.6.0 |
ResumeFailProgram |
3.6.0 |
ResumeProgram |
3.6.0 |
ResumeTimeout |
3.6.0 |
SlurmctldHost |
3.6.0 |
SlurmctldLogFile |
3.6.0 |
SlurmctldParameters |
3.6.0 |
SlurmdLogfile |
3.6.0 |
SlurmUser |
3.6.0 |
SuspendExcNodes |
3.6.0 |
SuspendProgram |
3.6.0 |
SuspendTime |
3.6.0 |
TaskPlugin |
3.6.0 |
TreeWidth |
3.6.0 |
Slurm paramètre | Listé par Deny dansAWS ParallelClusterversions |
---|---|
AccountingStorageType |
3.6.0 |
AccountingStorageHost |
3.6.0 |
AccountingStoragePort |
3.6.0 |
AccountingStorageUser |
3.6.0 |
JobAcctGatherType |
3.6.0 |
Slurm paramètre | Listé par Deny dansAWS ParallelClusterversions |
---|---|
Nœuds |
3.6.0 |
PartitionName |
3.6.0 |
ResumeTimeout |
3.6.0 |
État |
3.6.0 |
SuspendTime |
3.6.0 |
Slurm paramètre | Listé par Deny dansAWS ParallelClusterversion et versions ultérieures |
---|---|
Processeurs |
3.6.0 |
Fonctions |
3.6.0 |
Gres |
3.6.0 |
NodeAddr |
3.6.0 |
NodeHostname |
3.6.0 |
NodeName |
3.6.0 |
Weight |
3.7.0 |