SlurmAnpassung der Konfiguration - AWS ParallelCluster

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

SlurmAnpassung der Konfiguration

Beginnend mitAWS ParallelClusterVersion 3.6.0, Sie können die anpassenslurm.conf SlurmKonfiguration in einemAWS ParallelClusterCluster-Konfiguration.

In der Clusterkonfiguration können Sie anpassenSlurmKonfigurationsparameter mithilfe der folgenden Cluster-Konfigurationseinstellungen:

SlurmEinschränkungen bei der Anpassung der Konfiguration und Überlegungen bei der VerwendungAWS ParallelCluster

  • FürCustomSlurmSettingsundCustomSlurmSettingsIncludeFileEinstellungen, die Sie nur spezifizieren und aktualisieren könnenslurm.confParameter, die in der enthalten sindSlurmAusführungdas wird unterstützt vonAWS ParallelClusterVersion, die Sie verwenden, um einen Cluster zu konfigurieren.

  • Wenn Sie benutzerdefiniert angebenSlurmKonfigurationen in einer derCustomSlurmSettingsParameter,AWS ParallelClusterführt Validierungsprüfungen durch und verhindert das Setzen oder AktualisierenSlurmKonfigurationsparameter, die in Konflikt stehen mitAWS ParallelClusterLogik. DieSlurmKonfigurationsparameter, von denen bekannt ist, dass sie in Konflikt stehenAWS ParallelClustersind in Verweigerungslisten aufgeführt. Die Ablehnungslisten können sich in Zukunft ändernAWS ParallelClusterVersionen, falls andereSlurmFunktionen werden hinzugefügt. Weitere Informationen finden Sie unter Auf der Denim-ListeSlurmKonfigurationsparameter fürCustomSlurmSettings.

  • AWS ParallelClusterprüft nur, ob ein Parameter in einer Sperrliste enthalten ist.AWS ParallelClustervalidiert Ihre benutzerdefinierte Einstellung nichtSlurmSyntax oder Semantik von Konfigurationsparametern. Sie sind dafür verantwortlich, Ihren Benutzerdefiniert zu validierenSlurmKonfigurationsparameter. Ungültiger BenutzerdefiniertSlurmKonfigurationsparameter können folgende Ursachen habenSlurmDaemon-Fehler, die zu Fehlern bei der Clustererstellung und -aktualisierung führen können.

  • Wenn Sie Benutzerdefiniert angebenSlurmKonfigurationen inCustomSlurmSettingsIncludeFile,AWS ParallelClusterführt keine Validierung durch.

  • Sie können aktualisierenCustomSlurmSettingsundCustomSlurmSettingsIncludeFileohne die Rechenflotte anzuhalten und zu starten. In diesem FallAWS ParallelClusterstartet das neuslurmctldDaemon und führt denscontrol reconfigureBefehl.

    EtwasSlurmKonfigurationsparameter erfordern möglicherweise unterschiedliche Operationen, bevor eine Änderung im gesamten Cluster registriert wird. Beispielsweise können sie einen Neustart aller Daemons im Cluster erfordern. Sie sind dafür verantwortlich zu überprüfen, obAWS ParallelClusterOperationen reichen aus, um Ihre benutzerdefinierte Version zu verbreitenSlurmEinstellungen der Konfigurationsparameter bei Updates. Wenn du das findestAWS ParallelClusterDie Operationen reichen nicht aus, es liegt in Ihrer Verantwortung, die zusätzlichen Maßnahmen zu ergreifen, die erforderlich sind, um die aktualisierten Einstellungen zu verbreiten, wie in derSlurmDokumentation.

Auf der Denim-ListeSlurmKonfigurationsparameter fürCustomSlurmSettings

In den folgenden Tabellen sind die Parameter mit denAWS ParallelClusterVersionen, die ihre Verwendung verweigern, beginnend mit Version 3.6.0.CustomSlurmSettingswird nicht unterstützt fürAWS ParallelClusterVersionen vor Version 3.6.0.

Parameter auf Clusterebene, die auf der Denim-Liste stehen:
Slurm Parameter Auf Verweigerliste gesetzt inAWS ParallelClusterVersionen

CommunicationParameters

3.6.0

Epilog

3.6.0

GresTypes

3.6.0

LaunchParameters

3.6.0

Prolog

3.6.0

ReconfigFlags

3.6.0

ResumeFailProgram

3.6.0

ResumeProgram

3.6.0

ResumeTimeout

3.6.0

SlurmctldHost

3.6.0

SlurmctldLogFile

3.6.0

SlurmctldParameters

3.6.0

SlurmdLogfile

3.6.0

SlurmUser

3.6.0

SuspendExcNodes

3.6.0

SuspendProgram

3.6.0

SuspendTime

3.6.0

TaskPlugin

3.6.0

TreeWidth

3.6.0

Parameter auf Clusterebene, die auf der Negativliste stehen, wenngebürtigSlurmIntegration der Buchhaltungist in der Cluster-Konfiguration konfiguriert:
Slurm Parameter Auf Verweigerliste gesetzt inAWS ParallelClusterVersionen

AccountingStorageType

3.6.0

AccountingStorageHost

3.6.0

AccountingStoragePort

3.6.0

AccountingStorageUser

3.6.0

JobAcctGatherType

3.6.0

Parameter auf der Warteschlangenebene (Partitionsebene) auf der Sperrliste für Warteschlangen, die von verwaltet werdenAWS ParallelCluster:
Slurm Parameter Auf Verweigerliste gesetzt inAWS ParallelClusterVersionen

Knoten

3.6.0

PartitionName

3.6.0

ResumeTimeout

3.6.0

Status

3.6.0

SuspendTime

3.6.0

Parameter auf der Ebene der Rechenressourcen (Knoten), die auf der Negativliste stehen, für Rechenressourcen, die von verwaltet werdenAWS ParallelCluster:
Slurm Parameter Auf Verweigerliste gesetzt inAWS ParallelClusterVersion und spätere Versionen

CPUs

3.6.0

Features

3.6.0

Gres

3.6.0

NodeAddr

3.6.0

NodeHostname

3.6.0

NodeName

3.6.0

Gewicht

3.7.0