Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
SlurmAnpassung der Konfiguration
Beginnend mitAWS ParallelClusterVersion 3.6.0, Sie können die anpassenslurm.conf
SlurmKonfiguration in einemAWS ParallelClusterCluster-Konfiguration.
In der Clusterkonfiguration können Sie anpassenSlurmKonfigurationsparameter mithilfe der folgenden Cluster-Konfigurationseinstellungen:
-
AnpassenSlurmParameter für den gesamten Cluster, indem Sie entwederSlurmSettings/CustomSlurmSettingsoder derCustomSlurmSettingsIncludeFileParameter.AWS ParallelClusterschlägt fehl, wenn Sie beide angeben.
-
AnpassenSlurmParameter für eine Warteschlange mithilfe vonSlurmQueues/CustomSlurmSettings(zugeordnet zuSlurmPartitionen).
-
PersonalisierenSlurmParameter für eine Rechenressource mithilfe vonSlurmQueues/ComputeResources/CustomSlurmSettings(zugeordnet zuSlurmKnoten).
SlurmEinschränkungen bei der Anpassung der Konfiguration und Überlegungen bei der VerwendungAWS ParallelCluster
-
Für
CustomSlurmSettings
undCustomSlurmSettingsIncludeFile
Einstellungen, die Sie nur spezifizieren und aktualisieren könnenslurm.conf
Parameter, die in der enthalten sindSlurmAusführungdas wird unterstützt vonAWS ParallelClusterVersion, die Sie verwenden, um einen Cluster zu konfigurieren. -
Wenn Sie benutzerdefiniert angebenSlurmKonfigurationen in einer der
CustomSlurmSettings
Parameter,AWS ParallelClusterführt Validierungsprüfungen durch und verhindert das Setzen oder AktualisierenSlurmKonfigurationsparameter, die in Konflikt stehen mitAWS ParallelClusterLogik. DieSlurmKonfigurationsparameter, von denen bekannt ist, dass sie in Konflikt stehenAWS ParallelClustersind in Verweigerungslisten aufgeführt. Die Ablehnungslisten können sich in Zukunft ändernAWS ParallelClusterVersionen, falls andereSlurmFunktionen werden hinzugefügt. Weitere Informationen finden Sie unter Auf der Denim-ListeSlurmKonfigurationsparameter fürCustomSlurmSettings. -
AWS ParallelClusterprüft nur, ob ein Parameter in einer Sperrliste enthalten ist.AWS ParallelClustervalidiert Ihre benutzerdefinierte Einstellung nichtSlurmSyntax oder Semantik von Konfigurationsparametern. Sie sind dafür verantwortlich, Ihren Benutzerdefiniert zu validierenSlurmKonfigurationsparameter. Ungültiger BenutzerdefiniertSlurmKonfigurationsparameter können folgende Ursachen habenSlurmDaemon-Fehler, die zu Fehlern bei der Clustererstellung und -aktualisierung führen können.
-
Wenn Sie Benutzerdefiniert angebenSlurmKonfigurationen in
CustomSlurmSettingsIncludeFile
,AWS ParallelClusterführt keine Validierung durch. -
Sie können aktualisieren
CustomSlurmSettings
undCustomSlurmSettingsIncludeFile
ohne die Rechenflotte anzuhalten und zu starten. In diesem FallAWS ParallelClusterstartet das neuslurmctld
Daemon und führt denscontrol reconfigure
Befehl.EtwasSlurmKonfigurationsparameter erfordern möglicherweise unterschiedliche Operationen, bevor eine Änderung im gesamten Cluster registriert wird. Beispielsweise können sie einen Neustart aller Daemons im Cluster erfordern. Sie sind dafür verantwortlich zu überprüfen, obAWS ParallelClusterOperationen reichen aus, um Ihre benutzerdefinierte Version zu verbreitenSlurmEinstellungen der Konfigurationsparameter bei Updates. Wenn du das findestAWS ParallelClusterDie Operationen reichen nicht aus, es liegt in Ihrer Verantwortung, die zusätzlichen Maßnahmen zu ergreifen, die erforderlich sind, um die aktualisierten Einstellungen zu verbreiten, wie in derSlurmDokumentation
.
Auf der Denim-ListeSlurmKonfigurationsparameter fürCustomSlurmSettings
In den folgenden Tabellen sind die Parameter mit denAWS ParallelClusterVersionen, die ihre Verwendung verweigern, beginnend mit Version 3.6.0.CustomSlurmSettings
wird nicht unterstützt fürAWS ParallelClusterVersionen vor Version 3.6.0.
Slurm Parameter | Auf Verweigerliste gesetzt inAWS ParallelClusterVersionen |
---|---|
CommunicationParameters |
3.6.0 |
Epilog |
3.6.0 |
GresTypes |
3.6.0 |
LaunchParameters |
3.6.0 |
Prolog |
3.6.0 |
ReconfigFlags |
3.6.0 |
ResumeFailProgram |
3.6.0 |
ResumeProgram |
3.6.0 |
ResumeTimeout |
3.6.0 |
SlurmctldHost |
3.6.0 |
SlurmctldLogFile |
3.6.0 |
SlurmctldParameters |
3.6.0 |
SlurmdLogfile |
3.6.0 |
SlurmUser |
3.6.0 |
SuspendExcNodes |
3.6.0 |
SuspendProgram |
3.6.0 |
SuspendTime |
3.6.0 |
TaskPlugin |
3.6.0 |
TreeWidth |
3.6.0 |
Slurm Parameter | Auf Verweigerliste gesetzt inAWS ParallelClusterVersionen |
---|---|
AccountingStorageType |
3.6.0 |
AccountingStorageHost |
3.6.0 |
AccountingStoragePort |
3.6.0 |
AccountingStorageUser |
3.6.0 |
JobAcctGatherType |
3.6.0 |
Slurm Parameter | Auf Verweigerliste gesetzt inAWS ParallelClusterVersionen |
---|---|
Knoten |
3.6.0 |
PartitionName |
3.6.0 |
ResumeTimeout |
3.6.0 |
Status |
3.6.0 |
SuspendTime |
3.6.0 |
Slurm Parameter | Auf Verweigerliste gesetzt inAWS ParallelClusterVersion und spätere Versionen |
---|---|
CPUs |
3.6.0 |
Features |
3.6.0 |
Gres |
3.6.0 |
NodeAddr |
3.6.0 |
NodeHostname |
3.6.0 |
NodeName |
3.6.0 |
Gewicht |
3.7.0 |