Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Slurm personalizzazione della configurazione
A partire dalla AWS ParallelCluster versione 3.6.0, è possibile personalizzare il slurm.conf
Slurm configurazione in una configurazione di AWS ParallelCluster cluster.
Nella configurazione del cluster, è possibile personalizzare Slurm parametri di configurazione utilizzando le seguenti impostazioni di configurazione del cluster:
-
Personalizzazione Slurm parametri per l'intero cluster utilizzando il parametro SlurmSettings/CustomSlurmSettingso il CustomSlurmSettingsIncludeFileparametro. AWS ParallelCluster fallisce se si specificano entrambi.
-
Personalizzazione Slurm parametri per una coda utilizzando SlurmQueues/CustomSlurmSettings(mappati su Slurm partizioni).
-
Personalizzazione Slurm parametri per una risorsa di calcolo utilizzando SlurmQueuesComputeResources/CustomSlurmSettings(mappati a Slurm nodi).
Slurm limiti e considerazioni sulla personalizzazione della configurazione durante l'utilizzo AWS ParallelCluster
-
Per
CustomSlurmSettings
eCustomSlurmSettingsIncludeFile
impostazioni, è possibile specificare e aggiornare soloslurm.conf
i parametri inclusi nel Slurm versione supportata dalla AWS ParallelCluster versione utilizzata per configurare un cluster. -
Se si specifica personalizzato Slurm configurazioni in qualsiasi
CustomSlurmSettings
parametro, AWS ParallelCluster esegue controlli di convalida e impedisce l'impostazione o l'aggiornamento Slurm parametri di configurazione che sono in conflitto con AWS ParallelCluster la logica. Il Slurm i parametri di configurazione con cui è noto che sono in conflitto AWS ParallelCluster vengono identificati negli elenchi di rifiuto. Le liste di rifiuto possono cambiare nelle AWS ParallelCluster versioni future se altre Slurm vengono aggiunte funzionalità. Per ulteriori informazioni, consulta Non inserito nell'elenco Slurm parametri di configurazione per CustomSlurmSettings. -
AWS ParallelCluster controlla solo se un parametro è in una lista di rifiuto. AWS ParallelCluster non convalida la tua personalizzazione Slurm sintassi o semantica dei parametri di configurazione. Sei responsabile della convalida della tua personalizzazione Slurm parametri di configurazione. Personalizzazione non valida Slurm i parametri di configurazione possono causare Slurm errori dei daemon che possono causare errori di creazione e aggiornamento del cluster.
-
Se si specifica personalizzato Slurm configurazioni in
CustomSlurmSettingsIncludeFile
, AWS ParallelCluster non esegue alcuna convalida. -
Puoi aggiornare
CustomSlurmSettings
eCustomSlurmSettingsIncludeFile
senza interrompere e avviare la flotta di elaborazione. In questo caso, AWS ParallelCluster riavvia ilslurmctld
demone ed esegue il comando.scontrol reconfigure
Medio Slurm i parametri di configurazione potrebbero richiedere diverse operazioni prima che una modifica venga registrata nell'intero cluster. Ad esempio, potrebbero richiedere il riavvio di tutti i demoni del cluster. L'utente ha la responsabilità di verificare se AWS ParallelCluster le operazioni sono sufficienti per diffondere la personalizzazione Slurm impostazioni dei parametri di configurazione durante gli aggiornamenti. Se ritieni che AWS ParallelCluster le operazioni non siano sufficienti, è tua responsabilità fornire le azioni aggiuntive necessarie per propagare le impostazioni aggiornate, come consigliato nella Slurm documentazione
.
Non inserito nell'elenco Slurm parametri di configurazione per CustomSlurmSettings
Le tabelle seguenti elencano i parametri con le AWS ParallelCluster versioni che ne negano l'uso, a partire dalla versione 3.6.0. CustomSlurmSettings
non è supportato per AWS ParallelCluster le versioni precedenti alla versione 3.6.0.
Slurm parametro | Deny-list nelle versioni AWS ParallelCluster |
---|---|
CommunicationParameters |
3.6.0 |
Epilogo |
3.6.0 |
GresTypes |
3.6.0 |
LaunchParameters |
3.6.0 |
Prolog |
3.6.0 |
ReconfigFlags |
3.6.0 |
ResumeFailProgram |
3.6.0 |
ResumeProgram |
3.6.0 |
ResumeTimeout |
3.6.0 |
SlurmctldHost |
3.6.0 |
SlurmctldLogFile |
3.6.0 |
SlurmctldParameters |
3.6.0 |
SlurmdLogfile |
3.6.0 |
SlurmUser |
3.6.0 |
SuspendExcNodes |
3.6.0 |
SuspendProgram |
3.6.0 |
SuspendTime |
3.6.0 |
TaskPlugin |
3.6.0 |
TreeWidth |
3.6.0 |
Slurm parametro | Deny-list nelle versioni AWS ParallelCluster |
---|---|
AccountingStorageType |
3.6.0 |
AccountingStorageHost |
3.6.0 |
AccountingStoragePort |
3.6.0 |
AccountingStorageUser |
3.6.0 |
JobAcctGatherType |
3.6.0 |
Slurm parametro | Negate nelle versioni AWS ParallelCluster |
---|---|
Nodi |
3.6.0 |
PartitionName |
3.6.0 |
ResumeTimeout |
3.6.0 |
Stato |
3.6.0 |
SuspendTime |
3.6.0 |
Slurm parametro | Deny-list nella versione e nelle versioni successive AWS ParallelCluster |
---|---|
CPUs |
3.6.0 |
Funzionalità |
3.6.0 |
Gres |
3.6.0 |
NodeAddr |
3.6.0 |
NodeHostname |
3.6.0 |
NodeName |
3.6.0 |
Weight |
3.7.0 |