Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Slurmpersonalizzazione della configurazione
A partire daAWS ParallelClusterversione 3.6.0, è possibile personalizzare ilslurm.conf
Slurmconfigurazione in unAWS ParallelClusterconfigurazione del cluster.
Nella configurazione del cluster, è possibile personalizzareSlurmparametri di configurazione utilizzando le seguenti impostazioni di configurazione del cluster:
-
PersonalizzaSlurmparametri per l'intero cluster utilizzando uno deiSlurmSettings/CustomSlurmSettingso ilCustomSlurmSettingsIncludeFileparametro.AWS ParallelClusterfallisce se si specificano entrambi.
-
PersonalizzaSlurmparametri per una coda utilizzandoSlurmQueues/CustomSlurmSettings(mappato suSlurmpartizioni).
-
PersonalizzaSlurmparametri per una risorsa di calcolo utilizzandoSlurmQueues/ComputeResources/CustomSlurmSettings(mappato suSlurmnodi).
Slurmlimiti e considerazioni sulla personalizzazione della configurazione durante l'utilizzoAWS ParallelCluster
-
Per
CustomSlurmSettings
eCustomSlurmSettingsIncludeFile
impostazioni, puoi solo specificare e aggiornareslurm.conf
parametri che sono inclusi nelSlurmversionequesto è supportato daAWS ParallelClusterversione che stai utilizzando per configurare un cluster. -
Se si specifica personalizzatoSlurmconfigurazioni in uno qualsiasi dei
CustomSlurmSettings
parametri,AWS ParallelClusteresegue controlli di convalida e impedisce l'impostazione o l'aggiornamentoSlurmparametri di configurazione in conflitto conAWS ParallelClusterlogica. LaSlurmparametri di configurazione con cui è noto che sono in conflittoAWS ParallelClustersono identificati nelle liste di rifiuto. Le liste di rifiuto possono cambiare in futuroAWS ParallelClusterversioni di altreSlurmvengono aggiunte funzionalità. Per ulteriori informazioni, consulta Non inserito nell'elencoSlurmparametri di configurazione perCustomSlurmSettings. -
AWS ParallelClustercontrolla solo se un parametro è in una lista di rifiuto.AWS ParallelClusternon convalida la tua personalizzazioneSlurmsintassi o semantica dei parametri di configurazione. Sei responsabile della convalida della tua personalizzazioneSlurmparametri di configurazione. Personalizzazione non validaSlurmi parametri di configurazione possono causareSlurmerrori dei daemon che possono causare errori di creazione e aggiornamento del cluster.
-
Se si specifica personalizzatoSlurmconfigurazioni in
CustomSlurmSettingsIncludeFile
,AWS ParallelClusternon esegue alcuna convalida. -
Puoi aggiornare
CustomSlurmSettings
eCustomSlurmSettingsIncludeFile
senza arrestare e avviare la flotta di elaborazione. In questo caso,AWS ParallelClusterriavvia ilslurmctld
daemon ed esegue ilscontrol reconfigure
comando.AlcuniSlurmi parametri di configurazione potrebbero richiedere operazioni diverse prima che una modifica venga registrata nell'intero cluster. Ad esempio, potrebbero richiedere il riavvio di tutti i demoni del cluster. È tua responsabilità verificare seAWS ParallelClusterle operazioni sono sufficienti per diffondere la tua personalizzazioneSlurmimpostazioni dei parametri di configurazione durante gli aggiornamenti. Se lo troviAWS ParallelClusterle operazioni non sono sufficienti, è tua responsabilità fornire le azioni aggiuntive necessarie per propagare le impostazioni aggiornate, come consigliato nellaSlurmdocumentazione
.
Non inserito nell'elencoSlurmparametri di configurazione perCustomSlurmSettings
Nelle tabelle seguenti sono elencati i parametri conAWS ParallelClusterversioni che ne negano l'uso, a partire dalla versione 3.6.0.CustomSlurmSettings
non è supportato perAWS ParallelClusterversioni precedenti alla versione 3.6.0.
Parametro Slurm | Negati inAWS ParallelClusterversioni |
---|---|
CommunicationParameters |
3.6.0 |
epilogo |
3.6.0 |
GresTypes |
3.6.0 |
LaunchParameters |
3.6.0 |
Prolog |
3.6.0 |
ReconfigFlags |
3.6.0 |
ResumeFailProgram |
3.6.0 |
ResumeProgram |
3.6.0 |
ResumeTimeout |
3.6.0 |
SlurmctldHost |
3.6.0 |
SlurmctldLogFile |
3.6.0 |
SlurmctldParameters |
3.6.0 |
SlurmdLogfile |
3.6.0 |
SlurmUser |
3.6.0 |
SuspendExcNodes |
3.6.0 |
SuspendProgram |
3.6.0 |
SuspendTime |
3.6.0 |
TaskPlugin |
3.6.0 |
TreeWidth |
3.6.0 |
Parametro Slurm | Negata inAWS ParallelClusterversioni |
---|---|
AccountingStorageType |
3.6.0 |
AccountingStorageHost |
3.6.0 |
AccountingStoragePort |
3.6.0 |
AccountingStorageUser |
3.6.0 |
JobAcctGatherType |
3.6.0 |
Parametro Slurm | Negata inAWS ParallelClusterversioni |
---|---|
Nodi |
3.6.0 |
PartitionName |
3.6.0 |
ResumeTimeout |
3.6.0 |
Stato |
3.6.0 |
SuspendTime |
3.6.0 |
Parametro Slurm | Negata inAWS ParallelClusterversione e versioni successive |
---|---|
CPU |
3.6.0 |
Funzionalità |
3.6.0 |
Gres |
3.6.0 |
NodeAddr |
3.6.0 |
NodeHostname |
3.6.0 |
NodeName |
3.6.0 |
Weight |
3.7.0 |