Slurmpersonalizzazione della configurazione - AWS ParallelCluster

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Slurmpersonalizzazione della configurazione

A partire daAWS ParallelClusterversione 3.6.0, è possibile personalizzare ilslurm.conf Slurmconfigurazione in unAWS ParallelClusterconfigurazione del cluster.

Nella configurazione del cluster, è possibile personalizzareSlurmparametri di configurazione utilizzando le seguenti impostazioni di configurazione del cluster:

Slurmlimiti e considerazioni sulla personalizzazione della configurazione durante l'utilizzoAWS ParallelCluster

  • PerCustomSlurmSettingseCustomSlurmSettingsIncludeFileimpostazioni, puoi solo specificare e aggiornareslurm.confparametri che sono inclusi nelSlurmversionequesto è supportato daAWS ParallelClusterversione che stai utilizzando per configurare un cluster.

  • Se si specifica personalizzatoSlurmconfigurazioni in uno qualsiasi deiCustomSlurmSettingsparametri,AWS ParallelClusteresegue controlli di convalida e impedisce l'impostazione o l'aggiornamentoSlurmparametri di configurazione in conflitto conAWS ParallelClusterlogica. LaSlurmparametri di configurazione con cui è noto che sono in conflittoAWS ParallelClustersono identificati nelle liste di rifiuto. Le liste di rifiuto possono cambiare in futuroAWS ParallelClusterversioni di altreSlurmvengono aggiunte funzionalità. Per ulteriori informazioni, consulta Non inserito nell'elencoSlurmparametri di configurazione perCustomSlurmSettings.

  • AWS ParallelClustercontrolla solo se un parametro è in una lista di rifiuto.AWS ParallelClusternon convalida la tua personalizzazioneSlurmsintassi o semantica dei parametri di configurazione. Sei responsabile della convalida della tua personalizzazioneSlurmparametri di configurazione. Personalizzazione non validaSlurmi parametri di configurazione possono causareSlurmerrori dei daemon che possono causare errori di creazione e aggiornamento del cluster.

  • Se si specifica personalizzatoSlurmconfigurazioni inCustomSlurmSettingsIncludeFile,AWS ParallelClusternon esegue alcuna convalida.

  • Puoi aggiornareCustomSlurmSettingseCustomSlurmSettingsIncludeFilesenza arrestare e avviare la flotta di elaborazione. In questo caso,AWS ParallelClusterriavvia ilslurmctlddaemon ed esegue ilscontrol reconfigurecomando.

    AlcuniSlurmi parametri di configurazione potrebbero richiedere operazioni diverse prima che una modifica venga registrata nell'intero cluster. Ad esempio, potrebbero richiedere il riavvio di tutti i demoni del cluster. È tua responsabilità verificare seAWS ParallelClusterle operazioni sono sufficienti per diffondere la tua personalizzazioneSlurmimpostazioni dei parametri di configurazione durante gli aggiornamenti. Se lo troviAWS ParallelClusterle operazioni non sono sufficienti, è tua responsabilità fornire le azioni aggiuntive necessarie per propagare le impostazioni aggiornate, come consigliato nellaSlurmdocumentazione.

Non inserito nell'elencoSlurmparametri di configurazione perCustomSlurmSettings

Nelle tabelle seguenti sono elencati i parametri conAWS ParallelClusterversioni che ne negano l'uso, a partire dalla versione 3.6.0.CustomSlurmSettingsnon è supportato perAWS ParallelClusterversioni precedenti alla versione 3.6.0.

Parametri negati a livello di cluster:
Parametro Slurm Negati inAWS ParallelClusterversioni

CommunicationParameters

3.6.0

epilogo

3.6.0

GresTypes

3.6.0

LaunchParameters

3.6.0

Prolog

3.6.0

ReconfigFlags

3.6.0

ResumeFailProgram

3.6.0

ResumeProgram

3.6.0

ResumeTimeout

3.6.0

SlurmctldHost

3.6.0

SlurmctldLogFile

3.6.0

SlurmctldParameters

3.6.0

SlurmdLogfile

3.6.0

SlurmUser

3.6.0

SuspendExcNodes

3.6.0

SuspendProgram

3.6.0

SuspendTime

3.6.0

TaskPlugin

3.6.0

TreeWidth

3.6.0

Parametri negati a livello di cluster quandonativoSlurmintegrazione contabileè configurato nella configurazione del cluster:
Parametro Slurm Negata inAWS ParallelClusterversioni

AccountingStorageType

3.6.0

AccountingStorageHost

3.6.0

AccountingStoragePort

3.6.0

AccountingStorageUser

3.6.0

JobAcctGatherType

3.6.0

Parametri negati a livello di coda (partizione) per le code gestite daAWS ParallelCluster:
Parametro Slurm Negata inAWS ParallelClusterversioni

Nodi

3.6.0

PartitionName

3.6.0

ResumeTimeout

3.6.0

Stato

3.6.0

SuspendTime

3.6.0

Parametri negati a livello di risorsa di elaborazione (nodo) per la risorsa di elaborazione gestita daAWS ParallelCluster:
Parametro Slurm Negata inAWS ParallelClusterversione e versioni successive

CPU

3.6.0

Funzionalità

3.6.0

Gres

3.6.0

NodeAddr

3.6.0

NodeHostname

3.6.0

NodeName

3.6.0

Weight

3.7.0