Slurmkustomisasi konfigurasi - AWS ParallelCluster

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Slurmkustomisasi konfigurasi

Dimulai denganAWS ParallelClusterversi 3.6.0, Anda dapat menyesuaikanslurm.conf Slurmkonfigurasi dalamAWS ParallelClusterkonfigurasi cluster.

Dalam konfigurasi cluster, Anda dapat menyesuaikanSlurmparameter konfigurasi dengan menggunakan pengaturan konfigurasi cluster berikut:

Slurmbatas kustomisasi konfigurasi dan pertimbangan saat menggunakanAWS ParallelCluster

  • UntukCustomSlurmSettingsdanCustomSlurmSettingsIncludeFilepengaturan, Anda hanya dapat menentukan dan memperbaruislurm.confparameter yang termasuk dalamSlurmversiyang didukung olehAWS ParallelClusterversi yang Anda gunakan untuk mengkonfigurasi cluster.

  • Jika Anda menentukan kustomSlurmkonfigurasi di salah satuCustomSlurmSettingsparameter,AWS ParallelClustermelakukan pemeriksaan validasi dan mencegah pengaturan atau pembaruanSlurmparameter konfigurasi yang bertentangan denganAWS ParallelClusterlogika. TheSlurmparameter konfigurasi yang diketahui bertentangan denganAWS ParallelClusterdiidentifikasi dalam daftar penolakan. Daftar penolakan dapat berubah di masa mendatangAWS ParallelClusterversi jika lainnyaSlurmfitur ditambahkan. Untuk informasi selengkapnya, lihat Terdaftar penolakanSlurmparameter konfigurasi untukCustomSlurmSettings.

  • AWS ParallelClusterhanya memeriksa apakah parameter ada dalam daftar penolakan.AWS ParallelClustertidak memvalidasi kustom AndaSlurmsintaks parameter konfigurasi atau semantik. Anda bertanggung jawab untuk memvalidasi kebiasaan AndaSlurmparameter konfigurasi. Kustom tidak validSlurmparameter konfigurasi dapat menyebabkanSlurmkegagalan daemon yang dapat menyebabkan kegagalan pembuatan dan pembaruan cluster.

  • Jika Anda menentukan kustomSlurmkonfigurasi diCustomSlurmSettingsIncludeFile,AWS ParallelClustertidak melakukan validasi apa pun.

  • Anda dapat memperbaruiCustomSlurmSettingsdanCustomSlurmSettingsIncludeFiletanpa berhenti dan memulai armada komputasi. Dalam hal ini,AWS ParallelClustermemulai ulangslurmctlddaemon dan menjalankanscontrol reconfigureperintah.

    BeberapaSlurmparameter konfigurasi mungkin memerlukan operasi yang berbeda sebelum perubahan terdaftar di seluruh cluster. Misalnya, mereka mungkin memerlukan restart semua daemon di cluster. Anda bertanggung jawab untuk memverifikasi apakahAWS ParallelClusteroperasi cukup untuk menyebarkan kustom AndaSlurmpengaturan parameter konfigurasi selama pembaruan. Jika Anda menemukan ituAWS ParallelClusteroperasi tidak cukup, Anda bertanggung jawab untuk memberikan tindakan tambahan yang diperlukan untuk menyebarkan pengaturan yang diperbarui seperti yang direkomendasikan diSlurmdokumentasi.

Terdaftar penolakanSlurmparameter konfigurasi untukCustomSlurmSettings

Tabel berikut mencantumkan parameter denganAWS ParallelClusterversi yang menolak penggunaannya, dimulai dengan versi 3.6.0.CustomSlurmSettingstidak didukung untukAWS ParallelClusterversi lebih awal dari versi 3.6.0.

Parameter yang terdaftar penolakan di tingkat cluster:
Slurmparameter Deny-terdaftar diAWS ParallelClusterversi

CommunicationParameters

3.6.0

Epilog

3.6.0

GresTypes

3.6.0

LaunchParameters

3.6.0

Prolog

3.6.0

ReconfigFlags

3.6.0

ResumeFailProgram

3.6.0

ResumeProgram

3.6.0

ResumeTimeout

3.6.0

SlurmctldHost

3.6.0

SlurmctldLogFile

3.6.0

SlurmctldParameters

3.6.0

SlurmdLogfile

3.6.0

SlurmUser

3.6.0

SuspendExcNodes

3.6.0

SuspendProgram

3.6.0

SuspendTime

3.6.0

TaskPlugin

3.6.0

TreeWidth

3.6.0

Parameter yang terdaftar penolakan pada tingkat cluster saatasliSlurmintegrasi akuntansidikonfigurasi dalam konfigurasi cluster:
Slurmparameter Deny-terdaftar diAWS ParallelClusterversi

AccountingStorageType

3.6.0

AccountingStorageHost

3.6.0

AccountingStoragePort

3.6.0

AccountingStorageUser

3.6.0

JobAcctGatherType

3.6.0

Parameter yang terdaftar penolakan pada tingkat antrian (partisi) untuk antrian yang dikelola olehAWS ParallelCluster:
Slurmparameter Deny-terdaftar diAWS ParallelClusterversi

Simpul

3.6.0

PartitionName

3.6.0

ResumeTimeout

3.6.0

Status

3.6.0

SuspendTime

3.6.0

Parameter yang terdaftar penolakan pada tingkat sumber daya komputasi (node) untuk sumber daya komputasi yang dikelola olehAWS ParallelCluster:
Slurmparameter Deny-terdaftar diAWS ParallelClusterversi dan versi yang lebih baru

CPU

3.6.0

Fitur

3.6.0

Gres

3.6.0

NodeAddr

3.6.0

NodeHostname

3.6.0

NodeName

3.6.0

Berat Badan

3.7.0