Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Slurmkustomisasi konfigurasi
Dimulai denganAWS ParallelClusterversi 3.6.0, Anda dapat menyesuaikanslurm.conf
Slurmkonfigurasi dalamAWS ParallelClusterkonfigurasi cluster.
Dalam konfigurasi cluster, Anda dapat menyesuaikanSlurmparameter konfigurasi dengan menggunakan pengaturan konfigurasi cluster berikut:
-
SesuaikanSlurmparameter untuk seluruh cluster dengan menggunakan salah satuSlurmSettings/CustomSlurmSettingsatauCustomSlurmSettingsIncludeFileparameter.AWS ParallelClustergagal jika Anda menentukan keduanya.
-
SesuaikanSlurmparameter untuk antrian dengan menggunakanSlurmQueues/CustomSlurmSettings(dipetakan keSlurmpartisi).
-
SesuaikanSlurmparameter untuk sumber daya komputasi dengan menggunakanSlurmQueues/ComputeResources/CustomSlurmSettings(dipetakan keSlurmsimpul).
Slurmbatas kustomisasi konfigurasi dan pertimbangan saat menggunakanAWS ParallelCluster
-
Untuk
CustomSlurmSettings
danCustomSlurmSettingsIncludeFile
pengaturan, Anda hanya dapat menentukan dan memperbaruislurm.conf
parameter yang termasuk dalamSlurmversiyang didukung olehAWS ParallelClusterversi yang Anda gunakan untuk mengkonfigurasi cluster. -
Jika Anda menentukan kustomSlurmkonfigurasi di salah satu
CustomSlurmSettings
parameter,AWS ParallelClustermelakukan pemeriksaan validasi dan mencegah pengaturan atau pembaruanSlurmparameter konfigurasi yang bertentangan denganAWS ParallelClusterlogika. TheSlurmparameter konfigurasi yang diketahui bertentangan denganAWS ParallelClusterdiidentifikasi dalam daftar penolakan. Daftar penolakan dapat berubah di masa mendatangAWS ParallelClusterversi jika lainnyaSlurmfitur ditambahkan. Untuk informasi selengkapnya, lihat Terdaftar penolakanSlurmparameter konfigurasi untukCustomSlurmSettings. -
AWS ParallelClusterhanya memeriksa apakah parameter ada dalam daftar penolakan.AWS ParallelClustertidak memvalidasi kustom AndaSlurmsintaks parameter konfigurasi atau semantik. Anda bertanggung jawab untuk memvalidasi kebiasaan AndaSlurmparameter konfigurasi. Kustom tidak validSlurmparameter konfigurasi dapat menyebabkanSlurmkegagalan daemon yang dapat menyebabkan kegagalan pembuatan dan pembaruan cluster.
-
Jika Anda menentukan kustomSlurmkonfigurasi di
CustomSlurmSettingsIncludeFile
,AWS ParallelClustertidak melakukan validasi apa pun. -
Anda dapat memperbarui
CustomSlurmSettings
danCustomSlurmSettingsIncludeFile
tanpa berhenti dan memulai armada komputasi. Dalam hal ini,AWS ParallelClustermemulai ulangslurmctld
daemon dan menjalankanscontrol reconfigure
perintah.BeberapaSlurmparameter konfigurasi mungkin memerlukan operasi yang berbeda sebelum perubahan terdaftar di seluruh cluster. Misalnya, mereka mungkin memerlukan restart semua daemon di cluster. Anda bertanggung jawab untuk memverifikasi apakahAWS ParallelClusteroperasi cukup untuk menyebarkan kustom AndaSlurmpengaturan parameter konfigurasi selama pembaruan. Jika Anda menemukan ituAWS ParallelClusteroperasi tidak cukup, Anda bertanggung jawab untuk memberikan tindakan tambahan yang diperlukan untuk menyebarkan pengaturan yang diperbarui seperti yang direkomendasikan diSlurmdokumentasi
.
Terdaftar penolakanSlurmparameter konfigurasi untukCustomSlurmSettings
Tabel berikut mencantumkan parameter denganAWS ParallelClusterversi yang menolak penggunaannya, dimulai dengan versi 3.6.0.CustomSlurmSettings
tidak didukung untukAWS ParallelClusterversi lebih awal dari versi 3.6.0.
Slurmparameter | Deny-terdaftar diAWS ParallelClusterversi |
---|---|
CommunicationParameters |
3.6.0 |
Epilog |
3.6.0 |
GresTypes |
3.6.0 |
LaunchParameters |
3.6.0 |
Prolog |
3.6.0 |
ReconfigFlags |
3.6.0 |
ResumeFailProgram |
3.6.0 |
ResumeProgram |
3.6.0 |
ResumeTimeout |
3.6.0 |
SlurmctldHost |
3.6.0 |
SlurmctldLogFile |
3.6.0 |
SlurmctldParameters |
3.6.0 |
SlurmdLogfile |
3.6.0 |
SlurmUser |
3.6.0 |
SuspendExcNodes |
3.6.0 |
SuspendProgram |
3.6.0 |
SuspendTime |
3.6.0 |
TaskPlugin |
3.6.0 |
TreeWidth |
3.6.0 |
Slurmparameter | Deny-terdaftar diAWS ParallelClusterversi |
---|---|
AccountingStorageType |
3.6.0 |
AccountingStorageHost |
3.6.0 |
AccountingStoragePort |
3.6.0 |
AccountingStorageUser |
3.6.0 |
JobAcctGatherType |
3.6.0 |
Slurmparameter | Deny-terdaftar diAWS ParallelClusterversi |
---|---|
Simpul |
3.6.0 |
PartitionName |
3.6.0 |
ResumeTimeout |
3.6.0 |
Status |
3.6.0 |
SuspendTime |
3.6.0 |
Slurmparameter | Deny-terdaftar diAWS ParallelClusterversi dan versi yang lebih baru |
---|---|
CPU |
3.6.0 |
Fitur |
3.6.0 |
Gres |
3.6.0 |
NodeAddr |
3.6.0 |
NodeHostname |
3.6.0 |
NodeName |
3.6.0 |
Berat Badan |
3.7.0 |