Kami menggunakan cookie penting serta alat serupa yang diperlukan untuk menyediakan situs dan layanan. Kami menggunakan cookie performa untuk mengumpulkan statistik anonim sehingga kami dapat memahami cara pelanggan menggunakan situs dan melakukan perbaikan. Cookie penting tidak dapat dinonaktifkan, tetapi Anda dapat mengklik “Kustom” atau “Tolak” untuk menolak cookie performa.
Jika Anda setuju, AWS dan pihak ketiga yang disetujui juga akan menggunakan cookie untuk menyediakan fitur situs yang berguna, mengingat preferensi Anda, dan menampilkan konten yang relevan, termasuk iklan yang relevan. Untuk menerima atau menolak semua cookie yang tidak penting, klik “Terima” atau “Tolak”. Untuk membuat pilihan yang lebih detail, klik “Kustomisasi”.
Sesuaikan preferensi cookie
Kami menggunakan cookie dan alat yang serupa (secara kolektif, “cookie”) untuk tujuan berikut.
Penting
Cookie ini diperlukan untuk menjalankan situs dan layanan kami dan tidak dapat dinonaktifkan. Cookie biasanya tersusun hanya sebagai tanggapan atas tindakan Anda di situs, seperti mengatur preferensi privasi, masuk, atau mengisi formulir.
Kinerja
Cookie kinerja menyediakan statistik anonim tentang cara pelanggan menavigasi situs kami sehingga kami dapat menyempurnakan pengalaman dan kinerja situs. Pihak ketiga yang disetujui dapat melakukan analisis atas nama kami, tetapi tidak dapat menggunakan data untuk tujuannya sendiri.
Diizinkan
Fungsional
Cookie fungsional membantu kami menyediakan berbagai fitur bermanfaat, mengingat preferensi Anda, dan menampilkan konten yang relevan pada situs. Pihak ketiga yang disetujui dapat mengatur cookie ini untuk menyediakan fitur tertentu pada situs. Jika Anda tidak mengizinkan cookie ini, maka beberapa atau semua layanan ini mungkin tidak berjalan dengan baik.
Diizinkan
Iklan
Cookie ini dapat diatur melalui situs kami oleh mitra iklan dan membantu kami mempersonalisasi konten pemasaran. Jika Anda tidak mengizinkan cookie, Anda akan mendapatkan iklan yang kurang relevan.
Diizinkan
Memblokir beberapa jenis cookie dapat memengaruhi pengalaman Anda di situs kami. Anda dapat mengubah preferensi cookie kapan saja dengan mengklik Preferensi cookie di footer situs ini. Untuk mempelajari lebih lanjut tentang bagaimana kami dan pihak ketiga yang disetujui menggunakan cookie di situs kami, silakan baca di jendela baru.
Tidak dapat menyimpan preferensi cookie
Kami hanya akan menyimpan cookie penting saat ini, karena kami tidak dapat menyimpan preferensi cookie Anda.
Jika Anda ingin mengubah preferensi cookie, coba lagi nanti menggunakan tautan di footer konsol AWS, atau hubungi dukungan jika masalah berlanjut.
Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Tabel berikut menjelaskan pembaruan utama dan fitur baru untuk Panduan AWS ParallelCluster Pengguna. Kami juga rutin memperbarui dokumentasi untuk menjawab umpan balik yang Anda kirimkan kepada kami.
Perubahan
Deskripsi
Tanggal
AWS ParallelCluster versi 3.12.0 dirilis
Kami sangat senang mengumumkan rilis AWS ParallelCluster 3.12.0.
Untuk meningkatkan, masukkan yang berikut ini:sudo pip install --upgrade aws-parallelcluster.
Perangkat tambahan:
Tambahkan bagian konfigurasi gambar build baru Build/Installation untuk mengaktifkan/menonaktifkan perangkat lunak NVIDIA dan instalasi klien Lustre. Secara default, perangkat lunak NVIDIA, meskipun termasuk dalam resmi ParallelCluster AMIs, tidak diinstal olehbuild-image. Secara default, klien Lustre diinstal.
Perintah CLI export-cluster-logs dan sekarang export-image-logs dapat secara default mengekspor log ke ParallelCluster bucket default atau ke customs3Bucket jika ditentukan dalam konfigurasi.
Perluas dukungan Amazon DCV ke Ubuntu2204 pada instans ARM.
Perubahan:
Tingkatkan driver NVIDIA ke versi 550.127.08 (dari 550.90.07). Ini membahas masalah yang diketahui dari NVIDIA. Untuk informasi selengkapnya, lihat Masalah yang Diketahui di Dokumentasi Pusat Data NVIDIA.
Tingkatkan Amazon DCV ke versi2024.0-18131.
server: 2024.0-18131-1
xdcv: 2024.0.631-1
gl: 2024.0.1078-1
penampil web: 2024.0-18131-1
Tingkatkan penginstal EFA ke. 1.36.0
Pengemudi EFA: efa-2.13.0-1
Konfigurasi EFA: efa-config-1.17-1
Profil EFA: efa-profile-1.7-1
Libfabric-AWS: libfabric-aws-1.22.0-1
RDMA-inti: rdma-core-54.0-1
Buka MPI: openmpi40-aws-4.1.7-1 dan openmpi50-aws-5.0.5
Restart otomatis slurmctld pada kegagalan.
Tingkatkan mysql-community-client ke versi 8.0.39.
Hapus dukungan untuk Python 3.7 dan 3.8, yang merupakan akhir dari masa pakai.
Perbaikan bug:
Memperbaiki masalah di mana perubahan dalam urutan skrip tindakan kustom tidak terdeteksi selama pembaruan klaster.
Tambahkan izin yang hilang untuk AWS ParallelCluster API untuk membuat peran terkait layanan untuk Elastic Load Balancing dan Auto Scaling, yang diperlukan untuk menerapkan node login.
Perbaiki masalah dalam cara kami mendapatkan wilayah saat mengelola volume sehingga dapat menangani zona lokal dengan benar.
Perbaiki masalah saat menambahkan sistem file EFS AccessPointIds selama pembaruan akan gagal.
Perbaiki masalah saat menggunakan PCAPI, pembaruan cluster bisa gagal saat memperbarui parameter yang bukan tipe String (misalnya,MaxCount).
Saat memasang OpenZFS eksternal, tidak lagi diperlukan untuk menetapkan aturan keluar untuk port 111, 2049, 20001, 20002, 20003.
Desember 19, 2024
Penyedia Terraform untuk 1.1.0 dirilis AWS ParallelCluster
Kami dengan senang hati mengumumkan rilis Penyedia Terraform untuk 1.1.0. AWS ParallelCluster
Perbaikan bug:
Memperbaiki masalah yang menyebabkan kegagalan terraform-apply saat ParallelCluster API 3.11.x digunakan untuk menyebarkan cluster dengan node login.
Desember 6, 2024
Modul Terraform untuk 1.1.0 dirilis AWS ParallelCluster
Kami sangat senang mengumumkan rilis Modul Terraform untuk 1.1.0. AWS ParallelCluster
Perubahan:
Gunakan AWS ParallelCluster Terraform Provider 1.x di semua contoh modul.
Gunakan ParallelCluster API 3.11.1 di semua contoh dengan API nama ParallelCluster tumpukan.
Menyebarkan node login di semua contoh modul.
Desember 6, 2024
Versi PCUI 2024.11.0 dirilis
Versi PCUI 2024.11.0 dirilis
Perbaikan bug:
Secara eksplisit menetapkan kebijakan untuk repositori pribadi ECR untuk mencegah penghapusan kebijakan pada pembaruan tumpukan yang memengaruhi fungsi Lambda. Kebijakan ini mencakup izin yang diperlukan oleh fungsi Lambda untuk mengambil kode.
November 22, 2024
Versi PCUI 2024.10.0 dirilis
Versi PCUI 2024.10.0 dirilis
Perubahan:
Tambahkan dukungan untuk AWS ParallelCluster 3.11.1.
Tambahkan dukungan untuk Reservasi Kapasitas Sesuai Permintaan dan Blok Kapasitas di wizard.
Tambahkan keluarga g6, m7, dan p5 ke daftar jenis instans yang didukung di wizard.
Tambahkan parameter opsional tumpukan baru untuk mengonfigurasi domain khusus untuk PCUI dan Cognito.
Perbaikan bug:
Memperbaiki bug yang melanggar pengaturan domain kustom.
Keamanan:
Tingkatkan Flask-CORS dari 3.0.10 ke 4.0.2 untuk mengatasi kerentanan CVE-2024-6221.
Tingkatkan lint-staged dari 13.0.3 ke 15.2.5 untuk mengatasi kerentanan CVE-2024-4068.
Perbaiki masalah dalam cara kami mengonfigurasi plugin Pyxis Slurm ParallelCluster yang dapat menyebabkan kegagalan pengiriman pekerjaan.
Perbaiki masalah yang menyebabkan kegagalan penerapan dalam konfigurasi dengan node login dengan menambahkan izin yang hilang yang diperlukan oleh node login di templat kebijakan publik. https://github.com/aws/aws-parallelcluster/masalah/6483
Oktober 21, 2024
AWS ParallelCluster versi 3.11.0 dirilis
Kami sangat senang mengumumkan rilis 3.11.0 AWS ParallelCluster
Enchancements
Tambahkan dukungan untuk tindakan kustom pada node login.
Izinkan koneksi DCV ke node login.
Tambahkan dukungan untuk wilayah ap-southeast-3.
Tambahkan grup keamanan untuk login penyeimbang beban jaringan node.
Tambahkan AllowedIps konfigurasi untuk node login.
Tambahkan konfigurasi baru SharedStorage/EfsSettings/AccessPointId untuk menentukan titik akses EFS opsional untuk pemasangan
Izinkan hingga 10 kumpulan node login.
Instal enroot dan pyxis di pcluster resmi AMIs
Perubahan
[BREAKING] loginNodes Bidang yang dikembalikan oleh API DescribeCluster dan perintah CLI describe-cluster telah diubah dari kamus ke array untuk mendukung beberapa kumpulan node login. Perubahan ini merusak kompatibilitas mundur, membuat operasi ini tidak kompatibel dengan cluster yang digunakan dengan versi yang lebih lama.
Tingkatkan Slurm ke 23.11.10 (dari 23.11.7).
Tingkatkan Pmix ke 5.0.3 (dari 5.0.2).
Tingkatkan penginstal EFA ke. 1.34.0
Pengemudi EFA: efa-2.10.0-1
Konfigurasi EFA: efa-config-1.17-1
Profil EFA: efa-profile-1.7-1
Libfabric-AWS: libfabric-aws-1.22.0-1
RDMA-inti: rdma-core-52.0-1
Buka MPI: openmpi40-aws-4.1.6-3 dan openmpi50-aws-5.0.3-11
Tingkatkan driver NVIDIA ke versi 550.90.07 (dari 535.183.01).
Tingkatkan CUDA Toolkit ke versi 12.4.1 (dari 12.2.2).
Upgrade Python ke 3.9.20 (dari 3.9.19).
Tingkatkan Perpustakaan Intel MPI ke 2021.13.1.769 (dari 2021.12.1.8).
Perbaikan bug
Perbaiki validator EfaPlacementGroupValidator sehingga tidak menyarankan untuk mengkonfigurasi Grup Penempatan saat Blok Kapasitas digunakan.
Perbaiki kegagalan pembuatan cluster sesekali dengan memastikan bahwa FSx untuk sistem file Lustre dibuat setelah aturan grup keamanan.
Perbaiki kegagalan penghapusan cluster saat grup penempatan diaktifkan.
Perbaiki masalah dengan node login yang ditandai tidak sehat saat membatasi akses SSH.
Perbaiki retrieve_supported_regions sehingga bisa mendapatkan url S3 yang benar.
Perbaiki describe_images untuk menggunakan pagination.
Perbaiki No route tables found bug saat menentukan LoginNodes subnet VPC default ke/Networking/. SubnetIds
September 26, 2024
AWS ParallelCluster versi 3.10.1 dirilis
Kami sangat senang mengumumkan rilis 3.10.1 AWS ParallelCluster
Perbaikan bug
Perbaiki kegagalan pembuatan gambar di wilayah Tiongkok.
Juli 8, 2024
AWS ParallelCluster versi 3.10.0 dirilis
Kami sangat senang mengumumkan rilis 3.10.0 AWS ParallelCluster
Perangkat tambahan:
Tambahkan bagian konfigurasi baru Scheduling/SlurmSettings/ExternalSlurmdbd untuk menghubungkan cluster ke Slurmdbd eksternal.
Izinkan build-image dijalankan di jaringan yang terisolasi.
Tambahkan dukungan untuk Amazon Linux 2023.
Tambahkan dukungan untuk price-capacity-optimized sebagaiAllocationStrategy.
Tambahkan validator untuk mencegah penggunaan Grup Penempatan dengan Blok Kapasitas.
Perubahan:
CentOS 7 tidak lagi didukung.
Upgrade Cnc Client ke versi 18.4.12 dari 18.2.7.
Tingkatkan munge ke versi 0.5.16 (dari 0.5.15).
Tingkatkan Pmix ke 5.0.2 (dari 4.2.9).
Tingkatkan dependensi buku masak pihak ketiga:
apt-7.5.22 (dari apt-7.5.14)
openssh-2.11.12 (dari openssh-2.11.3)
Hapus buku masak pihak ketiga: selinux-6.1.12.
Tingkatkan penginstal EFA ke. 1.32.0
Pengemudi EFA: efa-2.8.0-1
Konfigurasi EFA: efa-config-1.16-1
Profil EFA: efa-profile-1.7-1
Libfabric-AWS: libfabric-aws-1.21.0-1
RDMA-inti: rdma-core-50.0-1
Buka MPI: openmpi40-aws-4.1.6-3 dan openmpi50-aws-5.0.2-12
Tingkatkan driver NVIDIA ke versi 535.183.01 (dari 535.154.05).
Upgrade Python ke 3.9.19 (dari 3.9.17).
Tingkatkan Perpustakaan Intel MPI ke 2021.12.1.8 (dari 2021.9.0.43482).
Perbaikan bug:
Perbaiki konfigurasi Asosiasi Repositori Data untuk membuat AutoExportPolicy dan AutoImportPolicy opsional.
Memperbaiki masalah selama penghapusan klaster yang sekarang menyelesaikan pembersihan armada komputasi saat instance dalam status shutting-down atau dihentikan. Ini untuk menghindari kegagalan penghapusan cluster untuk tipe instance dengan siklus terminasi yang lebih lama.
Izinkan dasbor cloudwatch diaktifkan dan alarm dinonaktifkan di Monitoring bagian konfigurasi cluster.
Izinkan Sumber Daya ParallelCluster Kustom untuk menekan validator menggunakan. PclusterCluster/SuppressValidators
Menghapus /etc/profile.d/pcluster.sh sehingga tidak dijalankan pada setiap login pengguna dan tidak cfn_bootstrap_virtualenv ditambahkan dalam variabel lingkungan PATH.
Perbaiki spesifikasi ParallelCluster API dengan mengganti field failureReason dengan failures in DescribeCluster response.
Perbaiki spesifikasi ParallelCluster API dengan menambahkan status CloudFormation tumpukan yang hilang:IMPORT_*, REVIEW_IN_PROGRESS danUPDATE_FAILED.
Memperbaiki masalah yang mencegah pembaruan klaster menyertakan sistem file EFS dengan enkripsi dalam perjalanan.
Perbaiki masalah yang mencegah layanan slurmctld dan slurmdbd memulai ulang pada reboot node kepala saat EFS digunakan untuk data internal bersama.
Pada sistem Ubuntu, hapus konfigurasi logrotate default untuk file log cloud-init yang bentrok dengan konfigurasi yang berasal dari Parallelcluster.
Perbaiki kegagalan pembuatan gambar dengan RHEL 8.10 atau yang lebih baru.
27 Juni 2024
Penyedia Terraform untuk AWS ParallelCluster 1.0.0 dirilis
Kami dengan senang hati mengumumkan rilis Penyedia Terraform untuk 1.0.0. AWS ParallelCluster
Kami sangat senang mengumumkan rilis 3.9.1 AWS ParallelCluster
Untuk meningkatkan, masukkan yang berikut ini: sudo pip install --upgrade
aws-parallelcluster
Perbaikan bug
Hapus penghapusan rekursif dari penyimpanan bersama mountdir saat melepas sistem file sebagai bagian dari operasi kluster pembaruan.
April 11, 2024
AWS ParallelCluster versi 3.9.1 dirilis
Kami sangat senang mengumumkan rilis 3.9.1 AWS ParallelCluster
Untuk meningkatkan, masukkan yang berikut ini: sudo pip install --upgrade
aws-parallelcluster
Perbaikan bug
Hapus penghapusan rekursif dari penyimpanan bersama mountdir saat melepas sistem file sebagai bagian dari operasi kluster pembaruan.
April 11, 2024
Versi PCUI 2024.03.0 dirilis
PCUI versi 2024.03.0 dirilis.
Fitur-fitur:
Ditambahkan dukungan untuk AWS ParallelCluster versi 3.9.0
Menambahkan dukungan untuk Ubuntu 22.04 dan Red Hat Enterprise Linux 9
Ubuntu 18.04 yang tidak digunakan lagi
Perbaikan bug
Memperbaiki masalah yang menyebabkan beberapa cluster tidak muncul saat menggunakan banyak cluster
Untuk detail perubahan, lihat CHANGELOG file untuk aws-parallelcluster-uipaket di GitHub.
Maret 12, 2024
AWS ParallelCluster versi 3.9.0 dirilis
Kami sangat senang mengumumkan rilis 3.9.0 AWS ParallelCluster
Untuk meningkatkan, masukkan yang berikut ini: sudo pip install --upgrade
aws-parallelcluster
Penyempurnaan:
Tambahkan parameter konfigurasi DeploymentSettings/DefaultUserHome untuk memungkinkan pengguna memindahkan direktori home pengguna default ke /local/home bukan /home (default).
Izin untuk memperbarui MinCountMaxCount,, Queue dan parameter ComputeResource konfigurasi tanpa perlu menghentikan armada komputasi. Sekarang mungkin untuk memperbaruinya dengan menyetel Scheduling/SlurmSettings/QueueUpdateStrategy ke TERMINATE. AWS ParallelCluster hanya akan menghentikan node yang dihapus selama pengubahan ukuran kapasitas cluster yang dilakukan melalui pembaruan cluster.
Izinkan untuk memperbarui penyimpanan bersama eksternal tipe Efs, FsxLustre FsxOntap, FsxOpenZfs dan FileCache tanpa mengganti armada komputasi dan login.
Tambahkan dukungan untuk RHEL9.
Tambahkan dukungan untuk Rocky Linux 9 seperti yang CustomAmi dibuat melalui build-image proses. Tidak ada resmi publik AWS ParallelCluster Rocky9 Linux AMI yang tersedia saat ini.
Hapus CommunicationParameters dari Custom Slurm Pengaturan menolak daftar.
Tambahkan DeploymentSettings/DisableSudoAccessForDefaultUser parameter untuk menonaktifkan akses sudo pengguna default di didukung OSes.
Perubahan FSx untuk sistem file Lustre yang dibuat oleh ParallelCluster: Ubah versi server Lustre ke 2.15.
Tambahkan kemungkinan untuk memilih antara Driver Nvidia Sumber Terbuka dan Tertutup saat membangun AMI, melalui atribut node ['cluster']['nvidia']['kernel_open'] buku masak.
* Tambahkan opsi konfigurasi clustermgtd ec2_instance_missing_max_count untuk mengizinkan jumlah percobaan ulang yang dapat dikonfigurasi untuk Amazon menjelaskan konsistensi instance dengan instance run. EC2
Perubahan
Peningkatan Slurm ke 23.11.4 (dari 23.02.7).
Tingkatkan driver NVIDIA ke versi 535.154.05.
Tambahkan dukungan untuk Python 3.11, 3.12 di pcluster CLI dan. aws-parallelcluster-batch-cli
Bangun antarmuka jaringan menggunakan indeks kartu jaringan dari NetworkCardIndex daftar EC2 DescribeInstances respons Amazon, alih-alih mengulang rentang. MaximumNetworkCards
Gagal pembuatan cluster saat menggunakan tipe instance P3, G3, P2 dan G2 karena arsitektur GPU mereka tidak kompatibel dengan Open Source Nvidia Drivers (OpenRM) yang diperkenalkan sebagai bagian dari rilis 3.8.0.
Tingkatkan dependensi buku masak pihak ketiga: nfs-5.1.2 (dari nfs-5.0.0)
Tingkatkan penginstal EFA ke 1.30.0.
Pengemudi EFA: efa-2.6.0-1
Konfigurasi EFA: efa-config-1.15-1
Profil EFA: efa-profile-1.6-1
Libfabric-AWS: libfabric-aws-1.19.0
RDMA-inti: rdma-core-46.0-1
Buka MPI: openmpi40-aws-4.1.6-2 dan openmpi50-aws-5.0.0-11
Tingkatkan NICE DCV ke versi 2023.1-16388.
server: 2023.1.16388-1
xdcv: 2023.1.565-1
gl: 2023.1.1047-1
penampil web: 2023.1.16388-1
Perbaikan bug
Perbaiki masalah yang membuat pekerjaan gagal saat dikirimkan sebagai pengguna direktori aktif dari node login. Masalah ini disebabkan oleh konfigurasi integrasi yang tidak lengkap dengan Direktori Aktif eksternal pada node kepala.
Refactor kebijakan IAM yang ditentukan dalam CloudFormation template parallelclutser-policies.yaml untuk mencegah kegagalan penerapan API yang disebabkan oleh kebijakan yang melebihi batas IAM. ParallelCluster
Perbaiki masalah membuat node login gagal bootstrap ketika node kepala membutuhkan waktu lebih lama dari yang diharapkan dalam menulis kunci.
Untuk detail perubahan, lihat CHANGELOG file untuk aws-parallelcluster-uipaket di GitHub.
Maret 5, 2024
Versi PCUI 2024.02.0 dirilis
Versi PCUI 2024.02.0 dirilis
Perubahan:
Memperbarui lingkungan runtime Lambda ke Python v3.9
Untuk detail perubahan, lihat CHANGELOG file untuk aws-parallelcluster-uipaket di GitHub.
Tambahkan dukungan untuk Amazon EC2 Capacity Blocks untuk ML.
Tambahkan dukungan untuk Rocky Linux 8 seperti yang CustomAmi dibuat melalui build-image proses. Tidak ada resmi publik AWS ParallelCluster Rocky8 Linux AMI yang tersedia saat ini.
Tambahkan Scheduling/ScalingStrategy parameter untuk mengontrol strategi penskalaan klaster yang akan digunakan saat meluncurkan EC2 instans Amazon Slurm menghitung node. Nilai yang mungkin adalah all-or-nothinggreedy-all-or-nothingbest-effort,, dengan all-or-nothing menjadi default.
Tambahkan HeadNode/SharedStorageType parameter untuk menggunakan penyimpanan EFS alih-alih ekspor NFS dari volume root node kepala untuk sumber daya sistem file bersama intra-cluster: ParallelCluster, Intel, Slurm, dan data. /home Peningkatan ini mengurangi beban pada jaringan node kepala.
Izinkan pemasangan /home sebagai EFS atau penyimpanan bersama FSx eksternal melalui SharedStorage bagian file konfigurasi.
Tambahkan parameter baru SlurmSettings/MungeKeySecretArn untuk mengizinkan penggunaan kunci MUNGE yang ditentukan pengguna eksternal dari Secrets Manager AWS .
Tambahkan Monitoring/Alarms/Enabled parameter untuk mengaktifkan CloudWatch Alarm Amazon untuk cluster.
Tambahkan alarm node kepala untuk memantau pemeriksaan EC2 kesehatan Amazon, pemanfaatan CPU, dan status keseluruhan node kepala, dan tambahkan ke CloudWatch Dasbor yang dibuat dengan cluster.
Tambahkan dukungan untuk Asosiasi Repositori Data saat menggunakan PERSISTENT_2 as DeploymentType untuk Lustre yang dikelola FSx .
Tambahkan Scheduling/SlurmSettings/Database/DatabaseName parameter untuk memungkinkan pengguna menentukan nama kustom untuk database di server database yang akan digunakan Slurm akuntansi.
InstanceTypeBuat parameter konfigurasi opsional saat mengonfigurasi sumber CapacityReservationTarget/CapacityReservationId daya komputasi.
Tambahkan kemungkinan untuk menentukan awalan untuk peran dan kebijakan IAM yang dibuat oleh AWS ParallelCluster API.
Tambahkan kemungkinan untuk menentukan batas izin yang akan diterapkan untuk peran dan kebijakan IAM yang dibuat oleh API. AWS ParallelCluster
Perubahan
Peningkatan Slurm ke 23.02.7 (dari 23.02.6).
Tingkatkan driver NVIDIA ke versi 535.129.03.
Tingkatkan CUDA Toolkit ke versi 12.2.2.
Gunakan driver GPU NVIDIA Open Source (OpenRM) sebagai modul kernel NVIDIA untuk Linux alih-alih modul sumber tertutup NVIDIA.
Hapus dukungan parameter all_or_nothing_batch konfigurasi di Slurm melanjutkan program, mendukung konfigurasi Scheduling/ScalingStrategy cluster baru.
Mengubah konvensi penamaan alarm cluster menjadi '[cluster-name] - [component-name] - [metric]'.
Ubah tipe volume EBS default di wilayah ADC dari gp2 ke gp3, untuk volume root dan tambahan.
Batas izin opsional untuk AWS ParallelCluster API sekarang diterapkan ke setiap peran IAM yang dibuat oleh infrastruktur API.
Tingkatkan penginstal EFA ke. 1.29.1
Pengemudi EFA: efa-2.6.0-1
Konfigurasi EFA: efa-config-1.15-1
Profil EFA: efa-profile-1.5-1
Libfabric-AWS: libfabric-aws-1.19.0-1
RDMA-inti: rdma-core-46.0-1
Buka MPI: openmpi40-aws-4.1.6-1
Tingkatkan GDRCopy ke versi 2.4 di semua yang didukung OSes, kecuali untuk Centos 7 di mana versi 2.3.1 digunakan.
Tingkatkan aws-cfn-bootstrap ke versi 2.0-28.
Tambahkan dukungan untuk Python 3.10 in. aws-parallelcluster-batch-cli
Perbaikan bug
Perbaiki konfigurasi penskalaan yang tidak konsisten setelah rollback pembaruan cluster saat memodifikasi daftar jenis instance yang dideklarasikan dalam Sumber Daya Komputasi.
Perbaiki pengguna pembuatan kunci SSH saat mengganti pengguna tanpa hak akses root di cluster yang terintegrasi dengan server LDAP eksternal melalui file konfigurasi cluster.
Perbaiki penonaktifan Slurm mode hemat daya saat mengaturScaledownIdletime =
-1.
Perbaiki jalur hard-code ke Slurm direktori instalasi dalam update_slurm_database_password.sh skrip untuk Slurm Akuntansi.
Menambahkan dukungan untuk ParallelCluster 3.7.2 dengan paritas fitur di wizard terbatas pada FSx File Cache dan kompatibilitas penjadwalan berbasis memori dengan beberapa jenis instance.
Perbaikan bug:
Memperbaiki masalah yang menyebabkan kesalahan UI saat PCUI tidak memiliki izin untuk berinteraksi dengan Cost Explorer.
Perbaikan
Meningkatkan keamanan dengan mengurangi token akses TTL dari 10 menit menjadi 5 menit.
Untuk detail perubahan, lihat CHANGELOG file untuk aws-parallelcluster-uipaket di GitHub.
Support konfigurasi prioritas node statis dan dinamis dalam sumber daya komputasi dengan menggunakan file YAMM AWS ParallelCluster konfigurasi.
Tambahkan dukungan untuk Ubuntu 22. Kunci RSA tidak didukung secara default.
Tambahkan pengaturan konfigurasi antrian JobExclusiveAllocation untuk mengalokasikan node dalam partisi secara eksklusif ke satu pekerjaan pada waktu tertentu.
Izinkan aws-parallelcluster-node paket Override pada waktu pembuatan cluster dan pembaruan cluster. Untuk node kepala, ini berlaku untuk pembaruan cluster. Berguna untuk tujuan pengembangan saja.
Hindari server NFS dimulai pada node komputasi.
Tambahkan dukungan untuk node log-in.
Izinkan penjadwalan berbasis memori ketika beberapa jenis instans ditentukan untuk Slurm Sumber Daya Hitung.
Tambahkan dukungan untuk memasang Cache File Amazon yang ada sebagai penyimpanan bersama.
Perubahan:
Menetapkan Slurm node dinamis prioritas (berat) 1000 secara default. Dengan melakukan ini, Slurm dapat memprioritaskan node statis idle di atas node dinamis idle.
Buat aws-parallelcluster-node daemon hanya menangani terkelola AWS ParallelCluster
Slurm partisi.
EFS-utilsTingkatkan interval polling pengawas menjadi 10 detik. Perubahan ini berlaku ketika EncryptionInTransit disetel ketrue, yang merupakan satu-satunya kondisi yang menyebabkan pengawas berjalan.
Ubah nilai default Imds/ ImdsSupport dari v1.0 ke v2.0.
Ubuntu 18 tidak digunakan lagi.
Perbarui ukuran volume root default menjadi 40 GB untuk memperhitungkan batasan pada Centos 7.
Batasi izin pada file /tmp/wait _condition_handle.txt di dalam node kepala sehingga hanya root yang dapat membacanya.
Buat Slurm partisi-nodelist memetakan file JSON untuk digunakan oleh daemon paket node untuk mengenali PC-managed Slurm partisi dan nodelist.
Tingkatkan driver NVIDIA ke versi 535.54.03.
Tingkatkan pustaka CUDA ke versi 12.2.0.
Tingkatkan manajer NVIDIA Fabric ke nvidia-fabricmanager-535.
Upgrade ARM PL ke versi 23.04.1 hanya untuk Ubuntu 22.04.
Tingkatkan NICE DCV ke versi. 2023.0-15487
Server: 2023.0.15487-1
xdcv: 2023.0.551-1
gl: 2023.0.1039-1
penampil web: 2023.0.15487-1
Perbaikan bug:
Tambahkan validasi ke ScaledownIdletime nilai, untuk mencegah pengaturan nilai yang lebih rendah dari -1.
Perbaiki kegagalan pembuatan cluster dengan Ubuntu Deep Learning AMI pada instance GPU dengan DCV diaktifkan.
Perbaiki masalah yang menyebabkan kebijakan IAM yang menggantung dibuat saat membuat penyedia sumber daya ParallelCluster CloudFormation khusus dengan. CustomLambdaRole
Memperbaiki masalah yang menyebabkan ketidaksejajaran nama DNS node komputasi pada instance dengan beberapa antarmuka jaringan, saat menggunakan sama dengan SlurmSettings/Dns/UseEc2HostnamesTrue
Hindari duplikasi node yang dilihat oleh clustermgtd jika node komputasi ditambahkan ke beberapa Slurm partisi.
Perbaikan bug:
Hapus hard coding nama perangkat volume root (/dev/sda1dan/dev/xvda) dan ambil dari AMI yang digunakan selamacreate-cluster.
Perbaiki kegagalan pembuatan cluster saat menggunakan sumber daya CloudFormation khusus dengan ElasticIp disetel keTrue.
Perbaiki kegagalan pembuatan dan perbarui cluster saat menggunakan sumber daya AWS CloudFormation khusus dengan file konfigurasi besar.
Perbaiki masalah yang mencegah ptrace perlindungan dinonaktifkan di Ubuntu dan yang tidak mengizinkan Cross Memory Attach (CMA) di libfabric.
Perbaiki logika fail-over kapasitas yang tidak mencukupi dengan cepat saat menggunakan beberapa jenis instans dan tidak ada instance yang dikembalikan.
Tingkatkan batas jumlah antrian maksimum per cluster dari 10 menjadi 50. Setiap antrian dapat memiliki hingga 50 sumber daya komputasi. Setiap cluster dapat memiliki hingga 50 sumber daya komputasi.
Tambahkan dukungan untuk menentukan urutan beberapa skrip tindakan kustom untuk acara yang dikonfigurasi dalamOnNodeStart,OnNodeConfigured, dan OnNodeUpdated parameter.
Tambahkan bagian konfigurasi baruHealthChecks/Gpu, untuk menerapkan pemeriksaan kesehatan GPU pada node komputasi sebelum pekerjaan dijalankan.
Tambahkan dukungan untuk TagsComputeResources konfigurasi SlurmQueues danSlurmQueues/.
Tambahkan dukungan untuk DetailedMonitoringdalam Monitoring konfigurasi.
Tambahkan mem_used_percent dan disk_used_percent metrik untuk memori node kepala dan pelacakan pemanfaatan disk volume root di AWS ParallelCluster
CloudWatch dasbor, dan atur alarm untuk memantau metrik ini.
Tambahkan dukungan rotasi log untuk log AWS ParallelCluster terkelola.
Buka MPI: openmpi40-aws-4.1.5-1 (tidak ada perubahan)
Tingkatkan versi klien Lustre ke di 2.12 Amazon Linux 2. Klien Lustre 2.12 telah diinstal pada Ubuntu 20.04, 18.04, dan CentOS >= 7.7.
Tingkatkan versi klien Lustre ke 2.10.8 CentOS 7.6.
Tingkatkan driver NVIDIA ke versi 470.182.03 (dari versi470.141.03).
Tingkatkan NVIDIA Fabric Manager ke versi 470.182.03 (dari versi470.141.03).
Tingkatkan NVIDIA CUDA Toolkit ke versi 11.8.0 (dari versi11.7.1).
Tingkatkan sampel NVIDIA CUDA ke versi11.8.0.
Tingkatkan Perpustakaan Intel MPI ke Pembaruan Versi 2021 9 (dari Pembaruan Versi 2021 6). Untuk informasi selengkapnya, lihat Pembaruan Perpustakaan Intel® MPI 2021 9.
Tingkatkan NICE DCV ke versi 2023.0-15022 (dari versi2022.2-14521).
Perbaiki Amazon EFS dan validator grup keamanan FSx jaringan Amazon untuk menghindari pelaporan kesalahan palsu.
Perbaiki tag yang hilang dari sumber daya yang dibuat oleh Image Builder selama build-image operasi.
Perbaiki kebijakan pembaruan MaxCount untuk selalu melakukan perbandingan numerik pada properti. MaxCount
Perbaiki penyelarasan IP pada instance node komputasi dengan beberapa kartu jaringan.
Perbaiki penggantian StoragePass di slurm_parallelcluster_slurmdbd.conf saat pembaruan parameter antrian dilakukan dan Slurm konfigurasi akuntansi tidak diperbarui.
Perbaiki masalah yang menyebabkan grup keamanan menggantung dibuat saat membuat cluster dengan sistem file EFS yang ada.
Perbaiki masalah yang menyebabkan cfn-hup daemon gagal saat dimulai ulang.
Pertimbangkan node dinamis dengan INVALID_REG flag sebagai kegagalan bootstrap untuk Slurm mode terlindungi. Node statis gagal Slurm pendaftaran sudah diperlakukan sebagai kegagalan bootstrap setelahnode_replacement_timeout.
Perbaiki potensi kegagalan peluncuran node yang disebabkan oleh pencocokan pola antara MountDir dan /etc/exports saat menghapus volume Amazon EBS bersama sebagai bagian dari pembaruan klaster.
Perbaiki untuk mencegah pemotongan file compute_console_output log di setiap clustermgtd iterasi.
Buka MPI: openmpi40-aws-4.1.4-3 (tidak ada perubahan)
Membuat Slurm pengontrol mencatat lebih banyak verbose dan mengaktifkan logging tambahan untuk Slurm plugin hemat daya.
Perbaikan bug:
Perbaiki pembuatan database cluster dengan memverifikasi bahwa nama cluster tidak lebih dari 40 karakter saat Slurm akuntansi diaktifkan.
Perbaiki masalah clustermgtd yang menyebabkan node komputasi, reboot melalui Slurm, untuk diganti jika pemeriksaan status EC2 instans Amazon gagal.
Memperbaiki masalah yang mencegah node komputasi, dengan reservasi kapasitas yang dibagikan oleh akun lain, agar tidak diluncurkan karena kebijakan IAM yang salah pada node kepala.
Perbaiki Slurm masalah penjadwal yang dapat menyebabkan penerapan pembaruan yang salah ke registri internal node komputasi. Akibatnya jika masalah ini, EC2 instance bisa menjadi tidak tersedia atau dapat didukung oleh jenis instance yang salah.
Tambahkan dukungan untuk meluncurkan node di beberapa zona ketersediaan untuk meningkatkan ketersediaan kapasitas.
Tambahkan dukungan untuk menentukan beberapa subnet untuk setiap antrian untuk meningkatkan ketersediaan kapasitas.
Tambahkan parameter konfigurasi baru di Iam/ResourcePrefixuntuk menentukan awalan untuk jalur dan nama sumber daya IAM yang dibuat oleh. AWS ParallelCluster
Tambahkan kemampuan untuk menentukan skrip khusus untuk dijalankan di node kepala selama pembaruan cluster. Script dapat ditentukan dengan HeadNode/CustomActions/OnNodeUpdatedsaat menggunakan Slurm sebagai penjadwal.
Perubahan:
Hapus pembuatan target mount Amazon EFS untuk sistem file yang ada.
Pasang sistem file EFS menggunakanamazon-efs-utils. Sistem file EFS dapat dipasang menggunakan enkripsi dalam transit dan pengguna resmi IAM.
Instal stunnel 5.67 di Cent OS7 dan Ubuntu untuk mendukung enkripsi in-transit EFS.
Tingkatkan penginstal EFA ke 1.20.0 (dari1.18.0).
EFA-driver: efa-2.1 (dari) efa-1.16.0-1
EFA-config: efa-config-1.11-1 (tidak ada perubahan)
Profil EFA: efa-profile-1.5-1 (tidak ada perubahan)
AWS ParallelCluster Produk resmi sekarang AMIs tersedia setelah EC2 penghentian Amazon pada dua tahun.
Tingkatkan ukuran memori AWS ParallelCluster API Lambda ke 2048 untuk mengurangi penalti start dingin dan menghindari batas waktu.
Perbaikan bug:
Mencegah penggantian sistem berkas Lustre yang dikelola FSx dan hilangnya data pada pembaruan klaster yang mencakup perubahan pada ID subnet armada komputasi.
SharedStorageDeletionPolicyberlaku untuk tindakan pembaruan cluster.
Untuk detail perubahannya, lihat CHANGELOG file untuk paket aws-parallelcluster di. GitHub
Tambahkan lambda:ListTags dan lambda:UntagResource ke tumpukan AWS ParallelCluster API yang ParallelClusterUserRole digunakan untuk pembaruan klaster.
Tingkatkan Perpustakaan Intel MPI ke Pembaruan Versi 2021 6 (dari Pembaruan Versi 2021 4). Untuk informasi selengkapnya, lihat Intel® MPI Library 2021 Update 6.
Tingkatkan driver NVIDIA ke versi 470.141.03 (dari 470.103.01).
Tingkatkan NVIDIA Fabric Manager ke versi 470.141.03 (dari 470.103.01).
Tambahkan dukungan untuk konfigurasi alokasi beberapa instans untuk sumber daya komputasi saat menggunakan Slurm sebagai penjadwal. Untuk informasi selengkapnya, lihat Beberapa alokasi tipe instans dengan Slurm.
Tambahkan dukungan untuk menambah dan menghapus SharedStoragedengan pembaruan cluster, menggunakan konfigurasi yang diperbarui. Untuk informasi selengkapnya, lihat Penyimpanan bersama.
Tambahkan parameter konfigurasi baru DeletionPolicy untuk Efsdan pengaturan penyimpanan FsxLustrebersama untuk mendukung retensi penyimpanan.
Tambahkan parameter konfigurasi baru untuk menentukan versi IMDS yang akan didukung di cluster atau membangun infrastruktur gambar di cluster, Imds/ImdsSupport, dan build, Imds/ImdsSupport, konfigurasi.
Tambahkan dukungan untuk instance dengan beberapa antarmuka jaringan yang dibatasi hanya satu ENI per perangkat.
Tingkatkan validasi jaringan untuk sistem file Amazon EFS eksternal dengan memeriksa blok CIDR di grup keamanan terlampir.
Tambahkan validator untuk memeriksa apakah jenis instance yang dikonfigurasi mendukung grup penempatan.
Konfigurasikan utas NFS menjadi min (256, maks (8, num_core* 4)) untuk memastikan stabilitas dan kinerja yang lebih baik.
Pindahkan instalasi NFS pada waktu pembuatan untuk mengurangi waktu konfigurasi.
Aktifkan enkripsi sisi server untuk topik EcrImageBuilder SNS yang dibuat saat menerapkan AWS ParallelCluster API dan digunakan untuk memberi tahu tentang peristiwa docker image build.
Perubahan:
Ubah perilaku SlurmQueues/Networking/PlacementGroup/Enabled. Sekarang membuat grup penempatan terkelola yang unik untuk setiap sumber daya komputasi, bukan grup penempatan terkelola tunggal untuk semua sumber daya komputasi.
Jangan mengganti DRAIN node saat node dalam COMPLETING keadaan karena Epilog mungkin masih berjalan.
Perbaikan bug:
Perbaiki validasi parameter filter dalam AWS ParallelCluster
ListClusterLogStreams perintah untuk gagal ketika filter yang salah dilewatkan.
Perbaiki validasi SharedStorageEfsSettingsparameter/gagal validasi ketika FileSystemId ditentukan bersama dengan parameter SharedStorage/EfsSettingslainnya. Sebelumnya, FileSystemId tidak termasuk.
Perbaiki pembaruan cluster saat mengubah urutan SharedStoragebersama dengan perubahan lain dalam konfigurasi.
Perbaiki UpdateParallelClusterLambdaRole di AWS ParallelCluster API untuk mengunggah log ke CloudWatch.
Perbaiki Cinc tidak menggunakan bundel sertifikat CA lokal saat menginstal paket sebelum buku masak apa pun dijalankan.
Perbaiki hang dalam memutakhirkan ubuntu dengan pcluster build-image kapan Build:UpdateOsPackages:Enabled:true diatur.
Perbaiki parsing konfigurasi cluster YAMAL dengan gagal pada kunci duplikat.
Tingkatkan logika untuk mengaitkan tabel perutean host ke kartu jaringan yang berbeda untuk mendukung EC2 instans Amazon dengan lebih baik dengan beberapa. NICs
Perubahan:
Tingkatkan driver NVIDIA ke versi 470.141.03.
Tingkatkan NVIDIA Fabric Manager ke versi 470.141.03.
Nonaktifkan tugas cron pekerjaan man-db danmlocate, yang mungkin berdampak negatif pada kinerja node.
Tingkatkan Perpustakaan Intel MPI ke 2021.6.0.602.
Upgrade Python dari 3.7.10 ke 3.7.13 sebagai tanggapan atas risiko keamanan ini.
Perbaikan bug:
Hindari kegagalan DescribeCluster saat konfigurasi cluster tidak tersedia.
Tingkatkan fleksibilitas pada pembaruan konfigurasi cluster untuk menghindari penghentian dan dimulainya seluruh cluster bila memungkinkan. Tambahkan parameter konfigurasi baru Scheduling/SlurmSettings/QueueUpdateStrategyuntuk mengatur strategi yang disukai untuk digunakan saat node komputasi memerlukan pembaruan dan penggantian konfigurasi.
Tingkatkan mekanisme fail-over atas sumber daya komputasi yang tersedia saat mengalami masalah kapasitas yang tidak mencukupi dengan instans Amazon. EC2 Nonaktifkan node komputasi dengan jumlah waktu yang dapat dikonfigurasi ketika peluncuran node gagal karena kapasitas yang tidak mencukupi.
Minta pengguna untuk mengaktifkan EFA untuk jenis instans yang didukung saat menggunakan pcluster configure wizard.
Tambahkan dukungan untuk me-reboot node komputasi menggunakan Slurm.
Meningkatkan penanganan Slurm status daya juga memperhitungkan pemadaman node secara manual.
Instal NVIDIA GDRCopy 2.3 ke dalam produk AMIs untuk mengaktifkan salinan memori GPU latensi rendah.
Perubahan:
Tingkatkan penginstal EFA ke versi 1.17.2.
Pengemudi EFA: efa-1.16.0-1
Konfigurasi EFA: efa-config-1.10-1
Profil EFA: efa-profile-1.5-1
Libfabric: libfabric-aws-1.16.0~amzn2.0-1
Inti RDMA: rdma-core-41.0-2
Buka MPI: openmpi40-aws-4.1.4-2
Tingkatkan NICE DCV ke versi 2022.0-12760.
Tingkatkan driver NVIDIA ke versi 470.129.06.
Tingkatkan NVIDIA Fabric Manager ke versi 470.129.06.
Ubah tipe volume EBS default dari gp2 ke gp3 baik di root maupun volume tambahan.
Perubahan pada FSx sistem file Lustre yang dibuat oleh: AWS ParallelCluster
Ubah jenis penerapan default menjadiScratch_2.
Ubah versi server Lustre menjadi. 2.12
Tidak memerlukan PlacementGroup/Enableduntuk disetel ke true saat melewatiPlacementGroup/yang adaId.
Tidak mengizinkan pengaturanPlacementGroup/IdketikaPlacementGroup/secara eksplisit Enabled disetel ke. false
Tambahkan parallelcluster:cluster-name tag ke semua sumber daya yang dibuat oleh AWS ParallelCluster.
Tambahkan lambda:ListTags dan lambda:UntagResourceParallelClusterUserRole gunakan tumpukan AWS ParallelCluster API untuk pembaruan klaster.
Batasi IPv6 akses IMDS ke pengguna admin root dan cluster saja, ketika parameter konfigurasiHeadNode/Imds/Secureddiaktifkan.
Dengan AMI khusus, gunakan ukuran volume root AMI alih-alih ParallelCluster default 35 GiB. Nilai dapat diubah dalam file konfigurasi cluster.
Penonaktifan otomatis armada komputasi ketika parameter konfigurasiScheduling///SlurmQueuesComputeResources/SpotPricelebih rendah dari harga pemenuhan permintaan Spot minimum yang diperlukan.
Tampilkan requested_value dan current_value nilai dalam set perubahan saat menambahkan atau menghapus bagian selama pembaruan.
Nonaktifkan aws-ubuntu-eni-helper layanan, tersedia di Deep Learning AMIs, untuk menghindari konflik configure_nw_interface.sh saat mengonfigurasi instance dengan beberapa kartu jaringan.
Hapus dukungan untuk Python 3.6.
Setel MTU ke 9001 untuk semua antarmuka jaringan saat mengonfigurasi instance dengan beberapa kartu jaringan.
Hapus trailing dot saat mengonfigurasi node komputasi FQDN.
Kelola node statis diPOWERING_DOWN.
Tidak menggantikan node dinamis POWER_DOWN karena pekerjaan mungkin masih berjalan.
Mulai ulang clustermgtd dan slurmctld daemon pada waktu pembaruan cluster hanya ketika Scheduling parameter diperbarui dalam konfigurasi cluster.
Perbarui slurmctld dan slurmdsystemd layanan file.
Batasi IPv6 akses ke IMDS hanya untuk pengguna root dan cluster admin, saat parameter konfigurasiHeadNode/Imds/Secureddiaktifkan.
Set Slurm konfigurasi AuthInfo=cred_expire=70 untuk mengurangi waktu pekerjaan yang diminta harus menunggu sebelum memulai lagi ketika node tidak tersedia.
Tingkatkan dependensi buku masak pihak ketiga:
apt-7.4.2 (dari apt-7.4.0)
baris-4.5.2 (dari baris-4.0.1)
openssh-2.10.3 (dari openssh-2.9.1)
pyenv-3.5.1 (dari pyenv-3.4.2)
selinux-6.0.4 (dari selinux-3.1.1)
yum-7.4.0 (dari yum-6.1.1)
yum-epel-4.5.0 (dari yum-epel-4.1.2)
Perbaikan bug:
Perbaiki perilaku default untuk melewati langkah AWS ParallelCluster validasi dan pengujian saat membuat AMI kustom.
Perbaiki kebocoran pegangan file. computemgtd
Perbaiki kondisi balapan yang secara sporadis menyebabkan instance yang diluncurkan segera dihentikan karena belum tersedia dalam respons. EC2 DescribeInstances
Perbaiki dukungan untuk DisableSimultaneousMultithreading parameter pada tipe instans dengan prosesor Arm.
Perbaiki kegagalan pembaruan tumpukan AWS ParallelCluster API saat memutakhirkan dari versi sebelumnya. Tambahkan pola sumber daya yang digunakan untuk ListImagePipelineImages Action diEcrImageDeletionLambdaRole.
Perbaiki AWS ParallelCluster API yang menambahkan izin yang hilang yang diperlukan untuk mengimpor atau mengekspor dari Amazon S3 saat membuat FSx sistem file untuk Lustre.
Tambahkan dukungan untuk mengaktifkan Slurm otentikasi JWT.
Perubahan:
Peningkatan Slurm ke versi 21.08.8-2.
Membangun Slurm dengan dukungan JWT.
Tidak memerlukan PlacementGroup/Enableduntuk disetel ke true saat melewatiPlacementGroup/yang adaId.
Tambahkan lambda:TagResource untuk ParallelClusterUserRole digunakan oleh tumpukan ParallelCluster API untuk pembuatan cluster dan pembuatan gambar.
Perbaikan bug:
Perbaiki kemampuan untuk mengekspor log cluster saat menggunakan export-cluster-logs perintah dengan --filters opsi.
Perbaiki titik masuk AWS Batch Docker untuk menggunakan direktori /home bersama untuk mengoordinasikan eksekusi Multi-node-Parallel pekerjaan.
Setel ulang alamat node saat mengatur Slurm node statis yang tidak sehat ke bawah untuk menghindari perawatan node statis gagal dengan kapasitas yang tidak mencukupi sebagai node kegagalan bootstrap.
Jalankan pembuatan kunci SSH bersama dengan pembuatan direktori HOME, misalnya, selama login SSH, saat beralih ke pengguna lain dan saat menjalankan perintah sebagai pengguna lain.
Tambahkan dukungan untuk FQDN dan LDAP Distinguished Names dalam parameter konfigurasi/. DirectoryServiceDomainName Validator baru sekarang memeriksa kedua sintaks.
update_directory_service_password.shSkrip baru yang digunakan pada node kepala mendukung pembaruan manual kata sandi Direktori Aktif dalam konfigurasi SSSD. Kata sandi diambil oleh AWS Secrets Manager as dari konfigurasi cluster.
Tambahkan dukungan untuk menerapkan infrastruktur API di lingkungan tanpa VPC default.
Perubahan:
Nonaktifkan C-States yang lebih dalam di x86_64 resmi AMIs dan AMIs dibuat melalui build-image perintah, untuk menjamin kinerja tinggi dan latensi rendah.
Pembaruan paket OS dan perbaikan keamanan.
Ubah gambar dasar Amazon Linux 2 untuk digunakan AMIs dengan Kernel 5.10.
Perbaikan bug:
Perbaiki tumpukan build-image DELETE_FAILED setelah image dibangun berhasil, karena kebijakan EC2 Image Builder baru.
Perbaiki parameter DirectoryServiceDomainAddrkonfigurasi/konversi ke properti ldap_uri SSSD ketika berisi beberapa alamat domain.
Tambahkan dukungan untuk UseEc2Hostnamesdalam file konfigurasi cluster. Jika disetel ke true, gunakan nama host EC2 default Amazon (misalnya ip-1-2-3-4) untuk node komputasi.
Tambahkan dukungan untuk beberapa jenis instans komputasi per antrian.
Tambahkan dukungan untuk penjadwalan GPU dengan Slurm pada instance ARM dengan kartu NVIDIA.
Tambahkan flag disingkat untuk cluster-name (-n), region (-r), image-id (-i) dancluster-configuration/image-configuration(-c) ke CLI AWS ParallelCluster .
Tambahkan dukungan untuk NEW_CHANGED_DELETED opsi FSx untuk parameter Lustre AutoImportPolicy.
Tambahkan parallelcluster:compute-resource-name tag ke EC2 LaunchTemplates sumber daya yang digunakan oleh node komputasi.
Tingkatkan grup keamanan yang dibuat di dalam klaster untuk memungkinkan koneksi masuk dari grup keamanan khusus saat SecurityGroups parameter ditentukan untuk beberapa node kepala dan/atau antrian.
Instal driver NVIDIA dan perpustakaan CUDA untuk ARM.
Perubahan:
Peningkatan Slurm ke versi 21.08.5 (dari20.11.8).
Peningkatan Slurm plugin ke versi 21.08 (dari20.11).
Tingkatkan NICE DCV ke versi 2021.3-11591 (dari2021.1-10851).
Tingkatkan driver NVIDIA ke versi 470.103.01 (dari470.57.02).
Tingkatkan manajer NVIDIA Fabric ke versi 470.103.01 (dari470.57.02).
Hapus dumping node komputasi yang gagal ke. /home/logs/compute File log node komputasi tersedia di dalam CloudWatch dan di log EC2 konsol Amazon.
Aktifkan potensi untuk menekan SlurmQueues dan ComputeResources memperpanjang validator.
Nonaktifkan pembaruan paket pada waktu peluncuran instans di Amazon Linux 2.
Nonaktifkan metadata gambar Amazon yang EC2 ImageBuilder disempurnakan saat membuat gambar AWS ParallelCluster khusus.
Secara eksplisit mengatur sumber cloud-init data menjadi. EC2 Ini menghemat waktu boot untuk platform Ubuntu dan CentOS.
Gunakan nama sumber daya komputasi daripada jenis instance dalam nama template peluncuran armada komputasi.
Arahkan stderr dan stdout ke file log CLI untuk mencegah teks yang tidak diinginkan dalam output CLI pcluster.
Pindahkan resep konfigurasi/instal ke buku masak terpisah yang dipanggil dari yang utama. Entrypoint yang ada dipertahankan dan kompatibel ke belakang.
Unduh dependensi platform Intel HPC selama waktu pembuatan AMI untuk menghindari kontak internet selama waktu pembuatan cluster.
Jangan hapus - dari nama sumber daya komputasi saat mengonfigurasi node Slurm.
Jangan mengkonfigurasi GPUs Slurm ketika driver NVIDIA tidak diinstal.
Perbaiki ecs:ListContainerInstances izin diBatchUserRole.
Perbaiki ekspor log cluster ketika tidak ada awalan yang ditentukan, sebelumnya diekspor ke awalan. None
Perbaiki rollback yang tidak dilakukan jika terjadi kegagalan pembaruan cluster.
Perbaiki ecs:ListContainerInstances izin diBatchUserRole.
Perbaiki RootVolume skema untuk HeadNode dengan memunculkan kesalahan jika tidak didukung KmsKeyId ditentukan.
Perbaiki metrik Amazon yang FSx hilang untuk ditampilkan di CloudWatch Dasbor.
PerbaikiEfaSecurityGroupValidator. Sebelumnya, itu berpotensi menghasilkan kegagalan palsu ketika grup keamanan khusus disediakan dan EFA diaktifkan.
Nonaktifkan log4j-cve-2021-44228-hotpatch agent (Log4jHotPatch) di Amazon Linux 2 untuk menghindari potensi penurunan kinerja. Untuk informasi selengkapnya, lihat Pengumuman Hotpatch Amazon Linux untuk Apache Log4j.
Pelanggan sekarang dapat memigrasikan konfigurasi klaster mereka dari format AWS ParallelCluster versi 2 ke format versi 3 berbasis YAML AWS ParallelCluster . Untuk informasi selengkapnya, lihat pcluster3-config-converter.
Wilayah AWS Membaca default dari ~/.aws/config file
Untuk pcluster perintah, jika tidak Wilayah AWS ditentukan dalam file konfigurasi, di lingkungan, atau pada baris perintah, default yang Wilayah AWS ditentukan dalam region pengaturan di [default] bagian ~/.aws/config file digunakan.
Support untuk manajemen klaster melalui Amazon API Gateway
Pelanggan sekarang dapat mengelola dan menerapkan cluster melalui titik akhir HTTP dengan Amazon API Gateway. Ini membuka kemungkinan baru untuk alur kerja skrip atau berbasis peristiwa.
Antarmuka baris AWS ParallelCluster perintah (CLI) juga telah didesain ulang untuk kompatibilitas dengan API ini dan menyertakan opsi keluaran JSON baru. Fungsionalitas baru ini memungkinkan pelanggan untuk menerapkan kemampuan blok bangunan serupa menggunakan CLI juga.
Peningkatan kreasi AMI kustom
Pelanggan sekarang memiliki akses ke proses yang lebih kuat untuk membuat dan mengelola kustom AMIs menggunakan EC2 Image Builder. Kustom sekarang AMIs dapat dikelola melalui file AWS ParallelCluster konfigurasi terpisah, dan dapat dibuat menggunakan pcluster build-image perintah di antarmuka baris AWS ParallelCluster perintah.