Pilih preferensi cookie Anda

Kami menggunakan cookie penting serta alat serupa yang diperlukan untuk menyediakan situs dan layanan. Kami menggunakan cookie performa untuk mengumpulkan statistik anonim sehingga kami dapat memahami cara pelanggan menggunakan situs dan melakukan perbaikan. Cookie penting tidak dapat dinonaktifkan, tetapi Anda dapat mengklik “Kustom” atau “Tolak” untuk menolak cookie performa.

Jika Anda setuju, AWS dan pihak ketiga yang disetujui juga akan menggunakan cookie untuk menyediakan fitur situs yang berguna, mengingat preferensi Anda, dan menampilkan konten yang relevan, termasuk iklan yang relevan. Untuk menerima atau menolak semua cookie yang tidak penting, klik “Terima” atau “Tolak”. Untuk membuat pilihan yang lebih detail, klik “Kustomisasi”.

Catatan rilis dan riwayat dokumen - AWS ParallelCluster

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Catatan rilis dan riwayat dokumen

Tabel berikut menjelaskan pembaruan utama dan fitur baru untuk Panduan AWS ParallelCluster Pengguna. Kami juga rutin memperbarui dokumentasi untuk menjawab umpan balik yang Anda kirimkan kepada kami.

PerubahanDeskripsiTanggal

AWS ParallelCluster versi 3.12.0 dirilis

Kami sangat senang mengumumkan rilis AWS ParallelCluster 3.12.0.

Untuk meningkatkan, masukkan yang berikut ini:sudo pip install --upgrade aws-parallelcluster.

Perangkat tambahan:

  • Tambahkan bagian konfigurasi gambar build baru Build/Installation untuk mengaktifkan/menonaktifkan perangkat lunak NVIDIA dan instalasi klien Lustre. Secara default, perangkat lunak NVIDIA, meskipun termasuk dalam resmi ParallelCluster AMIs, tidak diinstal olehbuild-image. Secara default, klien Lustre diinstal.

  • Perintah CLI export-cluster-logs dan sekarang export-image-logs dapat secara default mengekspor log ke ParallelCluster bucket default atau ke customs3Bucket jika ditentukan dalam konfigurasi.

  • Perluas dukungan Amazon DCV ke Ubuntu2204 pada instans ARM.

Perubahan:

  • Tingkatkan driver NVIDIA ke versi 550.127.08 (dari 550.90.07). Ini membahas masalah yang diketahui dari NVIDIA. Untuk informasi selengkapnya, lihat Masalah yang Diketahui di Dokumentasi Pusat Data NVIDIA.

  • Tingkatkan Amazon DCV ke versi2024.0-18131.

    • server: 2024.0-18131-1

    • xdcv: 2024.0.631-1

    • gl: 2024.0.1078-1

    • penampil web: 2024.0-18131-1

  • Tingkatkan penginstal EFA ke. 1.36.0

    • Pengemudi EFA: efa-2.13.0-1

    • Konfigurasi EFA: efa-config-1.17-1

    • Profil EFA: efa-profile-1.7-1

    • Libfabric-AWS: libfabric-aws-1.22.0-1

    • RDMA-inti: rdma-core-54.0-1

    • Buka MPI: openmpi40-aws-4.1.7-1 dan openmpi50-aws-5.0.5

  • Restart otomatis slurmctld pada kegagalan.

  • Tingkatkan mysql-community-client ke versi 8.0.39.

  • Hapus dukungan untuk Python 3.7 dan 3.8, yang merupakan akhir dari masa pakai.

Perbaikan bug:

  • Memperbaiki masalah di mana perubahan dalam urutan skrip tindakan kustom tidak terdeteksi selama pembaruan klaster.

  • Tambahkan izin yang hilang untuk AWS ParallelCluster API untuk membuat peran terkait layanan untuk Elastic Load Balancing dan Auto Scaling, yang diperlukan untuk menerapkan node login.

  • Perbaiki masalah dalam cara kami mendapatkan wilayah saat mengelola volume sehingga dapat menangani zona lokal dengan benar.

  • Perbaiki masalah saat menambahkan sistem file EFS AccessPointIds selama pembaruan akan gagal.

  • Perbaiki masalah saat menggunakan PCAPI, pembaruan cluster bisa gagal saat memperbarui parameter yang bukan tipe String (misalnya,MaxCount).

  • Saat memasang OpenZFS eksternal, tidak lagi diperlukan untuk menetapkan aturan keluar untuk port 111, 2049, 20001, 20002, 20003.

Desember 19, 2024

Penyedia Terraform untuk 1.1.0 dirilis AWS ParallelCluster

Kami dengan senang hati mengumumkan rilis Penyedia Terraform untuk 1.1.0. AWS ParallelCluster

Perbaikan bug:

  • Memperbaiki masalah yang menyebabkan kegagalan terraform-apply saat ParallelCluster API 3.11.x digunakan untuk menyebarkan cluster dengan node login.

Desember 6, 2024

Modul Terraform untuk 1.1.0 dirilis AWS ParallelCluster

Kami sangat senang mengumumkan rilis Modul Terraform untuk 1.1.0. AWS ParallelCluster

Perubahan:

  • Gunakan AWS ParallelCluster Terraform Provider 1.x di semua contoh modul.

  • Gunakan ParallelCluster API 3.11.1 di semua contoh dengan API nama ParallelCluster tumpukan.

  • Menyebarkan node login di semua contoh modul.

Desember 6, 2024

Versi PCUI 2024.11.0 dirilis

Versi PCUI 2024.11.0 dirilis

Perbaikan bug:

  • Secara eksplisit menetapkan kebijakan untuk repositori pribadi ECR untuk mencegah penghapusan kebijakan pada pembaruan tumpukan yang memengaruhi fungsi Lambda. Kebijakan ini mencakup izin yang diperlukan oleh fungsi Lambda untuk mengambil kode.

November 22, 2024

Versi PCUI 2024.10.0 dirilis

Versi PCUI 2024.10.0 dirilis

Perubahan:

  • Tambahkan dukungan untuk AWS ParallelCluster 3.11.1.

  • Tambahkan dukungan untuk Reservasi Kapasitas Sesuai Permintaan dan Blok Kapasitas di wizard.

  • Tambahkan keluarga g6, m7, dan p5 ke daftar jenis instans yang didukung di wizard.

  • Tambahkan parameter opsional tumpukan baru untuk mengonfigurasi domain khusus untuk PCUI dan Cognito.

Perbaikan bug:

  • Memperbaiki bug yang melanggar pengaturan domain kustom.

Keamanan:

  • Tingkatkan Flask-CORS dari 3.0.10 ke 4.0.2 untuk mengatasi kerentanan CVE-2024-6221.

  • Tingkatkan lint-staged dari 13.0.3 ke 15.2.5 untuk mengatasi kerentanan CVE-2024-4068.

  • Changelog penuh

Oktober 22, 2024

AWS ParallelCluster versi 3.11.1 dirilis

Kami sangat senang mengumumkan rilis 3.11.1 AWS ParallelCluster

Fitur-fitur:

  • Pyxis sekarang dinonaktifkan secara default, sehingga harus diaktifkan secara manual seperti yang didokumentasikan dalam dokumentasi produk.

  • Upgrade runtime Python ke versi 3.12 di ParallelCluster Lambda Layer.

  • Hapus penyematan versi untuk setuptools ke versi sebelum 70.0.0.

  • Tingkatkan libjwt ke versi 1.17.0.

  • Changelog penuh

Perbaikan bug

  • Perbaiki masalah dalam cara kami mengonfigurasi plugin Pyxis Slurm ParallelCluster yang dapat menyebabkan kegagalan pengiriman pekerjaan.

  • Perbaiki masalah yang menyebabkan kegagalan penerapan dalam konfigurasi dengan node login dengan menambahkan izin yang hilang yang diperlukan oleh node login di templat kebijakan publik. https://github.com/aws/aws-parallelcluster/masalah/6483

Oktober 21, 2024

AWS ParallelCluster versi 3.11.0 dirilis

Kami sangat senang mengumumkan rilis 3.11.0 AWS ParallelCluster

Enchancements

  • Tambahkan dukungan untuk tindakan kustom pada node login.

  • Izinkan koneksi DCV ke node login.

  • Tambahkan dukungan untuk wilayah ap-southeast-3.

  • Tambahkan grup keamanan untuk login penyeimbang beban jaringan node.

  • Tambahkan AllowedIps konfigurasi untuk node login.

  • Tambahkan konfigurasi baru SharedStorage/EfsSettings/AccessPointId untuk menentukan titik akses EFS opsional untuk pemasangan

  • Izinkan hingga 10 kumpulan node login.

  • Instal enroot dan pyxis di pcluster resmi AMIs

Perubahan

  • [BREAKING] loginNodes Bidang yang dikembalikan oleh API DescribeCluster dan perintah CLI describe-cluster telah diubah dari kamus ke array untuk mendukung beberapa kumpulan node login. Perubahan ini merusak kompatibilitas mundur, membuat operasi ini tidak kompatibel dengan cluster yang digunakan dengan versi yang lebih lama.

  • Tingkatkan Slurm ke 23.11.10 (dari 23.11.7).

  • Tingkatkan Pmix ke 5.0.3 (dari 5.0.2).

  • Tingkatkan penginstal EFA ke. 1.34.0

    • Pengemudi EFA: efa-2.10.0-1

    • Konfigurasi EFA: efa-config-1.17-1

    • Profil EFA: efa-profile-1.7-1

    • Libfabric-AWS: libfabric-aws-1.22.0-1

    • RDMA-inti: rdma-core-52.0-1

    • Buka MPI: openmpi40-aws-4.1.6-3 dan openmpi50-aws-5.0.3-11

  • Tingkatkan driver NVIDIA ke versi 550.90.07 (dari 535.183.01).

  • Tingkatkan CUDA Toolkit ke versi 12.4.1 (dari 12.2.2).

  • Upgrade Python ke 3.9.20 (dari 3.9.19).

  • Tingkatkan Perpustakaan Intel MPI ke 2021.13.1.769 (dari 2021.12.1.8).

Perbaikan bug

  • Perbaiki validator EfaPlacementGroupValidator sehingga tidak menyarankan untuk mengkonfigurasi Grup Penempatan saat Blok Kapasitas digunakan.

  • Perbaiki kegagalan pembuatan cluster sesekali dengan memastikan bahwa FSx untuk sistem file Lustre dibuat setelah aturan grup keamanan.

  • Perbaiki kegagalan penghapusan cluster saat grup penempatan diaktifkan.

  • Perbaiki masalah dengan node login yang ditandai tidak sehat saat membatasi akses SSH.

  • Perbaiki retrieve_supported_regions sehingga bisa mendapatkan url S3 yang benar.

  • Perbaiki describe_images untuk menggunakan pagination.

  • Perbaiki No route tables found bug saat menentukan LoginNodes subnet VPC default ke/Networking/. SubnetIds

September 26, 2024

AWS ParallelCluster versi 3.10.1 dirilis

Kami sangat senang mengumumkan rilis 3.10.1 AWS ParallelCluster

Perbaikan bug

  • Perbaiki kegagalan pembuatan gambar di wilayah Tiongkok.

Juli 8, 2024

AWS ParallelCluster versi 3.10.0 dirilis

Kami sangat senang mengumumkan rilis 3.10.0 AWS ParallelCluster

Perangkat tambahan:

  • Tambahkan bagian konfigurasi baru Scheduling/SlurmSettings/ExternalSlurmdbd untuk menghubungkan cluster ke Slurmdbd eksternal.

  • Izinkan build-image dijalankan di jaringan yang terisolasi.

  • Tambahkan dukungan untuk Amazon Linux 2023.

  • Tambahkan dukungan untuk price-capacity-optimized sebagaiAllocationStrategy.

  • Tambahkan validator untuk mencegah penggunaan Grup Penempatan dengan Blok Kapasitas.

Perubahan:

  • CentOS 7 tidak lagi didukung.

  • Upgrade Cnc Client ke versi 18.4.12 dari 18.2.7.

  • Tingkatkan munge ke versi 0.5.16 (dari 0.5.15).

  • Tingkatkan Pmix ke 5.0.2 (dari 4.2.9).

  • Tingkatkan dependensi buku masak pihak ketiga:

    • apt-7.5.22 (dari apt-7.5.14)

    • openssh-2.11.12 (dari openssh-2.11.3)

  • Hapus buku masak pihak ketiga: selinux-6.1.12.

  • Tingkatkan penginstal EFA ke. 1.32.0

    • Pengemudi EFA: efa-2.8.0-1

    • Konfigurasi EFA: efa-config-1.16-1

    • Profil EFA: efa-profile-1.7-1

    • Libfabric-AWS: libfabric-aws-1.21.0-1

    • RDMA-inti: rdma-core-50.0-1

    • Buka MPI: openmpi40-aws-4.1.6-3 dan openmpi50-aws-5.0.2-12

  • Tingkatkan driver NVIDIA ke versi 535.183.01 (dari 535.154.05).

  • Upgrade Python ke 3.9.19 (dari 3.9.17).

  • Tingkatkan Perpustakaan Intel MPI ke 2021.12.1.8 (dari 2021.9.0.43482).

Perbaikan bug:

  • Perbaiki konfigurasi Asosiasi Repositori Data untuk membuat AutoExportPolicy dan AutoImportPolicy opsional.

  • Memperbaiki masalah selama penghapusan klaster yang sekarang menyelesaikan pembersihan armada komputasi saat instance dalam status shutting-down atau dihentikan. Ini untuk menghindari kegagalan penghapusan cluster untuk tipe instance dengan siklus terminasi yang lebih lama.

  • Izinkan dasbor cloudwatch diaktifkan dan alarm dinonaktifkan di Monitoring bagian konfigurasi cluster.

  • Izinkan Sumber Daya ParallelCluster Kustom untuk menekan validator menggunakan. PclusterCluster/SuppressValidators

  • Menghapus /etc/profile.d/pcluster.sh sehingga tidak dijalankan pada setiap login pengguna dan tidak cfn_bootstrap_virtualenv ditambahkan dalam variabel lingkungan PATH.

  • Perbaiki spesifikasi ParallelCluster API dengan mengganti field failureReason dengan failures in DescribeCluster response.

  • Perbaiki spesifikasi ParallelCluster API dengan menambahkan status CloudFormation tumpukan yang hilang:IMPORT_*, REVIEW_IN_PROGRESS danUPDATE_FAILED.

  • Memperbaiki masalah yang mencegah pembaruan klaster menyertakan sistem file EFS dengan enkripsi dalam perjalanan.

  • Perbaiki masalah yang mencegah layanan slurmctld dan slurmdbd memulai ulang pada reboot node kepala saat EFS digunakan untuk data internal bersama.

  • Pada sistem Ubuntu, hapus konfigurasi logrotate default untuk file log cloud-init yang bentrok dengan konfigurasi yang berasal dari Parallelcluster.

  • Perbaiki kegagalan pembuatan gambar dengan RHEL 8.10 atau yang lebih baru.

27 Juni 2024

Penyedia Terraform untuk AWS ParallelCluster 1.0.0 dirilis

Kami dengan senang hati mengumumkan rilis Penyedia Terraform untuk 1.0.0. AWS ParallelCluster

Fitur-fitur:

Juni 26, 2024

Modul Terraform untuk AWS ParallelCluster 1.0.0 dirilis

Kami sangat senang mengumumkan rilis Modul Terraform untuk 1.0.0. AWS ParallelCluster

Fitur-fitur:

Juni 26, 2024

AWS ParallelCluster versi 3.9.3 dirilis

Kami sangat senang mengumumkan rilis 3.9.3 AWS ParallelCluster

Untuk meng-upgrade, ketik sudo pip install --upgrade aws-parallelcluster

Fitur-fitur:

  • Menambahkan dukungan untuk FSx Lustre sebagai tipe penyimpanan bersama dius-iso-east-1.

Perbaikan bug:

  • Hapus cloud_dns dari konfigurasi Slurm untuk menghindari masalah fanout Slurm. SlurmctldParameters

    Ini tidak diperlukan, karena kami mengatur alamat IP pada peluncuran instance.

Juni 19, 2024

AWS ParallelCluster versi 3.9.2 dirilis

Kami sangat senang mengumumkan rilis 3.9.2 AWS ParallelCluster

Fitur-fitur:

  • Peningkatan Slurm ke 23.11.7 (dari 23.11.4).

  • Untuk lebih jelasnya, lihat CHANGELOG 3.9.2di GitHub.

28 Mei 2024

Versi PCUI 2024.05.0 dirilis

Versi PCUI 2024.05.0 dirilis.

Perbaikan Bug:

  • Memperbaiki bug di frontend yang memblokir UI saat pengguna membuka panel Status Pekerjaan.

  • Changelog penuh

14 Mei 2024

Versi PCUI 2024.04.0 dirilis

PCUI versi 2024.04.0 dirilis.

Fitur-fitur:

  • Ditambahkan dukungan untuk AWS ParallelCluster versi 3.9.1

  • Changelog penuh

April 17, 2024

AWS ParallelCluster versi 3.9.1 dirilis

Kami sangat senang mengumumkan rilis 3.9.1 AWS ParallelCluster

Untuk meningkatkan, masukkan yang berikut ini: sudo pip install --upgrade aws-parallelcluster

Perbaikan bug

  • Hapus penghapusan rekursif dari penyimpanan bersama mountdir saat melepas sistem file sebagai bagian dari operasi kluster pembaruan.

April 11, 2024

AWS ParallelCluster versi 3.9.1 dirilis

Kami sangat senang mengumumkan rilis 3.9.1 AWS ParallelCluster

Untuk meningkatkan, masukkan yang berikut ini: sudo pip install --upgrade aws-parallelcluster

Perbaikan bug

  • Hapus penghapusan rekursif dari penyimpanan bersama mountdir saat melepas sistem file sebagai bagian dari operasi kluster pembaruan.

April 11, 2024

Versi PCUI 2024.03.0 dirilis

PCUI versi 2024.03.0 dirilis.

Fitur-fitur:

  • Ditambahkan dukungan untuk AWS ParallelCluster versi 3.9.0

  • Menambahkan dukungan untuk Ubuntu 22.04 dan Red Hat Enterprise Linux 9

  • Ubuntu 18.04 yang tidak digunakan lagi

Perbaikan bug

  • Memperbaiki masalah yang menyebabkan beberapa cluster tidak muncul saat menggunakan banyak cluster

Untuk detail perubahan, lihat CHANGELOG file untuk aws-parallelcluster-uipaket di GitHub.

Maret 12, 2024

AWS ParallelCluster versi 3.9.0 dirilis

Kami sangat senang mengumumkan rilis 3.9.0 AWS ParallelCluster

Untuk meningkatkan, masukkan yang berikut ini: sudo pip install --upgrade aws-parallelcluster

Penyempurnaan:

  • Tambahkan parameter konfigurasi DeploymentSettings/DefaultUserHome untuk memungkinkan pengguna memindahkan direktori home pengguna default ke /local/home bukan /home (default).

  • Izin untuk memperbarui MinCountMaxCount,, Queue dan parameter ComputeResource konfigurasi tanpa perlu menghentikan armada komputasi. Sekarang mungkin untuk memperbaruinya dengan menyetel Scheduling/SlurmSettings/QueueUpdateStrategy ke TERMINATE. AWS ParallelCluster hanya akan menghentikan node yang dihapus selama pengubahan ukuran kapasitas cluster yang dilakukan melalui pembaruan cluster.

  • Izinkan untuk memperbarui penyimpanan bersama eksternal tipe Efs, FsxLustre FsxOntap, FsxOpenZfs dan FileCache tanpa mengganti armada komputasi dan login.

  • Tambahkan dukungan untuk RHEL9.

  • Tambahkan dukungan untuk Rocky Linux 9 seperti yang CustomAmi dibuat melalui build-image proses. Tidak ada resmi publik AWS ParallelCluster Rocky9 Linux AMI yang tersedia saat ini.

  • Hapus CommunicationParameters dari Custom Slurm Pengaturan menolak daftar.

  • Tambahkan DeploymentSettings/DisableSudoAccessForDefaultUser parameter untuk menonaktifkan akses sudo pengguna default di didukung OSes.

  • Perubahan FSx untuk sistem file Lustre yang dibuat oleh ParallelCluster: Ubah versi server Lustre ke 2.15.

  • Tambahkan kemungkinan untuk memilih antara Driver Nvidia Sumber Terbuka dan Tertutup saat membangun AMI, melalui atribut node ['cluster']['nvidia']['kernel_open'] buku masak.

  • * Tambahkan opsi konfigurasi clustermgtd ec2_instance_missing_max_count untuk mengizinkan jumlah percobaan ulang yang dapat dikonfigurasi untuk Amazon menjelaskan konsistensi instance dengan instance run. EC2

Perubahan

  • Peningkatan Slurm ke 23.11.4 (dari 23.02.7).

  • Tingkatkan driver NVIDIA ke versi 535.154.05.

  • Tambahkan dukungan untuk Python 3.11, 3.12 di pcluster CLI dan. aws-parallelcluster-batch-cli

  • Bangun antarmuka jaringan menggunakan indeks kartu jaringan dari NetworkCardIndex daftar EC2 DescribeInstances respons Amazon, alih-alih mengulang rentang. MaximumNetworkCards

  • Gagal pembuatan cluster saat menggunakan tipe instance P3, G3, P2 dan G2 karena arsitektur GPU mereka tidak kompatibel dengan Open Source Nvidia Drivers (OpenRM) yang diperkenalkan sebagai bagian dari rilis 3.8.0.

  • Tingkatkan dependensi buku masak pihak ketiga: nfs-5.1.2 (dari nfs-5.0.0)

  • Tingkatkan penginstal EFA ke 1.30.0.

    • Pengemudi EFA: efa-2.6.0-1

    • Konfigurasi EFA: efa-config-1.15-1

    • Profil EFA: efa-profile-1.6-1

    • Libfabric-AWS: libfabric-aws-1.19.0

    • RDMA-inti: rdma-core-46.0-1

    • Buka MPI: openmpi40-aws-4.1.6-2 dan openmpi50-aws-5.0.0-11

  • Tingkatkan NICE DCV ke versi 2023.1-16388.

    • server: 2023.1.16388-1

    • xdcv: 2023.1.565-1

    • gl: 2023.1.1047-1

    • penampil web: 2023.1.16388-1

Perbaikan bug

  • Perbaiki masalah yang membuat pekerjaan gagal saat dikirimkan sebagai pengguna direktori aktif dari node login. Masalah ini disebabkan oleh konfigurasi integrasi yang tidak lengkap dengan Direktori Aktif eksternal pada node kepala.

  • Refactor kebijakan IAM yang ditentukan dalam CloudFormation template parallelclutser-policies.yaml untuk mencegah kegagalan penerapan API yang disebabkan oleh kebijakan yang melebihi batas IAM. ParallelCluster

  • Perbaiki masalah membuat node login gagal bootstrap ketika node kepala membutuhkan waktu lebih lama dari yang diharapkan dalam menulis kunci.

Untuk detail perubahan, lihat CHANGELOG file untuk aws-parallelcluster-uipaket di GitHub.

Maret 5, 2024

Versi PCUI 2024.02.0 dirilis

Versi PCUI 2024.02.0 dirilis

Perubahan:

  • Memperbarui lingkungan runtime Lambda ke Python v3.9

Untuk detail perubahan, lihat CHANGELOG file untuk aws-parallelcluster-uipaket di GitHub.

Februari 8, 2024

Versi PCUI 2023.12.0 dirilis

PCUI versi 2023.12.0 dirilis.

Fitur-fitur:

  • Ditambahkan dukungan untuk penyebaran PCUI dengan jaringan pribadi.

  • Menambahkan kemungkinan untuk secara opsional menerapkan Batas Izin ke setiap peran IAM yang dibuat oleh infrastruktur PCUI dan PCAPI

  • Menambahkan kemungkinan untuk menerapkan awalan secara opsional ke setiap peran dan kebijakan IAM yang dibuat oleh infrastruktur PCUI dan PCAPI.

  • Menambahkan dukungan untuk ParallelCluster versi 3.8.0, tanpa paritas fitur di wizard.

Untuk detail perubahan, lihat CHANGELOG file untuk aws-parallelcluster-uipaket di GitHub.

21 Desember 2023

AWS ParallelCluster versi 3.8.0 dirilis

AWS ParallelCluster versi 3.8.0 dirilis.

Penyempurnaan:

  • Tambahkan dukungan untuk Amazon EC2 Capacity Blocks untuk ML.

  • Tambahkan dukungan untuk Rocky Linux 8 seperti yang CustomAmi dibuat melalui build-image proses. Tidak ada resmi publik AWS ParallelCluster Rocky8 Linux AMI yang tersedia saat ini.

  • Tambahkan Scheduling/ScalingStrategy parameter untuk mengontrol strategi penskalaan klaster yang akan digunakan saat meluncurkan EC2 instans Amazon Slurm menghitung node. Nilai yang mungkin adalah all-or-nothing greedy-all-or-nothingbest-effort,, dengan all-or-nothing menjadi default.

  • Tambahkan HeadNode/SharedStorageType parameter untuk menggunakan penyimpanan EFS alih-alih ekspor NFS dari volume root node kepala untuk sumber daya sistem file bersama intra-cluster: ParallelCluster, Intel, Slurm, dan data. /home Peningkatan ini mengurangi beban pada jaringan node kepala.

  • Izinkan pemasangan /home sebagai EFS atau penyimpanan bersama FSx eksternal melalui SharedStorage bagian file konfigurasi.

  • Tambahkan parameter baru SlurmSettings/MungeKeySecretArn untuk mengizinkan penggunaan kunci MUNGE yang ditentukan pengguna eksternal dari Secrets Manager AWS .

  • Tambahkan Monitoring/Alarms/Enabled parameter untuk mengaktifkan CloudWatch Alarm Amazon untuk cluster.

  • Tambahkan alarm node kepala untuk memantau pemeriksaan EC2 kesehatan Amazon, pemanfaatan CPU, dan status keseluruhan node kepala, dan tambahkan ke CloudWatch Dasbor yang dibuat dengan cluster.

  • Tambahkan dukungan untuk Asosiasi Repositori Data saat menggunakan PERSISTENT_2 as DeploymentType untuk Lustre yang dikelola FSx .

  • Tambahkan Scheduling/SlurmSettings/Database/DatabaseName parameter untuk memungkinkan pengguna menentukan nama kustom untuk database di server database yang akan digunakan Slurm akuntansi.

  • InstanceTypeBuat parameter konfigurasi opsional saat mengonfigurasi sumber CapacityReservationTarget/CapacityReservationId daya komputasi.

  • Tambahkan kemungkinan untuk menentukan awalan untuk peran dan kebijakan IAM yang dibuat oleh AWS ParallelCluster API.

  • Tambahkan kemungkinan untuk menentukan batas izin yang akan diterapkan untuk peran dan kebijakan IAM yang dibuat oleh API. AWS ParallelCluster

Perubahan

  • Peningkatan Slurm ke 23.02.7 (dari 23.02.6).

  • Tingkatkan driver NVIDIA ke versi 535.129.03.

  • Tingkatkan CUDA Toolkit ke versi 12.2.2.

  • Gunakan driver GPU NVIDIA Open Source (OpenRM) sebagai modul kernel NVIDIA untuk Linux alih-alih modul sumber tertutup NVIDIA.

  • Hapus dukungan parameter all_or_nothing_batch konfigurasi di Slurm melanjutkan program, mendukung konfigurasi Scheduling/ScalingStrategy cluster baru.

  • Mengubah konvensi penamaan alarm cluster menjadi '[cluster-name] - [component-name] - [metric]'.

  • Ubah tipe volume EBS default di wilayah ADC dari gp2 ke gp3, untuk volume root dan tambahan.

  • Batas izin opsional untuk AWS ParallelCluster API sekarang diterapkan ke setiap peran IAM yang dibuat oleh infrastruktur API.

    • Tingkatkan penginstal EFA ke. 1.29.1

    • Pengemudi EFA: efa-2.6.0-1

    • Konfigurasi EFA: efa-config-1.15-1

    • Profil EFA: efa-profile-1.5-1

    • Libfabric-AWS: libfabric-aws-1.19.0-1

    • RDMA-inti: rdma-core-46.0-1

    • Buka MPI: openmpi40-aws-4.1.6-1

  • Tingkatkan GDRCopy ke versi 2.4 di semua yang didukung OSes, kecuali untuk Centos 7 di mana versi 2.3.1 digunakan.

  • Tingkatkan aws-cfn-bootstrap ke versi 2.0-28.

  • Tambahkan dukungan untuk Python 3.10 in. aws-parallelcluster-batch-cli

Perbaikan bug

  • Perbaiki konfigurasi penskalaan yang tidak konsisten setelah rollback pembaruan cluster saat memodifikasi daftar jenis instance yang dideklarasikan dalam Sumber Daya Komputasi.

  • Perbaiki pengguna pembuatan kunci SSH saat mengganti pengguna tanpa hak akses root di cluster yang terintegrasi dengan server LDAP eksternal melalui file konfigurasi cluster.

  • Perbaiki penonaktifan Slurm mode hemat daya saat mengaturScaledownIdletime = -1.

  • Perbaiki jalur hard-code ke Slurm direktori instalasi dalam update_slurm_database_password.sh skrip untuk Slurm Akuntansi.

Desember 19, 2023

AWS ParallelCluster versi 3.7.2 dirilis

AWS ParallelCluster versi 3.7.2 dirilis.

Perubahan:

  • Peningkatan Slurm ke 23.02.6.

25 Oktober 2023

Versi PCUI 2023.10.0 dirilis

PCUI versi 2023.10.0 dirilis.

Fitur-fitur:

  • Menambahkan dukungan untuk ParallelCluster 3.7.2 dengan paritas fitur di wizard terbatas pada FSx File Cache dan kompatibilitas penjadwalan berbasis memori dengan beberapa jenis instance.

Perbaikan bug:

  • Memperbaiki masalah yang menyebabkan kesalahan UI saat PCUI tidak memiliki izin untuk berinteraksi dengan Cost Explorer.

Perbaikan

  • Meningkatkan keamanan dengan mengurangi token akses TTL dari 10 menit menjadi 5 menit.

Untuk detail perubahan, lihat CHANGELOG file untuk aws-parallelcluster-uipaket di GitHub.

20 Oktober 2023

AWS ParallelCluster versi 3.7.1 dirilis

AWS ParallelCluster versi 3.7.1 dirilis.

Perubahan:

  • Peningkatan Slurm ke 23.02.5 (dari 23.02.4).

    • Tingkatkan Pmix ke 4.2.6 (dari 3.2.3).

    • Tingkatkan libjwt ke 1.15.3 (dari 1.12.0).

  • Tingkatkan penginstal EFA ke1.26.1, memperbaiki masalah RDMA writedata di P5.

    • Pengemudi EFA:. efa-2.5.0-1

    • Konfigurasi EFA:. efa-config-1.15-1

    • Profil EFA:. efa-profile-1.5-1

    • Libfabric-AWS:. libfabric-aws-1.18.2-1

    • ERdma-inti:rdma-core-46.0-1.

    • Buka MPI:openmpi40-aws-4.1.5-4.

September 22, 2023

AWS ParallelCluster versi 3.7.0 dirilis

AWS ParallelCluster versi 3.7.0 dirilis.

Penyempurnaan:

  • Support konfigurasi prioritas node statis dan dinamis dalam sumber daya komputasi dengan menggunakan file YAMM AWS ParallelCluster konfigurasi.

  • Tambahkan dukungan untuk Ubuntu 22. Kunci RSA tidak didukung secara default.

  • Tambahkan pengaturan konfigurasi antrian JobExclusiveAllocation untuk mengalokasikan node dalam partisi secara eksklusif ke satu pekerjaan pada waktu tertentu.

  • Izinkan aws-parallelcluster-node paket Override pada waktu pembuatan cluster dan pembaruan cluster. Untuk node kepala, ini berlaku untuk pembaruan cluster. Berguna untuk tujuan pengembangan saja.

  • Hindari server NFS dimulai pada node komputasi.

  • Tambahkan dukungan untuk node log-in.

  • Izinkan penjadwalan berbasis memori ketika beberapa jenis instans ditentukan untuk Slurm Sumber Daya Hitung.

  • Tambahkan dukungan untuk memasang Cache File Amazon yang ada sebagai penyimpanan bersama.

Perubahan:

  • Menetapkan Slurm node dinamis prioritas (berat) 1000 secara default. Dengan melakukan ini, Slurm dapat memprioritaskan node statis idle di atas node dinamis idle.

  • Buat aws-parallelcluster-node daemon hanya menangani terkelola AWS ParallelCluster Slurm partisi.

  • EFS-utilsTingkatkan interval polling pengawas menjadi 10 detik. Perubahan ini berlaku ketika EncryptionInTransit disetel ketrue, yang merupakan satu-satunya kondisi yang menyebabkan pengawas berjalan.

  • Tingkatkan penginstal EFA ke. 1.25.1

    • EFA-driver: efa-2.5.0-1 (dari) efa-2.1.1g

    • EFA-config: efa-config-1.15-1 (dari) efa-config-1.13-1

    • Profil EFA: efa-profile-1.5-1 (tidak ada perubahan)

    • libFabric-aws: libfabric-aws-1.18.1-0 (dari) libfabric-aws-1.17.1-1

    • RDMA-core: rdma-core-46.0-1 (dari) rdma-core-43.0-1

    • Buka MPI: openmpi40-aws-4.1.5-4 (dari openmpi40-aws-4.1.5-1)

  • Peningkatan Slurm ke versi 23.02.4.

  • Ubah nilai default Imds/ ImdsSupport dari v1.0 ke v2.0.

  • Ubuntu 18 tidak digunakan lagi.

  • Perbarui ukuran volume root default menjadi 40 GB untuk memperhitungkan batasan pada Centos 7.

  • Batasi izin pada file /tmp/wait _condition_handle.txt di dalam node kepala sehingga hanya root yang dapat membacanya.

  • Buat Slurm partisi-nodelist memetakan file JSON untuk digunakan oleh daemon paket node untuk mengenali PC-managed Slurm partisi dan nodelist.

  • Tingkatkan driver NVIDIA ke versi 535.54.03.

  • Tingkatkan pustaka CUDA ke versi 12.2.0.

  • Tingkatkan manajer NVIDIA Fabric ke nvidia-fabricmanager-535.

  • Upgrade ARM PL ke versi 23.04.1 hanya untuk Ubuntu 22.04.

  • Tingkatkan NICE DCV ke versi. 2023.0-15487

    • Server: 2023.0.15487-1

    • xdcv: 2023.0.551-1

    • gl: 2023.0.1039-1

    • penampil web: 2023.0.15487-1

Perbaikan bug:

  • Tambahkan validasi ke ScaledownIdletime nilai, untuk mencegah pengaturan nilai yang lebih rendah dari -1.

  • Perbaiki kegagalan pembuatan cluster dengan Ubuntu Deep Learning AMI pada instance GPU dengan DCV diaktifkan.

  • Perbaiki masalah yang menyebabkan kebijakan IAM yang menggantung dibuat saat membuat penyedia sumber daya ParallelCluster CloudFormation khusus dengan. CustomLambdaRole

  • Memperbaiki masalah yang menyebabkan ketidaksejajaran nama DNS node komputasi pada instance dengan beberapa antarmuka jaringan, saat menggunakan sama dengan SlurmSettings/Dns/UseEc2Hostnames True

Untuk detail perubahannya, lihat CHANGELOG file untuk aws-parallelcluster, aws-parallelcluster-cookbook, dan paket aktif. aws-parallelcluster-node GitHub

Agustus 30, 2023

Dokumentasi hanya rilis

AWS ParallelCluster versi 3 panduan pengguna khusus diterbitkan.

Rilis hanya dokumentasi:

  • AWS ParallelCluster versi 3 memiliki panduan pengguna tersendiri.

Juli 17, 2023

AWS ParallelCluster versi 3.6.1 dirilis

AWS ParallelCluster versi 3.6.1 dirilis.

Perubahan:

  • Hindari duplikasi node yang dilihat oleh clustermgtd jika node komputasi ditambahkan ke beberapa Slurm partisi.

Perbaikan bug:

  • Hapus hard coding nama perangkat volume root (/dev/sda1dan/dev/xvda) dan ambil dari AMI yang digunakan selamacreate-cluster.

  • Perbaiki kegagalan pembuatan cluster saat menggunakan sumber daya CloudFormation khusus dengan ElasticIp disetel keTrue.

  • Perbaiki kegagalan pembuatan dan perbarui cluster saat menggunakan sumber daya AWS CloudFormation khusus dengan file konfigurasi besar.

  • Perbaiki masalah yang mencegah ptrace perlindungan dinonaktifkan di Ubuntu dan yang tidak mengizinkan Cross Memory Attach (CMA) di libfabric.

  • Perbaiki logika fail-over kapasitas yang tidak mencukupi dengan cepat saat menggunakan beberapa jenis instans dan tidak ada instance yang dikembalikan.

Untuk detail perubahannya, lihat CHANGELOG file untuk aws-parallelcluster, aws-parallelcluster-cookbook, dan paket aktif. aws-parallelcluster-node GitHub

5 Juli 2023

Versi PCUI 2023.06.0 dirilis

Versi PCUI 2023.06.0 dirilis.

Perubahan:

  • Memutakhirkan versi AWS ParallelCluster API default ke 3.6.0.

Perbaikan bug:

  • Memperbaiki penyebaran yang rusak untuk Wilayah AWS GovCloud (AS-Barat).

  • Panel split sekarang memuat detail cluster dengan benar setelah pembuatan dimulai.

Catatan:

  • Fitur Pemantauan Biaya tidak tersedia di AWS GovCloud (US) Regions.

Untuk detail perubahan, lihat CHANGELOG file untuk aws-parallelcluster-uipaket di GitHub.

Juni 7, 2023

AWS ParallelCluster versi 3.6.0 dirilis

AWS ParallelCluster versi 3.6.0 dirilis.

Dokumentasi:

Penyempurnaan:

  • Tambahkan dukungan untuk RHEL8.

  • Tambahkan sumber daya AWS CloudFormation khusus untuk membuat dan mengelola cluster dengan CloudFormation.

  • Tambahkan dukungan untuk menyesuaikan cluster Slurm konfigurasi dalam file YAMAL AWS ParallelCluster konfigurasi.

  • Membangun Slurm dengan dukungan untuk LUA.

  • Tingkatkan batas jumlah antrian maksimum per cluster dari 10 menjadi 50. Setiap antrian dapat memiliki hingga 50 sumber daya komputasi. Setiap cluster dapat memiliki hingga 50 sumber daya komputasi.

  • Tambahkan dukungan untuk menentukan urutan beberapa skrip tindakan kustom untuk acara yang dikonfigurasi dalamOnNodeStart,OnNodeConfigured, dan OnNodeUpdated parameter.

  • Tambahkan bagian konfigurasi baruHealthChecks/Gpu, untuk menerapkan pemeriksaan kesehatan GPU pada node komputasi sebelum pekerjaan dijalankan.

  • Tambahkan dukungan untuk Tags ComputeResources konfigurasi SlurmQueues danSlurmQueues/.

  • Tambahkan dukungan untuk DetailedMonitoringdalam Monitoring konfigurasi.

  • Tambahkan mem_used_percent dan disk_used_percent metrik untuk memori node kepala dan pelacakan pemanfaatan disk volume root di AWS ParallelCluster CloudWatch dasbor, dan atur alarm untuk memantau metrik ini.

  • Tambahkan dukungan rotasi log untuk log AWS ParallelCluster terkelola.

  • Lacak kesalahan node komputasi umum dan waktu idle terpanjang node dinamis di Dasbor. CloudWatch

  • Menerapkan DCV Authenticator Server untuk menggunakan setidaknya TLS-1.2 protokol saat membuat SSL Socket.

  • Instal paket NVIDIA Data Center GPU Manager (DCGM) pada semua sistem operasi yang didukung kecuali dan. aarch64 centos7 alinux2

  • Muat modul kernel nvidia-uvm secara default untuk menyediakan fungsionalitas Unified Virtual Memory (UVM) ke driver CUDA.

  • Instal NVIDIA Persistence Daemon sebagai layanan sistem.

Perubahan:

  • Peningkatan Slurm ke versi 23.02.2 (dari versi22.05.8).

  • Tingkatkan munge ke versi 0.5.15 (dari versi0.5.14).

  • Mengatur Slurm TreeWidthke 30.

  • Mengatur Slurm prologdan epilog konfigurasi ke direktori target /opt/slurm/etc/scripts/prolog.d/ dan /opt/slurm/etc/scripts/epilog.d/ masing-masing.

  • Set Slurm BatchStartTimeoutmaksimal 3 menit untuk menjalankan Prolog skrip selama pendaftaran node komputasi.

  • Tingkatkan default CloudWatch log RetentionInDays dari 14 menjadi 180 hari.

  • Tingkatkan penginstal EFA ke. 1.22.1

    • Dkms: 2.8.3-2

    • EFA-driver: efa-2.1.1g (tidak ada perubahan)

    • EFA-config: efa-config-1.13-1 (tidak ada perubahan)

    • Profil EFA: efa-profile-1.5-1 (tidak ada perubahan)

    • libFabric-aws: libfabric-aws-1.17.1-1 (dari) libfabric-aws-1.17.0-1

    • RDMA-core: rdma-core-43.0-1 (tidak ada perubahan)

    • Buka MPI: openmpi40-aws-4.1.5-1 (tidak ada perubahan)

  • Tingkatkan versi klien Lustre ke di 2.12 Amazon Linux 2. Klien Lustre 2.12 telah diinstal pada Ubuntu 20.04, 18.04, dan CentOS >= 7.7.

  • Tingkatkan versi klien Lustre ke 2.10.8 CentOS 7.6.

  • Tingkatkan driver NVIDIA ke versi 470.182.03 (dari versi470.141.03).

  • Tingkatkan NVIDIA Fabric Manager ke versi 470.182.03 (dari versi470.141.03).

  • Tingkatkan NVIDIA CUDA Toolkit ke versi 11.8.0 (dari versi11.7.1).

  • Tingkatkan sampel NVIDIA CUDA ke versi11.8.0.

  • Tingkatkan Perpustakaan Intel MPI ke Pembaruan Versi 2021 9 (dari Pembaruan Versi 2021 6). Untuk informasi selengkapnya, lihat Pembaruan Perpustakaan Intel® MPI 2021 9.

  • Tingkatkan NICE DCV ke versi 2023.0-15022 (dari versi2022.2-14521).

    • server: 2023.0.15022-1 (dari versi2022.2-14521-1).

    • xdcv: 2023.0.547-1 (dari versi2022.2.519-1).

    • gl: 2023.0.1027-1 (dari versi2022.2.1012-1).

    • web_viewer: 2023.0.15022-1 (dari versi2022.2.14521-1).

  • Tingkatkan aws-cfn-bootstrap ke versi2.0-24.

  • Tingkatkan gambar yang digunakan oleh CodeBuild lingkungan saat membuat gambar kontainer untuk AWS Batch cluster:

    • aws/codebuild/amazonlinux2-x86_64-standard:4.0(dariaws/codebuild/amazonlinux2-x86_64-standard:3.0).

    • aws/codebuild/amazonlinux2-aarch64-standard:2.0(dariaws/codebuild/amazonlinux2-aarch64-standard:1.0).

Perbaikan bug:

  • Perbaiki Amazon EFS dan validator grup keamanan FSx jaringan Amazon untuk menghindari pelaporan kesalahan palsu.

  • Perbaiki tag yang hilang dari sumber daya yang dibuat oleh Image Builder selama build-image operasi.

  • Perbaiki kebijakan pembaruan MaxCount untuk selalu melakukan perbandingan numerik pada properti. MaxCount

  • Perbaiki penyelarasan IP pada instance node komputasi dengan beberapa kartu jaringan.

  • Perbaiki penggantian StoragePass di slurm_parallelcluster_slurmdbd.conf saat pembaruan parameter antrian dilakukan dan Slurm konfigurasi akuntansi tidak diperbarui.

  • Perbaiki masalah yang menyebabkan grup keamanan menggantung dibuat saat membuat cluster dengan sistem file EFS yang ada.

  • Perbaiki masalah yang menyebabkan cfn-hup daemon gagal saat dimulai ulang.

  • Pertimbangkan node dinamis dengan INVALID_REG flag sebagai kegagalan bootstrap untuk Slurm mode terlindungi. Node statis gagal Slurm pendaftaran sudah diperlakukan sebagai kegagalan bootstrap setelahnode_replacement_timeout.

Untuk detail perubahannya, lihat CHANGELOG file untuk aws-parallelcluster, aws-parallelcluster-cookbook, dan paket aktif. aws-parallelcluster-node GitHub

22 Mei 2023

Versi PCUI 2023.05.0 dirilis

Versi PCUI 2023.05.0 dirilis.

Penyempurnaan:

  • Dimulai dengan AWS ParallelCluster versi 3.6.0, tambahkan dukungan untuk RHEL 8.

  • Tambahkan pemantauan biaya cluster.

  • Dimulai dengan AWS ParallelCluster versi 3.6.0, tingkatkan antrian dan hitung kuota sumber daya.

Perubahan:

  • Meningkatkan antarmuka pengguna wizard pembuatan cluster.

  • Meningkatkan kecepatan penyebaran PCUI.

  • Meningkatkan antarmuka untuk menambahkan pengguna baru.

  • Antrian berada di subnet head node secara default.

Perbaikan bug:

  • Beralih ke wilayah yang benar setelah pembuatan cluster selesai.

  • Perbaiki tampilan indikator pemuatan di fitur “Edit cluster”.

  • Perbaiki pembuatan cluster saat SnapshotId properti EBS dihapus.

Untuk detail perubahan, lihat CHANGELOG file untuk aws-parallelcluster-uipaket di GitHub.

16 Mei 2023

Versi PCUI 2023.04.0 dirilis

PCUI versi 2023.04.0 dirilis.

Penyempurnaan:

  • Cluster membuat desain ulang wizard.

  • Desain ulang halaman log cluster.

  • Tambahkan pengaturan nama khusus untuk penyimpanan bersama.

  • Tambahkan beberapa pilihan penyimpanan saat menambahkan penyimpanan ke cluster.

  • Tambahkan DeletionPolicy dukungan untuk Amazon EFS dan FSx Lustre.

  • Tambahkan ImdsSupport pengaturan dalam konfigurasi cluster.

  • Tambahkan dukungan untuk jenis instance C7.

  • Ditambahkan tutorialMengembalikan ke versi dokumen AWS Systems Manager sebelumnya.

Perubahan:

  • Konfigurasi cluster YAMB berukuran hingga 1MB.

  • Pengguna tidak keluar karena otorisasi dengan kredensyal sementara Boto3 IAM.

  • Opsi multi-threading dinonaktifkan saat instance HPC dipilih.

  • Dihapus menonaktifkan rollback pada halaman membuat cluster.

  • Pengguna dicegah menggunakan PCUI sampai informasi yang diperlukan diberikan.

  • Hingga 10 antrian dapat ditambahkan.

  • SSM-SessionManagerRunShellDokumen tidak ditimpa selama instalasi PCUI.

Perbaikan bug:

  • Perbaiki tautan kata sandi reset yang rusak.

  • Perbaiki rusak delete stack yang disebabkan oleh EcrPrivateRepository tidak kosong

  • Memperbaiki masalah inisialisasi kotak centang Hasilkan Kunci SSH di bagian Beberapa properti manajemen pengguna.

  • Kerusakan tetap disebabkan oleh pekerjaan dengan properti yang tidak ditentukan.

  • FSx Pengaturan SCRATCH tetap.

  • Tombol instance Start dan Stop tetap, masih diaktifkan setelah diklik sekali.

Untuk detail perubahan, lihat CHANGELOG file untuk aws-parallelcluster-uipaket di GitHub.

17 April 2023

AWS ParallelCluster versi 3.5.1 dirilis

AWS ParallelCluster versi 3.5.1 dirilis.

Perubahan:

  • Tingkatkan penginstal EFA ke. 1.22.0

    • EFA-driver: efa-2.1.1g (dari) efa-2.1.1-1

    • EFA-config: efa-config-1.13-1 (dari efa-config-1.12-1)

    • Profil EFA: efa-profile-1.5-1 (tidak ada perubahan)

    • libFabric-aws: libfabric-aws-1.17.0-1 (dari) libfabric-aws-1.16.1amzn3.0-1

    • RDMA-core: rdma-core-43.0-1 (tidak ada perubahan)

    • Buka MPI: openmpi40-aws-4.1.5-1 (dariopenmpi40-aws-4.1.4-3)

    Tingkatkan NICE DCV ke versi. 2022.2-14521

    • server: 2022.2.14521-1

    • xdcv: 2022.2.519-1

    • gl: 2022.2.1012-1

    • penampil web: 2022.2.14521-1

Perbaikan bug:

  • Perbaiki potensi kegagalan peluncuran node yang disebabkan oleh pencocokan pola antara MountDir dan /etc/exports saat menghapus volume Amazon EBS bersama sebagai bagian dari pembaruan klaster.

  • Perbaiki untuk mencegah pemotongan file compute_console_output log di setiap clustermgtd iterasi.

Untuk detail perubahannya, lihat CHANGELOG file untuk aws-parallelcluster, aws-parallelcluster-cookbook, dan paket aktif. aws-parallelcluster-node GitHub

29 Maret 2023

AWS ParallelCluster versi 3.5.0 dirilis

AWS ParallelCluster versi 3.5.0 dirilis.

Penyempurnaan:

  • Akses dan kelola cluster dengan AWS ParallelCluster UI.

  • Tambahkan AWS ParallelCluster kebijakan berversi dalam CloudFormation templat yang dapat Anda referensikan di beban kerja Anda.

  • Tambahkan pustaka AWS ParallelCluster Python yang dapat Anda gunakan dengan kode Anda sendiri.

  • Tambahkan logging output konsol node komputasi ke Amazon CloudWatch pada kegagalan bootstrap node komputasi.

  • Tambahkan bidang kegagalan yang berisi kode kegagalan dan alasan untuk describe-cluster keluaran saat pembuatan cluster gagal.

  • Tambahkan validator untuk mencegah injeksi string berbahaya saat memanggil modul subproses.

  • Gagal pembuatan klaster jika status klaster berubah menjadi PROTECTED saat menyediakan node statis.

Perubahan:

  • Tingkatkan ke Slurm versi 22.05.8 (dari versi22.05.7)

  • Tingkatkan penginstal EFA ke. 1.21.0

    • EFA-driver: efa-2.1.1-1 (dari) efa-2.1

    • EFA-config: efa-config-1.12-1 (dari efa-config-1.11-1)

    • Profil EFA: efa-profile-1.5-1 (tidak ada perubahan)

    • libFabric-aws: libfabric-aws-1.16.1amzn3.0-1 (dari) libfabric-aws-1.16.1

    • RDMA-core: rdma-core-43.0-1 (dari) rdma-core-43.0-2

    • Buka MPI: openmpi40-aws-4.1.4-3 (tidak ada perubahan)

  • Membuat Slurm pengontrol mencatat lebih banyak verbose dan mengaktifkan logging tambahan untuk Slurm plugin hemat daya.

Perbaikan bug:

  • Perbaiki pembuatan database cluster dengan memverifikasi bahwa nama cluster tidak lebih dari 40 karakter saat Slurm akuntansi diaktifkan.

  • Perbaiki masalah clustermgtd yang menyebabkan node komputasi, reboot melalui Slurm, untuk diganti jika pemeriksaan status EC2 instans Amazon gagal.

  • Memperbaiki masalah yang mencegah node komputasi, dengan reservasi kapasitas yang dibagikan oleh akun lain, agar tidak diluncurkan karena kebijakan IAM yang salah pada node kepala.

Untuk detail perubahan, lihat CHANGELOG file untuk aws-parallelcluster,, aws-parallelcluster-cookbookaws-parallelcluster-node, dan paketnya. aws-parallelcluster-ui GitHub

Februari 20, 2023

AWS ParallelCluster versi 3.4.1 dirilis

AWS ParallelCluster versi 3.4.1 dirilis.

Perbaikan bug:

  • Perbaiki Slurm masalah penjadwal yang dapat menyebabkan penerapan pembaruan yang salah ke registri internal node komputasi. Akibatnya jika masalah ini, EC2 instance bisa menjadi tidak tersedia atau dapat didukung oleh jenis instance yang salah.

Untuk detail perubahannya, lihat CHANGELOG file untuk aws-parallelcluster, aws-parallelcluster-cookbook, dan paket aktif. aws-parallelcluster-node GitHub

13 Januari 2023

AWS ParallelCluster versi 3.4.0 dirilis

AWS ParallelCluster versi 3.4.0 dirilis.

Penyempurnaan:

  • Tambahkan dukungan untuk meluncurkan node di beberapa zona ketersediaan untuk meningkatkan ketersediaan kapasitas.

  • Tambahkan dukungan untuk menentukan beberapa subnet untuk setiap antrian untuk meningkatkan ketersediaan kapasitas.

  • Tambahkan parameter konfigurasi baru di Iam/ResourcePrefixuntuk menentukan awalan untuk jalur dan nama sumber daya IAM yang dibuat oleh. AWS ParallelCluster

  • Tambahkan bagian konfigurasi DeploymentSettingsbaru/ LambdaFunctionsVpcConfiguntuk menentukan konfigurasi Vpc yang digunakan oleh fungsi Lambda AWS ParallelCluster .

  • Tambahkan kemampuan untuk menentukan skrip khusus untuk dijalankan di node kepala selama pembaruan cluster. Script dapat ditentukan dengan HeadNode/CustomActions/OnNodeUpdatedsaat menggunakan Slurm sebagai penjadwal.

Perubahan:

  • Hapus pembuatan target mount Amazon EFS untuk sistem file yang ada.

  • Pasang sistem file EFS menggunakanamazon-efs-utils. Sistem file EFS dapat dipasang menggunakan enkripsi dalam transit dan pengguna resmi IAM.

  • Instal stunnel 5.67 di Cent OS7 dan Ubuntu untuk mendukung enkripsi in-transit EFS.

  • Tingkatkan penginstal EFA ke 1.20.0 (dari1.18.0).

    • EFA-driver: efa-2.1 (dari) efa-1.16.0-1

    • EFA-config: efa-config-1.11-1 (tidak ada perubahan)

    • Profil EFA: efa-profile-1.5-1 (tidak ada perubahan)

    • libFabric-aws: libfabric-aws-1.16.1 (dari) libfabric-aws-1.16.0~amzn4.0-1

    • RDMA-core: rdma-core-43.0-2 dari () rdma-core-41.0-2

    • Buka MPI: openmpi40-aws-4.1.4-3 dari () openmpi40-aws-4.1.4-2

  • Peningkatan Slurm ke versi 22.05.7 (dari22.05.5).

  • Upgrade Python ke 3.9.16 dan. 3.7.16 (dari 3.9.15 dan3.7.13).

  • Dengan Slurm 22.05.7, node dinamis dalam IDLE+CLOUD+COMPLETING+POWER_DOWN+NOT_RESPONDING status tidak dianggap tidak sehat.

Untuk detail perubahannya, lihat CHANGELOG file untuk aws-parallelcluster, aws-parallelcluster-cookbook, dan paket aktif. aws-parallelcluster-node GitHub

22 Desember 2022

AWS ParallelCluster versi 3.3.1 dirilis

AWS ParallelCluster versi 3.3.1 dirilis.

Perubahan:

  • AWS ParallelCluster Produk resmi sekarang AMIs tersedia setelah EC2 penghentian Amazon pada dua tahun.

  • Tingkatkan ukuran memori AWS ParallelCluster API Lambda ke 2048 untuk mengurangi penalti start dingin dan menghindari batas waktu.

Perbaikan bug:

  • Mencegah penggantian sistem berkas Lustre yang dikelola FSx dan hilangnya data pada pembaruan klaster yang mencakup perubahan pada ID subnet armada komputasi.

  • SharedStorageDeletionPolicyberlaku untuk tindakan pembaruan cluster.

Untuk detail perubahannya, lihat CHANGELOG file untuk paket aws-parallelcluster di. GitHub

Desember 2, 2022

AWS ParallelCluster dokumentasi hanya catatan hpc6id

AWS ParallelCluster pembaruan khusus dokumentasi

Desember 2, 2022

AWS ParallelCluster versi 3.1.5 dirilis

AWS ParallelCluster versi 3.1.5 dirilis.

Penyempurnaan:

  • Perbaiki Slurm masalah yang mencegah penghentian node idle.

  • Tingkatkan penginstal EFA ke 1.18.0

    • Pengemudi EFA: efa-1.16.0-1

    • EFA-config: efa-config-1.11-1 (dari) efa-config-1.9-1

    • Profil EFA: efa-profile-1.5-1 (tidak ada perubahan)

    • Libfabric-aws: libfabric-aws-1.16.0~amzn4.0-1 (dari). libfabric-1.13.2

    • RDMA-core: rdma-core-41.0-2 (dari) rdma-core-37.0

    • Buka MPI: openmpi40-aws-4.1.4-2 (dariopenmpi40-aws-4.1.1-2)

Perubahan:

  • Tambahkan lambda:ListTags dan lambda:UntagResource ke tumpukan AWS ParallelCluster API yang ParallelClusterUserRole digunakan untuk pembaruan klaster.

  • Tingkatkan Perpustakaan Intel MPI ke Pembaruan Versi 2021 6 (dari Pembaruan Versi 2021 4). Untuk informasi selengkapnya, lihat Intel® MPI Library 2021 Update 6.

  • Tingkatkan driver NVIDIA ke versi 470.141.03 (dari 470.103.01).

  • Tingkatkan NVIDIA Fabric Manager ke versi 470.141.03 (dari 470.103.01).

Untuk detail perubahannya, lihat CHANGELOG file untuk aws-parallelcluster, aws-parallelcluster-cookbook, dan paket aktif. aws-parallelcluster-node GitHub

16 November 2022

AWS ParallelCluster versi 3.3.0 dirilis

AWS ParallelCluster versi 3.3.0 dirilis.

Penyempurnaan:

  • Tambahkan dukungan untuk konfigurasi alokasi beberapa instans untuk sumber daya komputasi saat menggunakan Slurm sebagai penjadwal. Untuk informasi selengkapnya, lihat Beberapa alokasi tipe instans dengan Slurm.

  • Tambahkan dukungan untuk menambah dan menghapus SharedStoragedengan pembaruan cluster, menggunakan konfigurasi yang diperbarui. Untuk informasi selengkapnya, lihat Penyimpanan bersama.

  • Tambahkan parameter konfigurasi baru DeletionPolicy untuk Efsdan pengaturan penyimpanan FsxLustrebersama untuk mendukung retensi penyimpanan.

  • Tambahkan dukungan untuk Slurm akuntansi dengan parameter konfigurasi baru Scheduling/SlurmSettings/Database. Untuk informasi selengkapnya, lihat Slurm akuntansi dengan AWS ParallelCluster.

  • Tambahkan dukungan untuk Reservasi Kapasitas Sesuai Permintaan (ODCR) dan grup sumber daya reservasi kapasitas. Untuk informasi selengkapnya, lihat Luncurkan instans dengan Reservasi Kapasitas Sesuai Permintaan (ODCR).

  • Tambahkan parameter konfigurasi baru untuk menentukan versi IMDS yang akan didukung di cluster atau membangun infrastruktur gambar di cluster, Imds/ImdsSupport, dan build, Imds/ImdsSupport, konfigurasi.

  • Tambahkan dukungan untuk Networking/PlacementGroupdi ComputeResourcesbagian SlurmQueues/.

  • Tambahkan dukungan untuk instance dengan beberapa antarmuka jaringan yang dibatasi hanya satu ENI per perangkat.

  • Tingkatkan validasi jaringan untuk sistem file Amazon EFS eksternal dengan memeriksa blok CIDR di grup keamanan terlampir.

  • Tambahkan validator untuk memeriksa apakah jenis instance yang dikonfigurasi mendukung grup penempatan.

  • Konfigurasikan utas NFS menjadi min (256, maks (8, num_core* 4)) untuk memastikan stabilitas dan kinerja yang lebih baik.

  • Pindahkan instalasi NFS pada waktu pembuatan untuk mengurangi waktu konfigurasi.

  • Aktifkan enkripsi sisi server untuk topik EcrImageBuilder SNS yang dibuat saat menerapkan AWS ParallelCluster API dan digunakan untuk memberi tahu tentang peristiwa docker image build.

Perubahan:

  • Ubah perilaku SlurmQueues/Networking/PlacementGroup/Enabled. Sekarang membuat grup penempatan terkelola yang unik untuk setiap sumber daya komputasi, bukan grup penempatan terkelola tunggal untuk semua sumber daya komputasi.

  • Tambahkan dukungan untuk SlurmQueues/Networking/PlacementGroup/Namesebagai metode penamaan yang disukai.

  • Pindahkan tag node kepala dari Launch Template ke definisi instance untuk menghindari penggantian node kepala pada pembaruan tag.

  • Nonaktifkan multithreading melalui skrip yang dijalankan oleh cloud-init dan bukan melalui CpuOptions set di Template Peluncuran.

  • Tingkatkan Python ke versi 3.9 dan NodeJS ke versi 16 di infrastruktur API, wadah API Docker, dan sumber daya Lambda cluster.

  • Hapus dukungan untuk Python 3.6 in. aws-parallelcluster-batch-cli

  • Peningkatan Slurm ke versi 22.05.5 (dari21.08.8-2).

  • Tingkatkan driver NVIDIA ke versi 470.141.03 (dari470.129.06).

  • Tingkatkan NVIDIA Fabric Manager ke versi 470.141.03 (dari470.129.06).

  • Tingkatkan NVIDIA CUDA Toolkit ke versi 11.7.1 (). from 11.4.4

  • Upgrade Python yang digunakan dalam AWS ParallelCluster virtualenvs dari ke. 3.7.13 3.9.15

  • Tingkatkan penginstal EFA ke versi 1.18.0.

    • EFA-driver: efa-1.16.0-1 (tidak ada perubahan)

    • Konfigurasi EFA: () efa-config-1.11-1 from efa-config-1.10-1

    • Profil EFA: efa-profile-1.5-1 (tidak ada perubahan)

    • Libfabric-aws: libfabric-aws-1.16.0~amzn4.0-1 (dari). libfabric-aws-1.16.0~amzn2.0-1

    • RDMA-core: rdma-core-41.0-2 (dari) rdma-core-37.0

    • Buka MPI: openmpi40-aws-4.1.4-2 (dariopenmpi40-aws-4.1.1-2)

  • Tingkatkan NICE DCV ke versi 2022.1-13300 (dari2022.0-12760).

  • Aktifkan penindasan SingleSubnetValidator forQueues.

  • Jangan mengganti DRAIN node saat node dalam COMPLETING keadaan karena Epilog mungkin masih berjalan.

Perbaikan bug:

  • Perbaiki validasi parameter filter dalam AWS ParallelCluster ListClusterLogStreams perintah untuk gagal ketika filter yang salah dilewatkan.

  • Perbaiki validasi SharedStorageEfsSettingsparameter/gagal validasi ketika FileSystemId ditentukan bersama dengan parameter SharedStorage/EfsSettingslainnya. Sebelumnya, FileSystemId tidak termasuk.

  • Perbaiki pembaruan cluster saat mengubah urutan SharedStoragebersama dengan perubahan lain dalam konfigurasi.

  • Perbaiki UpdateParallelClusterLambdaRole di AWS ParallelCluster API untuk mengunggah log ke CloudWatch.

  • Perbaiki Cinc tidak menggunakan bundel sertifikat CA lokal saat menginstal paket sebelum buku masak apa pun dijalankan.

  • Perbaiki hang dalam memutakhirkan ubuntu dengan pcluster build-image kapan Build:UpdateOsPackages:Enabled:true diatur.

  • Perbaiki parsing konfigurasi cluster YAMAL dengan gagal pada kunci duplikat.

Untuk detail perubahannya, lihat CHANGELOG file untuk aws-parallelcluster, aws-parallelcluster-cookbook, dan paket aktif. aws-parallelcluster-node GitHub

2 November 2022

AWS ParallelCluster dokumentasi hanya referensi API yang ditambahkan.

AWS ParallelCluster pembaruan khusus dokumentasi

27 Oktober 2022

AWS ParallelCluster versi 3.2.1 dirilis

AWS ParallelCluster versi 3.2.1 dirilis.

Penyempurnaan:

  • Tingkatkan logika untuk mengaitkan tabel perutean host ke kartu jaringan yang berbeda untuk mendukung EC2 instans Amazon dengan lebih baik dengan beberapa. NICs

Perubahan:

  • Tingkatkan driver NVIDIA ke versi 470.141.03.

  • Tingkatkan NVIDIA Fabric Manager ke versi 470.141.03.

  • Nonaktifkan tugas cron pekerjaan man-db danmlocate, yang mungkin berdampak negatif pada kinerja node.

  • Tingkatkan Perpustakaan Intel MPI ke 2021.6.0.602.

  • Upgrade Python dari 3.7.10 ke 3.7.13 sebagai tanggapan atas risiko keamanan ini.

Perbaikan bug:

  • Hindari kegagalan DescribeCluster saat konfigurasi cluster tidak tersedia.

Untuk detail perubahannya, lihat CHANGELOG file untuk aws-parallelcluster, aws-parallelcluster-cookbook, dan paket aktif. aws-parallelcluster-node GitHub

3 Oktober 2022

AWS ParallelCluster versi 3.2.0 dirilis

AWS ParallelCluster versi 3.2.0 dirilis.

Penyempurnaan:

Perubahan:

  • Tingkatkan penginstal EFA ke versi 1.17.2.

    • Pengemudi EFA: efa-1.16.0-1

    • Konfigurasi EFA: efa-config-1.10-1

    • Profil EFA: efa-profile-1.5-1

    • Libfabric: libfabric-aws-1.16.0~amzn2.0-1

    • Inti RDMA: rdma-core-41.0-2

    • Buka MPI: openmpi40-aws-4.1.4-2

  • Tingkatkan NICE DCV ke versi 2022.0-12760.

  • Tingkatkan driver NVIDIA ke versi 470.129.06.

  • Tingkatkan NVIDIA Fabric Manager ke versi 470.129.06.

  • Ubah tipe volume EBS default dari gp2 ke gp3 baik di root maupun volume tambahan.

  • Perubahan pada FSx sistem file Lustre yang dibuat oleh: AWS ParallelCluster

    • Ubah jenis penerapan default menjadiScratch_2.

    • Ubah versi server Lustre menjadi. 2.12

  • Tidak memerlukan PlacementGroup/Enableduntuk disetel ke true saat melewatiPlacementGroup/yang adaId.

  • Tidak mengizinkan pengaturanPlacementGroup/IdketikaPlacementGroup/secara eksplisit Enabled disetel ke. false

  • Tambahkan parallelcluster:cluster-name tag ke semua sumber daya yang dibuat oleh AWS ParallelCluster.

  • Tambahkan lambda:ListTags dan lambda:UntagResource ParallelClusterUserRole gunakan tumpukan AWS ParallelCluster API untuk pembaruan klaster.

  • Batasi IPv6 akses IMDS ke pengguna admin root dan cluster saja, ketika parameter konfigurasiHeadNode/Imds/Secureddiaktifkan.

  • Dengan AMI khusus, gunakan ukuran volume root AMI alih-alih ParallelCluster default 35 GiB. Nilai dapat diubah dalam file konfigurasi cluster.

  • Penonaktifan otomatis armada komputasi ketika parameter konfigurasiScheduling///SlurmQueuesComputeResources/SpotPricelebih rendah dari harga pemenuhan permintaan Spot minimum yang diperlukan.

  • Tampilkan requested_value dan current_value nilai dalam set perubahan saat menambahkan atau menghapus bagian selama pembaruan.

  • Nonaktifkan aws-ubuntu-eni-helper layanan, tersedia di Deep Learning AMIs, untuk menghindari konflik configure_nw_interface.sh saat mengonfigurasi instance dengan beberapa kartu jaringan.

  • Hapus dukungan untuk Python 3.6.

  • Setel MTU ke 9001 untuk semua antarmuka jaringan saat mengonfigurasi instance dengan beberapa kartu jaringan.

  • Hapus trailing dot saat mengonfigurasi node komputasi FQDN.

  • Kelola node statis diPOWERING_DOWN.

  • Tidak menggantikan node dinamis POWER_DOWN karena pekerjaan mungkin masih berjalan.

  • Mulai ulang clustermgtd dan slurmctld daemon pada waktu pembaruan cluster hanya ketika Scheduling parameter diperbarui dalam konfigurasi cluster.

  • Perbarui slurmctld dan slurmd systemd layanan file.

  • Batasi IPv6 akses ke IMDS hanya untuk pengguna root dan cluster admin, saat parameter konfigurasiHeadNode/Imds/Secureddiaktifkan.

  • Set Slurm konfigurasi AuthInfo=cred_expire=70 untuk mengurangi waktu pekerjaan yang diminta harus menunggu sebelum memulai lagi ketika node tidak tersedia.

  • Tingkatkan dependensi buku masak pihak ketiga:

    • apt-7.4.2 (dari apt-7.4.0)

    • baris-4.5.2 (dari baris-4.0.1)

    • openssh-2.10.3 (dari openssh-2.9.1)

    • pyenv-3.5.1 (dari pyenv-3.4.2)

    • selinux-6.0.4 (dari selinux-3.1.1)

    • yum-7.4.0 (dari yum-6.1.1)

    • yum-epel-4.5.0 (dari yum-epel-4.1.2)

Perbaikan bug:

  • Perbaiki perilaku default untuk melewati langkah AWS ParallelCluster validasi dan pengujian saat membuat AMI kustom.

  • Perbaiki kebocoran pegangan file. computemgtd

  • Perbaiki kondisi balapan yang secara sporadis menyebabkan instance yang diluncurkan segera dihentikan karena belum tersedia dalam respons. EC2 DescribeInstances

  • Perbaiki dukungan untuk DisableSimultaneousMultithreading parameter pada tipe instans dengan prosesor Arm.

  • Perbaiki kegagalan pembaruan tumpukan AWS ParallelCluster API saat memutakhirkan dari versi sebelumnya. Tambahkan pola sumber daya yang digunakan untuk ListImagePipelineImages Action diEcrImageDeletionLambdaRole.

  • Perbaiki AWS ParallelCluster API yang menambahkan izin yang hilang yang diperlukan untuk mengimpor atau mengekspor dari Amazon S3 saat membuat FSx sistem file untuk Lustre.

Untuk detail perubahannya, lihat CHANGELOG file untuk aws-parallelcluster, aws-parallelcluster-cookbook, dan paket aktif. aws-parallelcluster-node GitHub

27 Juli 2022

AWS ParallelCluster pembaruan khusus dokumentasi tahun ini hingga saat ini

AWS ParallelCluster pembaruan khusus dokumentasi.

Pembaruan bagian:

6 Juli 2022

AWS ParallelCluster versi 3.1.4 dirilis

AWS ParallelCluster versi 3.1.4 dirilis.

Penyempurnaan:

Perubahan:

  • Peningkatan Slurm ke versi 21.08.8-2.

  • Membangun Slurm dengan dukungan JWT.

  • Tidak memerlukan PlacementGroup/Enableduntuk disetel ke true saat melewatiPlacementGroup/yang adaId.

  • Tambahkan lambda:TagResource untuk ParallelClusterUserRole digunakan oleh tumpukan ParallelCluster API untuk pembuatan cluster dan pembuatan gambar.

Perbaikan bug:

  • Perbaiki kemampuan untuk mengekspor log cluster saat menggunakan export-cluster-logs perintah dengan --filters opsi.

  • Perbaiki titik masuk AWS Batch Docker untuk menggunakan direktori /home bersama untuk mengoordinasikan eksekusi Multi-node-Parallel pekerjaan.

  • Setel ulang alamat node saat mengatur Slurm node statis yang tidak sehat ke bawah untuk menghindari perawatan node statis gagal dengan kapasitas yang tidak mencukupi sebagai node kegagalan bootstrap.

Untuk detail perubahannya, lihat CHANGELOG file untuk aws-parallelcluster, aws-parallelcluster-cookbook, dan paket aktif. aws-parallelcluster-node GitHub

Mei 16, 2022

AWS ParallelCluster versi 3.1.3 dirilis

AWS ParallelCluster versi 3.1.3 dirilis.

Penyempurnaan:

  • Jalankan pembuatan kunci SSH bersama dengan pembuatan direktori HOME, misalnya, selama login SSH, saat beralih ke pengguna lain dan saat menjalankan perintah sebagai pengguna lain.

  • Tambahkan dukungan untuk FQDN dan LDAP Distinguished Names dalam parameter konfigurasi/. DirectoryServiceDomainName Validator baru sekarang memeriksa kedua sintaks.

  • update_directory_service_password.shSkrip baru yang digunakan pada node kepala mendukung pembaruan manual kata sandi Direktori Aktif dalam konfigurasi SSSD. Kata sandi diambil oleh AWS Secrets Manager as dari konfigurasi cluster.

  • Tambahkan dukungan untuk menerapkan infrastruktur API di lingkungan tanpa VPC default.

Perubahan:

  • Nonaktifkan C-States yang lebih dalam di x86_64 resmi AMIs dan AMIs dibuat melalui build-image perintah, untuk menjamin kinerja tinggi dan latensi rendah.

  • Pembaruan paket OS dan perbaikan keamanan.

  • Ubah gambar dasar Amazon Linux 2 untuk digunakan AMIs dengan Kernel 5.10.

Perbaikan bug:

  • Perbaiki tumpukan build-image DELETE_FAILED setelah image dibangun berhasil, karena kebijakan EC2 Image Builder baru.

  • Perbaiki parameter DirectoryServiceDomainAddrkonfigurasi/konversi ke properti ldap_uri SSSD ketika berisi beberapa alamat domain.

Untuk detail perubahan, lihat CHANGELOG file untuk aws-parallelcluster, dan paket aktif. aws-parallelcluster-cookbook GitHub

20 April 2022

AWS ParallelCluster versi 3.1.2 dirilis

AWS ParallelCluster versi 3.1.2 dirilis.

Perubahan:

  • Peningkatan Slurm ke versi 21.08.6 (dari21.08.5).

Perbaikan bug:

  • Perbaiki pembaruan /etc/hosts file pada node komputasi saat cluster digunakan di subnet tanpa akses internet.

  • Perbaiki node komputasi bootstrap untuk menunggu inisialisasi drive sementara sebelum bergabung dengan cluster.

Untuk detail perubahannya, lihat CHANGELOG file untuk paket aws-parallelcluster aktif. GitHub

2 Maret 2022

AWS ParallelCluster versi 3.1.1 dirilis

AWS ParallelCluster versi 3.1.1 dirilis.

  • Tambahkan dukungan untuk beberapa lingkungan cluster pengguna dengan mengintegrasikan dengan domain Active Directory (AD) yang dikelola. AWS Directory Service

  • Tambahkan dukungan untuk UseEc2Hostnamesdalam file konfigurasi cluster. Jika disetel ke true, gunakan nama host EC2 default Amazon (misalnya ip-1-2-3-4) untuk node komputasi.

  • Tambahkan dukungan untuk pembuatan cluster di subnet tanpa akses internet.

  • Tambahkan dukungan untuk beberapa jenis instans komputasi per antrian.

  • Tambahkan dukungan untuk penjadwalan GPU dengan Slurm pada instance ARM dengan kartu NVIDIA.

  • Tambahkan flag disingkat untuk cluster-name (-n), region (-r), image-id (-i) dancluster-configuration/image-configuration(-c) ke CLI AWS ParallelCluster .

  • Tambahkan dukungan untuk NEW_CHANGED_DELETED opsi FSx untuk parameter Lustre AutoImportPolicy.

  • Tambahkan parallelcluster:compute-resource-name tag ke EC2 LaunchTemplates sumber daya yang digunakan oleh node komputasi.

  • Tingkatkan grup keamanan yang dibuat di dalam klaster untuk memungkinkan koneksi masuk dari grup keamanan khusus saat SecurityGroups parameter ditentukan untuk beberapa node kepala dan/atau antrian.

  • Instal driver NVIDIA dan perpustakaan CUDA untuk ARM.

Perubahan:

  • Peningkatan Slurm ke versi 21.08.5 (dari20.11.8).

  • Peningkatan Slurm plugin ke versi 21.08 (dari20.11).

  • Tingkatkan NICE DCV ke versi 2021.3-11591 (dari2021.1-10851).

  • Tingkatkan driver NVIDIA ke versi 470.103.01 (dari470.57.02).

  • Tingkatkan manajer NVIDIA Fabric ke versi 470.103.01 (dari470.57.02).

  • Tingkatkan CUDA ke versi 11.4.4 (dari11.4.0).

  • Intel MPI diperbarui ke Pembaruan Versi 2021 4 (diperbarui dari Pembaruan Versi 2019 8). Untuk informasi selengkapnya, lihat Intel® MPI Library 2021 Update 4.

  • Tingkatkan PMIx ke versi 3.2.3 (dari3.1.5).

  • Hapus dumping node komputasi yang gagal ke. /home/logs/compute File log node komputasi tersedia di dalam CloudWatch dan di log EC2 konsol Amazon.

  • Aktifkan potensi untuk menekan SlurmQueues dan ComputeResources memperpanjang validator.

  • Nonaktifkan pembaruan paket pada waktu peluncuran instans di Amazon Linux 2.

  • Nonaktifkan metadata gambar Amazon yang EC2 ImageBuilder disempurnakan saat membuat gambar AWS ParallelCluster khusus.

  • Secara eksplisit mengatur sumber cloud-init data menjadi. EC2 Ini menghemat waktu boot untuk platform Ubuntu dan CentOS.

  • Gunakan nama sumber daya komputasi daripada jenis instance dalam nama template peluncuran armada komputasi.

  • Arahkan stderr dan stdout ke file log CLI untuk mencegah teks yang tidak diinginkan dalam output CLI pcluster.

  • Pindahkan resep konfigurasi/instal ke buku masak terpisah yang dipanggil dari yang utama. Entrypoint yang ada dipertahankan dan kompatibel ke belakang.

  • Unduh dependensi platform Intel HPC selama waktu pembuatan AMI untuk menghindari kontak internet selama waktu pembuatan cluster.

  • Jangan hapus - dari nama sumber daya komputasi saat mengonfigurasi node Slurm.

  • Jangan mengkonfigurasi GPUs Slurm ketika driver NVIDIA tidak diinstal.

  • Perbaiki ecs:ListContainerInstances izin diBatchUserRole.

  • Perbaiki ekspor log cluster ketika tidak ada awalan yang ditentukan, sebelumnya diekspor ke awalan. None

  • Perbaiki rollback yang tidak dilakukan jika terjadi kegagalan pembaruan cluster.

  • Perbaiki ecs:ListContainerInstances izin diBatchUserRole.

  • Perbaiki RootVolume skema untuk HeadNode dengan memunculkan kesalahan jika tidak didukung KmsKeyId ditentukan.

  • Perbaiki metrik Amazon yang FSx hilang untuk ditampilkan di CloudWatch Dasbor.

  • PerbaikiEfaSecurityGroupValidator. Sebelumnya, itu berpotensi menghasilkan kegagalan palsu ketika grup keamanan khusus disediakan dan EFA diaktifkan.

Untuk detail perubahannya, lihat CHANGELOG file untuk aws-parallelcluster, aws-parallelcluster-cookbook, dan paket aktif. aws-parallelcluster-node GitHub

Februari 10, 2022

AWS ParallelCluster versi 3.0.3 dirilis

AWS ParallelCluster versi 3.0.3 dirilis.

Untuk detail perubahan, lihat CHANGELOG file untuk aws-parallelcluster dan paket di. aws-parallelcluster-cookbook GitHub

Januari 17, 2022

AWS ParallelCluster versi 3.0.2 dirilis

AWS ParallelCluster versi 3.0.2 dirilis.

Tingkatkan Elastic Fabric Adapter penginstal ke 1.14.1

  • Konfigurasi EFA: efa-config-1.9-1 (dari) efa-config-1.9

  • Profil EFA: efa-profile-1.5-1 (dariefa-profile-1.5)

  • Modul Kernel EFA: efa-1.14.2 (dariefa-1.13.0)

  • Inti RDMA: rdma-core-37.0 (dari) rdma-core-35

  • Libfabric: libfabric-1.13.2 (darilibfabric-1.13.0)

  • Buka MPI: openmpi40-aws-4.1.1-2 (tidak ada perubahan)

GPUDirect RDMA selalu diaktifkan jika didukung oleh jenis instance. Opsi GdrSupportkonfigurasi tidak berpengaruh.

Untuk detail perubahannya, lihat CHANGELOG file untuk aws-parallelcluster, aws-parallelcluster-cookbookdan paket aktif. aws-parallelcluster-node GitHub

November 5, 2021

AWS ParallelCluster versi 3.0.1 dirilis

AWS ParallelCluster versi 3.0.1 dirilis.

Alat migrasi konfigurasi cluster

  • Pelanggan sekarang dapat memigrasikan konfigurasi klaster mereka dari format AWS ParallelCluster versi 2 ke format versi 3 berbasis YAML AWS ParallelCluster . Untuk informasi selengkapnya, lihat pcluster3-config-converter.

Wilayah AWS Membaca default dari ~/.aws/config file

  • Untuk pcluster perintah, jika tidak Wilayah AWS ditentukan dalam file konfigurasi, di lingkungan, atau pada baris perintah, default yang Wilayah AWS ditentukan dalam region pengaturan di [default] bagian ~/.aws/config file digunakan.

Untuk detail perubahannya, lihat CHANGELOG file untuk aws-parallelcluster, aws-parallelcluster-cookbookdan paket aktif. aws-parallelcluster-node GitHub

27 Oktober 2021

AWS ParallelCluster versi 3.0.0 dirilis

AWS ParallelCluster versi 3.0.0 dirilis.

Support untuk manajemen klaster melalui Amazon API Gateway

  • Pelanggan sekarang dapat mengelola dan menerapkan cluster melalui titik akhir HTTP dengan Amazon API Gateway. Ini membuka kemungkinan baru untuk alur kerja skrip atau berbasis peristiwa.

    Antarmuka baris AWS ParallelCluster perintah (CLI) juga telah didesain ulang untuk kompatibilitas dengan API ini dan menyertakan opsi keluaran JSON baru. Fungsionalitas baru ini memungkinkan pelanggan untuk menerapkan kemampuan blok bangunan serupa menggunakan CLI juga.

Peningkatan kreasi AMI kustom

  • Pelanggan sekarang memiliki akses ke proses yang lebih kuat untuk membuat dan mengelola kustom AMIs menggunakan EC2 Image Builder. Kustom sekarang AMIs dapat dikelola melalui file AWS ParallelCluster konfigurasi terpisah, dan dapat dibuat menggunakan pcluster build-image perintah di antarmuka baris AWS ParallelCluster perintah.

Untuk detail perubahannya, lihat CHANGELOG file untuk aws-parallelcluster, aws-parallelcluster-cookbookdan paket aktif. aws-parallelcluster-node GitHub

10 September 2021

PrivasiSyarat situsPreferensi cookie
© 2025, Amazon Web Services, Inc. atau afiliasinya. Semua hak dilindungi undang-undang.