Praktik terbaik

Bagian berikut memberikan praktik terbaik untuk digunakan AWS ParallelCluster, yang mencakup kinerja jaringan dan peringatan anggaran.

Praktik terbaik: pemilihan tipe instance node kepala

Meskipun node kepala tidak menjalankan pekerjaan, fungsi dan ukurannya sangat penting untuk kinerja cluster secara keseluruhan. Saat Anda memilih jenis instance yang akan digunakan untuk node kepala Anda, pertimbangkan karakteristik berikut:

Ukuran cluster: Head node mengatur logika penskalaan cluster dan bertanggung jawab untuk melampirkan node baru ke scheduler. Untuk meningkatkan dan menurunkan cluster yang memiliki jumlah node besar, berikan node kepala beberapa kapasitas komputasi tambahan.

Sistem file bersama: Saat Anda menggunakan sistem file bersama, pilih jenis instans dengan bandwidth jaringan yang cukup, dan EBS bandwidth Amazon yang cukup, untuk menangani alur kerja Anda. Pastikan node kepala dapat mengekspos direktori NFS server yang cukup untuk cluster dan menangani artefak yang perlu dibagi antara node komputasi dan node kepala.

Praktik terbaik: kinerja jaringan

Kinerja jaringan sangat penting untuk aplikasi komputasi kinerja tinggi (HPC). Tanpa kinerja jaringan yang andal, aplikasi ini tidak dapat berfungsi seperti yang diharapkan. Untuk mengoptimalkan kinerja jaringan, pertimbangkan praktik terbaik berikut.

Grup penempatan: Jika Anda menggunakan Slurm, pertimbangkan untuk mengonfigurasi masing-masing Slurm antrian untuk menggunakan grup penempatan cluster. Grup penempatan klaster adalah pengelompokan logis instance dalam satu Availability Zone. Untuk informasi selengkapnya, lihat grup penempatan di Panduan EC2 Pengguna Amazon. Anda dapat menentukan a PlacementGroupdi Networkingbagian antrian, setiap sumber daya komputasi ditetapkan ke grup penempatan antrian. Saat menentukan PlacementGroupdi Networkingbagian sumber daya komputasi, sumber daya komputasi tertentu ditetapkan ke grup penempatan tersebut. Spesifikasi grup penempatan sumber daya komputasi mengesampingkan spesifikasi antrian untuk sumber daya komputasi. Untuk informasi lebih lanjut, lihat SlurmQueues/Networking/PlacementGroupdan SlurmQueues/ComputeResources/Networking/PlacementGroup.
```
Networking:
  PlacementGroup:
    Enabled: true
    Id: your-placement-group-name
```
Atau, AWS ParallelCluster buat grup penempatan untuk Anda.
```
Networking:
  PlacementGroup:
    Enabled: true
```
Dimulai dengan AWS ParallelCluster versi 3.3.0, pembuatan dan manajemen grup penempatan dimodifikasi. Saat Anda menentukan grup penempatan yang akan diaktifkan, tanpa name atau, dalam antrianId, setiap sumber daya komputasi ditetapkan grup penempatan terkelolanya sendiri, bukan satu grup terkelola untuk seluruh antrian. Ini membantu mengurangi kesalahan kapasitas yang tidak mencukupi. Jika Anda perlu memiliki satu grup penempatan untuk seluruh antrian, Anda dapat menggunakan grup penempatan bernama.

SlurmQueues/Networking/PlacementGroup/Nameditambahkan sebagai alternatif yang disukai untuk SlurmQueues/Networking/PlacementGroup/Id.

Untuk informasi selengkapnya, lihat Networking.
Jaringan yang disempurnakan: Pertimbangkan untuk memilih jenis instance yang mendukung peningkatan jaringan. Rekomendasi ini berlaku untuk semua instance generasi saat ini. Untuk informasi selengkapnya, lihat jaringan yang disempurnakan di Linux di Panduan EC2 Pengguna Amazon.
Adaptor Kain Elastis: Untuk mendukung tingkat tinggi instans yang dapat diskalakan untuk komunikasi instance, pertimbangkan untuk memilih antarmuka EFA jaringan untuk jaringan Anda. Perangkat keras bypass sistem operasi (OS) yang dibuat khusus meningkatkan komunikasi instance ke instance dengan elastisitas dan fleksibilitas sesuai permintaan. EFA AWS Cloud Anda dapat mengkonfigurasi masing-masing Slurm antrian ComputeResourceuntuk digunakan Efa. Untuk informasi lebih lanjut tentang menggunakan EFA with AWS ParallelCluster, lihatElastic Fabric Adapter.
```
ComputeResources:
  - Name: your-compute-resource-name
    Efa:
      Enabled: true
```
Untuk informasi selengkapnyaEFA, lihat Adaptor Kain Elastis di Panduan EC2 Pengguna Amazon untuk Instans Linux.
Bandwidth instance: Skala bandwidth dengan ukuran instans. Untuk informasi tentang berbagai jenis instans, lihat Instans EBS yang dioptimalkan Amazon dan jenis EBS volume Amazon di EC2Panduan Pengguna Amazon.

Praktik terbaik: peringatan anggaran

Untuk mengelola biaya sumber daya di AWS ParallelCluster, kami sarankan Anda menggunakan AWS Budgets tindakan untuk membuat anggaran. Anda juga dapat membuat peringatan ambang anggaran yang ditentukan untuk AWS sumber daya yang dipilih. Untuk informasi selengkapnya, lihat Mengonfigurasi tindakan anggaran di Panduan AWS Budgets Pengguna. Demikian pula, Anda juga dapat menggunakan Amazon CloudWatch untuk membuat alarm penagihan. Untuk informasi selengkapnya, lihat Membuat alarm penagihan untuk memantau perkiraan AWS biaya.

Praktik terbaik: memindahkan cluster ke versi AWS ParallelCluster minor atau patch baru

Saat ini setiap versi AWS ParallelCluster minor mandiri bersama dengan nya pclusterCLI. Untuk memindahkan cluster ke versi minor atau patch baru, Anda harus membuat ulang cluster menggunakan versi baru. CLI

Untuk mengoptimalkan proses pemindahan cluster ke versi minor atau patch baru, kami sarankan Anda melakukan hal berikut:

Simpan data pribadi dalam volume eksternal yang dibuat di luar cluster, seperti Amazon EFS dan FSx untuk Lustre. Dengan melakukan ini, Anda dapat dengan mudah memindahkan data dari satu cluster ke cluster lain di masa depan.
Buat sistem penyimpanan bersama menggunakan jenis berikut. Anda dapat membuat sistem ini menggunakan AWS CLI atau AWS Management Console.
- SharedStorage / EbsSettings / VolumeId
- SharedStorage / EfsSettings / FileSystemId
- SharedStorage / FsxLustreSettings / FileSystemId
Tentukan sistem file atau volume dalam konfigurasi cluster sebagai sistem file atau volume yang ada. Dengan cara ini, mereka dipertahankan saat Anda menghapus cluster dan dapat dilampirkan ke cluster baru.

Kami menyarankan Anda menggunakan Amazon EFS atau FSx untuk sistem file Lustre. Kedua sistem ini dapat dilampirkan ke beberapa cluster pada saat yang bersamaan. Selain itu, Anda dapat melampirkan salah satu dari sistem ini ke cluster baru sebelum Anda menghapus cluster yang ada.
Gunakan tindakan bootstrap khusus untuk menyesuaikan instance Anda daripada menggunakan kustomAMI. Jika sebaliknya, Anda menggunakan kustomAMI, maka Anda perlu menghapus dan membuatnya ulang AMI untuk setiap rilis versi baru.
Kami menyarankan Anda menerapkan rekomendasi sebelumnya dalam urutan berikut:
1. Perbarui konfigurasi cluster yang ada untuk menggunakan definisi sistem file yang ada.
2. Verifikasi pcluster versi dan perbarui jika diperlukan.
3. Buat dan uji cluster baru. Saat Anda menguji cluster baru, periksa hal berikut:
  - Pastikan data Anda tersedia di cluster baru.
  - Pastikan aplikasi Anda bekerja di cluster baru.
4. Setelah cluster baru Anda sepenuhnya diuji dan operasional dan Anda tidak lagi membutuhkan cluster yang ada, hapus.

Awas Javascript dinonaktifkan atau tidak tersedia di browser Anda.

Untuk menggunakan Dokumentasi AWS, Javascript harus diaktifkan. Lihat halaman Bantuan browser Anda untuk petunjuk.

Konvensi Dokumen

Contoh AWS Managed Microsoft AD atas konfigurasi cluster LDAP (S)

Pindah dari AWS ParallelCluster 2.x ke 3.x

Pilih preferensi cookie Anda

Sesuaikan preferensi cookie

Penting

Kinerja

Fungsional

Iklan

Tidak dapat menyimpan preferensi cookie

Praktik terbaik

Praktik terbaik: pemilihan tipe instance node kepala

Praktik terbaik: kinerja jaringan

Praktik terbaik: peringatan anggaran

Praktik terbaik: memindahkan cluster ke versi AWS ParallelCluster minor atau patch baru

Apakah halaman ini membantu Anda?

Topik berikutnya:

Topik sebelumnya:

Perlu bantuan?