Pilih preferensi cookie Anda

Kami menggunakan cookie penting serta alat serupa yang diperlukan untuk menyediakan situs dan layanan. Kami menggunakan cookie performa untuk mengumpulkan statistik anonim sehingga kami dapat memahami cara pelanggan menggunakan situs dan melakukan perbaikan. Cookie penting tidak dapat dinonaktifkan, tetapi Anda dapat mengklik “Kustom” atau “Tolak” untuk menolak cookie performa.

Jika Anda setuju, AWS dan pihak ketiga yang disetujui juga akan menggunakan cookie untuk menyediakan fitur situs yang berguna, mengingat preferensi Anda, dan menampilkan konten yang relevan, termasuk iklan yang relevan. Untuk menerima atau menolak semua cookie yang tidak penting, klik “Terima” atau “Tolak”. Untuk membuat pilihan yang lebih detail, klik “Kustomisasi”.

Buat grup node terkelola dengan Blok Kapasitas untuk ML

Mode fokus
Buat grup node terkelola dengan Blok Kapasitas untuk ML - Amazon EKS

Bantu tingkatkan halaman ini

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Untuk berkontribusi pada panduan pengguna ini, pilih Edit halaman ini pada GitHub tautan yang terletak di panel kanan setiap halaman.

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Bantu tingkatkan halaman ini

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Untuk berkontribusi pada panduan pengguna ini, pilih Edit halaman ini pada GitHub tautan yang terletak di panel kanan setiap halaman.

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Blok Kapasitas untuk pembelajaran mesin (ML) memungkinkan Anda melakukan reservasi instans GPU di masa mendatang untuk mendukung beban kerja MS berdurasi pendek Anda. Untuk informasi selengkapnya, lihat Blok Kapasitas untuk ML di Panduan EC2 Pengguna Amazon untuk Instans Linux.

Pertimbangan

penting
  • Blok Kapasitas hanya tersedia untuk jenis dan AWS Wilayah EC2 instans Amazon tertentu. Untuk informasi kompatibilitas, lihat Prasyarat Bekerja dengan Blok Kapasitas di Panduan EC2 Pengguna Amazon untuk Instans Linux.

  • Untuk informasi selengkapnya, lihat Menggunakan Blok Kapasitas untuk beban kerja pembelajaran mesin di Panduan Pengguna Amazon EC2 Auto Scaling.

  • Grup node terkelola dengan Blok Kapasitas hanya dapat dibuat dengan templat peluncuran khusus.

  • Saat memutakhirkan grup node terkelola dengan Blok Kapasitas, pastikan ukuran grup node yang diinginkan diatur ke0.

Membuat grup node terkelola dengan Amazon EC2 Capacity Blocks

Anda dapat menggunakan Blok Kapasitas dengan grup node terkelola Amazon EKS untuk menyediakan dan menskalakan node pekerja yang dipercepat GPU. Contoh AWS CloudFormation template yang mengikuti tidak mencakup setiap aspek yang diperlukan dalam cluster produksi. Biasanya, Anda juga ingin skrip bootstrap bergabung dengan node ke cluster dan menentukan AMI yang dipercepat Amazon EKS. Untuk informasi selengkapnya, lihat Buat grup node terkelola untuk klaster Anda.

  1. Buat template peluncuran yang sesuai untuk beban kerja Anda dan bekerja dengan grup node terkelola Amazon EKS. Untuk informasi selengkapnya, lihat Sesuaikan node terkelola dengan templat peluncuran.

    Selain persyaratan dalam prosedur di atas, pastikan bahwa LaunchTemplateData termasuk yang berikut:

    • InstanceMarketOptionsdengan MarketType set ke "capacity-block"

    • CapacityReservationSpecification: CapacityReservationTargetdengan CapacityReservationId diatur ke Blok Kapasitas (misalnya:cr-02168da1478b509e0 )

    • InstanceTypedisetel ke jenis instance yang mendukung Blok Kapasitas (misalnya:p5.48xlarge)

      Berikut ini adalah kutipan dari template yang membuat CloudFormation template peluncuran yang menargetkan Blok Kapasitas. Untuk membuat grup node terkelola AMI kustom, Anda juga dapat menambahkan ImageId dan UserData parameter.

      NodeLaunchTemplate: Type: "AWS::EC2::LaunchTemplate" Properties: LaunchTemplateData: InstanceMarketOptions: MarketType: "capacity-block" CapacityReservationSpecification: CapacityReservationTarget: CapacityReservationId: "cr-02168da1478b509e0" InstanceType: p5.48xlarge
  2. Gunakan template peluncuran untuk membuat grup node terkelola.

    Berikut ini adalah contoh membuat perintah grup node untuk Blok Kapasitas. Ganti example-values dengan yang berlaku untuk cluster Anda.

    Saat membuat grup node terkelola Blok Kapasitas, lakukan hal berikut:

    • Atur capacity-type ke "CAPACITY_BLOCK" . Jika jenis kapasitas tidak disetel ke "CAPACITY_BLOCK" atau salah satu nilai template peluncuran wajib lainnya di atas hilang, maka permintaan buat akan ditolak.

    • Saat menentukan subnets dalam permintaan buat, pastikan untuk hanya menentukan subnet di Availability Zone yang sama dengan reservasi kapasitas.

    • Jika Anda menentukan bukan nol desiredSize dalam permintaan buat, Amazon EKS akan menghormatinya saat membuat grup Auto Scaling (ASG). Namun, jika permintaan pembuatan dibuat sebelum reservasi kapasitas aktif, ASG tidak akan dapat meluncurkan EC2 instans Amazon hingga menjadi aktif. Akibatnya, aktivitas penskalaan ASG akan mengalami kesalahan peluncuran. Setiap kali reservasi menjadi aktif, maka peluncuran instans akan berhasil dan ASG akan ditingkatkan hingga yang desiredSize disebutkan pada waktu pembuatan.

      aws eks create-nodegroup \ --cluster-name my-cluster \ --nodegroup-name my-mng \ --node-role node-role-arn \ --region region-code \ --subnets subnet-id \ --scaling-config minSize=node-group-min-size,maxSize=node-group-max-size,desiredSize=node-group-desired-size \ --ami-type "AL2023_x86_64_NVIDIA" \ --capacity-type "CAPACITY_BLOCK" \ --launch-template id="lt-id",version=1
  3. Pastikan node bergabung setelah skala naik. Cluster Amazon EKS yang menggunakan grup node terkelola dengan Blok Kapasitas tidak melakukan validasi apa pun bahwa instans yang diluncurkan benar-benar bergabung dan mendaftar dengan cluster.

  4. Jika Anda desiredSize mengatur 0 pada waktu pembuatan, maka Anda memiliki opsi berbeda untuk meningkatkan grup node saat reservasi kapasitas menjadi aktif:

    • Buat kebijakan penskalaan terjadwal untuk ASG yang selaras dengan waktu mulai reservasi Blok Kapasitas. Untuk informasi selengkapnya, lihat Penskalaan terjadwal untuk EC2 Auto Scaling Amazon di Panduan Pengguna Amazon Auto EC2 Scaling.

    • Gunakan konsol Amazon EKS atau eks update-nodegroup-config untuk memperbarui konfigurasi penskalaan dan mengatur ukuran grup node yang diinginkan.

    • Gunakan Kubernetes Cluster Autoscaler. Untuk informasi selengkapnya, lihat Cluster Autoscaler di. AWS

  5. Grup node sekarang siap untuk beban kerja dan Pod yang akan dijadwalkan.

  6. Agar Pod Anda terkuras dengan baik sebelum reservasi berakhir, Amazon EKS menggunakan kebijakan penskalaan terjadwal untuk menurunkan ukuran grup node menjadi. 0 Penskalaan terjadwal ini akan ditetapkan dengan nama berjudulAmazon EKS Node Group Capacity Scaledown Before Reservation End. Kami menyarankan untuk tidak mengedit atau menghapus tindakan ini.

    Amazon EC2 mulai mematikan instans 30 menit sebelum waktu akhir reservasi. Akibatnya, Amazon EKS akan mengatur penurunan skala terjadwal pada grup node 40 menit sebelum reservasi mereka berakhir untuk mengusir Pod dengan aman dan anggun.

PrivasiSyarat situsPreferensi cookie
© 2025, Amazon Web Services, Inc. atau afiliasinya. Semua hak dilindungi undang-undang.