Gunakan Capacity Blocks untuk beban kerja pembelajaran mesin - EC2Auto Scaling Amazon

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Gunakan Capacity Blocks untuk beban kerja pembelajaran mesin

Capacity Blocks membantu Anda memesan GPU instance yang sangat dicari di masa mendatang untuk mendukung beban kerja machine learning (ML) berdurasi pendek Anda.

Untuk ikhtisar Capacity Blocks dan bagaimana mereka bekerja, lihat Capacity Blocks untuk ML di Panduan EC2 Pengguna Amazon.

Untuk mulai menggunakan Capacity Blocks, Anda membuat reservasi kapasitas di Availability Zone tertentu. Capacity Blocks dikirimkan sebagai reservasi targeted kapasitas dalam satu Availability Zone. Saat Anda membuat template peluncuran, tentukan ID reservasi dan jenis instans Blok Kapasitas. Kemudian, perbarui grup Auto Scaling Anda untuk menggunakan templat peluncuran yang Anda buat dan Zona Ketersediaan Blok Kapasitas. Saat reservasi Blok Kapasitas dimulai, gunakan penskalaan terjadwal untuk meluncurkan jumlah instans yang sama dengan reservasi Blok Kapasitas Anda.

penting

Capacity Blocks hanya tersedia untuk jenis EC2 instans Amazon tertentu dan Wilayah AWS. Untuk informasi selengkapnya, lihat Prasyarat di Panduan Pengguna Amazon. EC2

Pedoman operasional

Berikut ini adalah pedoman operasional dasar yang harus Anda ikuti saat menggunakan Blok Kapasitas dengan grup Auto Scaling.

  • Skala dalam grup Auto Scaling Anda menjadi nol lebih dari 30 menit sebelum waktu akhir reservasi Blok Kapasitas. Amazon EC2 akan menghentikan instans apa pun yang masih berjalan 30 menit sebelum waktu akhir Blok Kapasitas.

  • Kami menyarankan Anda menggunakan penskalaan terjadwal untuk memperkecil skala (menambahkan instance) dan menskalakan (menghapus instans) pada waktu reservasi yang sesuai. Untuk informasi selengkapnya, lihat Penskalaan terjadwal untuk Amazon EC2 Auto Scaling.

  • Tambahkan kait siklus hidup sesuai kebutuhan untuk melakukan shutdown aplikasi yang anggun di dalam instance saat melakukan penskalaan. Berikan waktu yang cukup untuk menyelesaikan tindakan siklus hidup sebelum Amazon EC2 mulai menghentikan instans Anda secara paksa 30 menit sebelum waktu akhir reservasi Blok Kapasitas. Untuk informasi selengkapnya, lihat Hook siklus aktif Amazon EC2 Auto Scaling.

  • Pastikan bahwa grup Auto Scaling menunjuk ke versi template peluncuran yang benar selama seluruh durasi reservasi. Kami merekomendasikan untuk menunjuk ke versi tertentu dari template peluncuran alih-alih $Latest versi $Default atau.

catatan

Jika Anda membiarkan instans Blok Kapasitas berjalan hingga akhir reservasi dan Amazon EC2 merebutnya kembali, aktivitas penskalaan untuk grup Auto Scaling Anda menyatakan bahwa itu adalah "taken out of service in response to an EC2 health check that indicated it had been terminated or stopped“, meskipun sengaja direklamasi di akhir Blok Kapasitas. Demikian pula, Amazon EC2 Auto Scaling akan mencoba mengganti instance dengan cara yang sama seperti halnya untuk setiap contoh yang gagal dalam pemeriksaan kesehatan. Untuk informasi selengkapnya, lihat Health memeriksa instans dalam grup Auto Scaling.

Tentukan Blok Kapasitas di template peluncuran Anda

Untuk membuat template peluncuran yang menargetkan Blok Kapasitas tertentu untuk grup Auto Scaling Anda, gunakan salah satu metode berikut:

Console
Untuk menentukan Blok Kapasitas di template peluncuran (konsol)
  1. Buka EC2 konsol Amazon di https://console.aws.amazon.com/ec2/.

  2. Di bilah navigasi atas, pilih Wilayah AWS tempat Anda membuat Blok Kapasitas.

  3. Pada panel navigasi, di bawah Instans, pilih Luncurkan Template.

  4. Pilih Buat template peluncuran, dan buat template peluncuran. Sertakan ID Amazon Machine Image (AMI), jenis instans, dan setelan template peluncuran lainnya sesuai kebutuhan.

  5. Perluas bagian Detail lanjutan untuk melihat pengaturan lanjutan.

  6. Untuk opsi Pembelian, pilih Blok Kapasitas.

  7. Untuk reservasi Kapasitas, pilih Target berdasarkan ID, lalu untuk reservasi Kapasitas - Target berdasarkan ID, pilih ID reservasi kapasitas dari Blok Kapasitas yang ada.

  8. Setelah selesai, pilih Buat template peluncuran.

    Untuk bantuan membuat grup Auto Scaling dengan template peluncuran, lihat. Buat grup Auto Scaling menggunakan templat peluncuran

AWS CLI
Untuk menentukan Blok Kapasitas di template peluncuran Anda (AWS CLI)

Gunakan create-launch-templateperintah berikut untuk membuat template peluncuran yang menentukan ID reservasi Blok Kapasitas yang ada. Ganti masing-masing user input placeholder dengan informasi Anda sendiri.

aws ec2 create-launch-template --launch-template-name my-template-for-capacity-block \ --version-description AutoScalingVersion1 --region us-east-2 \ --launch-template-data file://config.json
Tip

Jika perintah ini menimbulkan kesalahan, pastikan Anda telah memperbarui AWS CLI secara lokal ke versi terbaru.

Isi dari config.json.

{ "ImageId": "ami-04d5cc9b88example", "InstanceType": "p4d.24xlarge", "SecurityGroupIds": [ "sg-903004f88example" ], "KeyName": "MyKeyPair", "InstanceMarketOptions": { "MarketType": "capacity-block" }, "CapacityReservationSpecification": { "CapacityReservationTarget": { "CapacityReservationId": "cr-02168da1478b509e0" } } }

Berikut ini adalah output contoh.

{ "LaunchTemplate": { "LaunchTemplateId": "lt-068f72b724example", "LaunchTemplateName": "my-template-for-capacity-block", "CreateTime": "2023-10-27T15:12:44.000Z", "CreatedBy": "arn:aws:iam::123456789012:user/Bob", "DefaultVersionNumber": 1, "LatestVersionNumber": 1 } }

Anda dapat menggunakan describe-launch-template-versionsperintah berikut untuk memverifikasi ID reservasi Blok Kapasitas yang terkait dengan templat peluncuran.

aws ec2 describe-launch-template-versions --launch-template-names my-template-for-capacity-block \ --region us-east-2

Berikut ini adalah contoh output untuk template peluncuran yang menentukan reservasi Blok Kapasitas.

{ "LaunchTemplateVersions": [ { "LaunchTemplateId": "lt-068f72b724example", "LaunchTemplateName": "my-template-for-capacity-block", "VersionNumber": 1, "CreateTime": "2023-10-27T15:12:44.000Z", "CreatedBy": "arn:aws:iam::123456789012:user/Bob", "DefaultVersion": true, "LaunchTemplateData": { "ImageId": "ami-04d5cc9b88example", "InstanceType": "p5.48xlarge", "SecurityGroupIds": [ "sg-903004f88example" ], "KeyName": "MyKeyPair", "InstanceMarketOptions": { "MarketType": "capacity-block" }, "CapacityReservationSpecification": { "CapacityReservationTarget": { "CapacityReservationId": "cr-02168da1478b509e0" } } } } ] }

Batasan

  • Support untuk Capacity Blocks hanya tersedia jika grup Auto Scaling Anda memiliki konfigurasi yang kompatibel. Kelompok contoh campuran dan kolam hangat tidak didukung.

  • Anda hanya dapat menargetkan satu Blok Kapasitas pada satu waktu.

  • Untuk prasyarat dan rekomendasi penggunaan Instans P5, lihat Memulai instans P5 di Panduan Pengguna Amazon. EC2

  • Amazon EKS mendukung penggunaan Capacity Blocks untuk mendukung durasi singkat Anda, beban kerja pembelajaran mesin (ML) di EKS klaster Amazon. Untuk informasi selengkapnya, silakan lihat Capacity Blocks untuk ML di Panduan EKS Pengguna Amazon.

  • Anda dapat menggunakan Capacity Blocks dengan tipe dan Wilayah instance yang didukung. Namun, Reservasi Kapasitas Sesuai Permintaan memberikan fleksibilitas untuk kapasitas cadangan untuk jenis dan Wilayah instans lainnya. Untuk tutorial yang menunjukkan cara menggunakan opsi Reservasi Kapasitas Sesuai Permintaan, lihatKapasitas cadangan di Availability Zone tertentu dengan Reservasi Kapasitas .