Perbarui konfigurasi SageMaker HyperPod cluster - Amazon SageMaker AI

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Perbarui konfigurasi SageMaker HyperPod cluster

Jalankan update-cluster untuk memperbarui konfigurasi cluster.

catatan

Pertimbangan penting:

  • Anda tidak dapat mengubah informasi kluster EKS yang dikaitkan dengan HyperPod cluster Anda setelah cluster dibuat.

  • Jika pemeriksaan kesehatan mendalam berjalan di cluster, API ini tidak akan berfungsi seperti yang diharapkan. Anda mungkin menemukan pesan kesalahan yang menyatakan bahwa pemeriksaan kesehatan mendalam sedang berlangsung. Untuk memperbarui cluster, Anda harus menunggu sampai pemeriksaan kesehatan mendalam selesai.

  1. Buat file permintaan UpdateClusterAPI dalam format JSON. Pastikan Anda menentukan nama cluster dan nama grup instance yang tepat untuk diperbarui. Untuk setiap grup instans, Anda dapat mengubah jenis instance, jumlah instance, skrip titik masuk konfigurasi siklus hidup, dan jalur ke skrip.

    catatan

    Anda dapat menggunakan UpdateCluster untuk memperkecil atau menghapus seluruh grup instans dari SageMaker HyperPod klaster Anda. Untuk petunjuk tambahan tentang cara mengurangi atau menghapus grup instans, lihatTurunkan skala SageMaker HyperPod cluster.

    1. UntukClusterName, tentukan nama cluster yang ingin Anda perbarui.

    2. Untuk InstanceGroupName

      1. Untuk memperbarui grup instans yang ada, tentukan nama grup instans yang ingin Anda perbarui.

      2. Untuk menambahkan grup instans baru, tentukan nama baru yang tidak ada di klaster Anda.

    3. Untuk InstanceType

      1. Untuk memperbarui grup instans yang ada, Anda harus mencocokkan jenis instans yang awalnya Anda tentukan ke grup.

      2. Untuk menambahkan grup instans baru, tentukan jenis instance yang ingin Anda konfigurasikan grup.

    4. Untuk InstanceCount

      1. Untuk memperbarui grup instans yang ada, tentukan bilangan bulat yang sesuai dengan jumlah instance yang Anda inginkan. Anda dapat memberikan nilai yang lebih tinggi atau lebih rendah (turun ke 0) untuk menskalakan grup instans naik atau turun.

      2. Untuk menambahkan grup instance baru, tentukan bilangan bulat yang lebih besar atau sama dengan 1.

    5. UntukLifeCycleConfig, Anda dapat mengubah nilai untuk keduanya SourceS3Uri dan OnCreate saat Anda ingin memperbarui grup instance.

    6. Untuk ExecutionRole

      1. Untuk memperbarui grup instans yang ada, tetap gunakan peran IAM yang sama yang Anda lampirkan selama pembuatan klaster.

      2. Untuk menambahkan grup instance baru, tentukan peran IAM yang ingin Anda lampirkan.

    7. Untuk ThreadsPerCore

      1. Untuk memperbarui grup instans yang ada, tetap gunakan nilai yang sama yang Anda tentukan selama pembuatan klaster.

      2. Untuk menambahkan grup instans baru, Anda dapat memilih nilai apa pun dari opsi yang diizinkan per jenis instans. Untuk informasi selengkapnya, cari jenis instans dan lihat kolom Benang valid per inti dalam tabel referensi di inti CPU dan utas per inti CPU per jenis instans di Panduan EC2 Pengguna Amazon.

    8. UntukOnStartDeepHealthChecks, tambahkan InstanceStress dan InstanceConnectivity aktifkanPemeriksaan kesehatan yang mendalam.

    9. UntukNodeRecovery, tentukan Automatic untuk mengaktifkan pemulihan simpul otomatis. SageMaker HyperPod menggantikan atau me-reboot instance (node) ketika masalah ditemukan oleh agen pemantauan kesehatan.

    Cuplikan kode berikut adalah template file permintaan JSON yang dapat Anda gunakan. Untuk informasi selengkapnya tentang sintaks permintaan dan parameter API ini, lihat referensi UpdateClusterAPI.

    // update_cluster.json { // Required "ClusterName": "name-of-cluster-to-update", // Required "InstanceGroups": [{ "InstanceGroupName": "string", "InstanceType": "string", "InstanceCount": number, "LifeCycleConfig": { "SourceS3Uri": "string", "OnCreate": "string" }, "ExecutionRole": "string", "ThreadsPerCore": number, "OnStartDeepHealthChecks": [ "InstanceStress", "InstanceConnectivity" ] }], "NodeRecovery": "Automatic" }
  2. Jalankan update-cluster perintah berikut untuk mengirimkan permintaan.

    aws sagemaker update-cluster \ --cli-input-json file://complete/path/to/update_cluster.json