Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Perbarui konfigurasi SageMaker HyperPod cluster
Jalankan update-cluster untuk memperbarui konfigurasi cluster.
catatan
Pertimbangan penting:
Anda tidak dapat mengubah informasi kluster EKS yang dikaitkan dengan HyperPod cluster Anda setelah cluster dibuat.
Jika pemeriksaan kesehatan mendalam berjalan di cluster, API ini tidak akan berfungsi seperti yang diharapkan. Anda mungkin menemukan pesan kesalahan yang menyatakan bahwa pemeriksaan kesehatan mendalam sedang berlangsung. Untuk memperbarui cluster, Anda harus menunggu sampai pemeriksaan kesehatan mendalam selesai.
-
Buat file permintaan
UpdateCluster
API dalam format JSON. Pastikan Anda menentukan nama cluster dan nama grup instance yang tepat untuk diperbarui. Untuk setiap grup instans, Anda dapat mengubah jenis instance, jumlah instance, skrip titik masuk konfigurasi siklus hidup, dan jalur ke skrip.catatan
Anda dapat menggunakan
UpdateCluster
untuk memperkecil atau menghapus seluruh grup instans dari SageMaker HyperPod klaster Anda. Untuk petunjuk tambahan tentang cara mengurangi atau menghapus grup instans, lihatTurunkan skala SageMaker HyperPod cluster.-
Untuk
ClusterName
, tentukan nama cluster yang ingin Anda perbarui. -
Untuk
InstanceGroupName
-
Untuk memperbarui grup instans yang ada, tentukan nama grup instans yang ingin Anda perbarui.
-
Untuk menambahkan grup instans baru, tentukan nama baru yang tidak ada di klaster Anda.
-
-
Untuk
InstanceType
-
Untuk memperbarui grup instans yang ada, Anda harus mencocokkan jenis instans yang awalnya Anda tentukan ke grup.
-
Untuk menambahkan grup instans baru, tentukan jenis instance yang ingin Anda konfigurasikan grup.
-
-
Untuk
InstanceCount
-
Untuk memperbarui grup instans yang ada, tentukan bilangan bulat yang sesuai dengan jumlah instance yang Anda inginkan. Anda dapat memberikan nilai yang lebih tinggi atau lebih rendah (turun ke 0) untuk menskalakan grup instans naik atau turun.
-
Untuk menambahkan grup instance baru, tentukan bilangan bulat yang lebih besar atau sama dengan 1.
-
-
Untuk
LifeCycleConfig
, Anda dapat mengubah nilai untuk keduanyaSourceS3Uri
danOnCreate
saat Anda ingin memperbarui grup instance. -
Untuk
ExecutionRole
-
Untuk memperbarui grup instans yang ada, tetap gunakan peran IAM yang sama yang Anda lampirkan selama pembuatan klaster.
-
Untuk menambahkan grup instance baru, tentukan peran IAM yang ingin Anda lampirkan.
-
-
Untuk
ThreadsPerCore
-
Untuk memperbarui grup instans yang ada, tetap gunakan nilai yang sama yang Anda tentukan selama pembuatan klaster.
-
Untuk menambahkan grup instans baru, Anda dapat memilih nilai apa pun dari opsi yang diizinkan per jenis instans. Untuk informasi selengkapnya, cari jenis instans dan lihat kolom Benang valid per inti dalam tabel referensi di inti CPU dan utas per inti CPU per jenis instans di Panduan EC2 Pengguna Amazon.
-
-
Untuk
OnStartDeepHealthChecks
, tambahkanInstanceStress
danInstanceConnectivity
aktifkanPemeriksaan kesehatan yang mendalam. -
Untuk
NodeRecovery
, tentukanAutomatic
untuk mengaktifkan pemulihan simpul otomatis. SageMaker HyperPod menggantikan atau me-reboot instance (node) ketika masalah ditemukan oleh agen pemantauan kesehatan.
Cuplikan kode berikut adalah template file permintaan JSON yang dapat Anda gunakan. Untuk informasi selengkapnya tentang sintaks permintaan dan parameter API ini, lihat referensi UpdateClusterAPI.
// update_cluster.json { // Required "ClusterName": "
name-of-cluster-to-update
", // Required "InstanceGroups": [{ "InstanceGroupName":"string"
, "InstanceType":"string"
, "InstanceCount":number
, "LifeCycleConfig": { "SourceS3Uri":"string"
, "OnCreate":"string"
}, "ExecutionRole":"string"
, "ThreadsPerCore":number
, "OnStartDeepHealthChecks": ["InstanceStress", "InstanceConnectivity"
] }], "NodeRecovery": "Automatic
" } -
-
Jalankan
update-cluster
perintah berikut untuk mengirimkan permintaan.aws sagemaker update-cluster \ --cli-input-json
file://complete/path/to/update_cluster.json