Menjalankan pekerjaan di SageMaker HyperPod cluster yang diatur oleh Amazon EKS - Amazon SageMaker

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Menjalankan pekerjaan di SageMaker HyperPod cluster yang diatur oleh Amazon EKS

Topik berikut menyediakan prosedur dan contoh untuk mengakses node komputasi dan menjalankan beban kerja ML pada kluster yang disediakan SageMaker HyperPod yang diatur dengan Amazon. EKS Bergantung pada cara Anda mengatur lingkungan di HyperPod cluster Anda, ada banyak cara untuk menjalankan beban kerja ML pada HyperPod cluster.

Tip

Untuk pengalaman dan panduan langsung tentang cara menyiapkan dan menggunakan SageMaker HyperPod klaster yang diatur dengan Amazon, kami sarankan untuk menggunakan Dukungan EKS Amazon EKS ini di lokakarya. SageMaker HyperPod

Pengguna ilmuwan data dapat melatih model dasar menggunakan EKS kumpulan cluster sebagai orkestrator untuk cluster. SageMaker HyperPod Para ilmuwan memanfaatkan kubectl perintah SageMaker HyperPod CLIdan native untuk menemukan SageMaker HyperPod cluster yang tersedia, mengirimkan pekerjaan pelatihan (Pod), dan mengelola beban kerja mereka. SageMaker HyperPod CLIIni memungkinkan pengiriman pekerjaan menggunakan file skema pekerjaan pelatihan, dan menyediakan kemampuan untuk daftar pekerjaan, deskripsi, pembatalan, dan eksekusi. Para ilmuwan dapat menggunakan Operator Pelatihan Kubeflow, Kueue (alat K8s untuk antrian pekerjaan) dan SageMakerMLflow-managed untuk mengelola eksperimen dan pelatihan yang dijalankan.