Menjalankan pekerjaan di SageMaker HyperPod cluster yang diatur oleh Amazon EKS - Amazon SageMaker AI

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Menjalankan pekerjaan di SageMaker HyperPod cluster yang diatur oleh Amazon EKS

Topik berikut memberikan prosedur dan contoh mengakses node komputasi dan menjalankan beban kerja MLpada klaster yang disediakan SageMaker HyperPod yang diatur dengan Amazon EKS. Bergantung pada cara Anda mengatur lingkungan di HyperPod cluster Anda, ada banyak cara untuk menjalankan beban kerja ML pada HyperPod cluster.

Tip

Untuk pengalaman dan panduan langsung tentang cara menyiapkan dan menggunakan SageMaker HyperPod klaster yang diatur dengan Amazon EKS, kami sarankan untuk menggunakan Dukungan Amazon EKS ini di lokakarya. SageMaker HyperPod

Pengguna ilmuwan data dapat melatih model dasar menggunakan set cluster EKS sebagai orkestrator untuk cluster. SageMaker HyperPod Para ilmuwan memanfaatkan SageMaker HyperPod CLI dan kubectl perintah asli untuk menemukan SageMaker HyperPod cluster yang tersedia, mengirimkan pekerjaan pelatihan (Pod), dan mengelola beban kerja mereka. SageMaker HyperPod CLI memungkinkan pengiriman pekerjaan menggunakan file skema pekerjaan pelatihan, dan menyediakan kemampuan untuk daftar pekerjaan, deskripsi, pembatalan, dan eksekusi. Para ilmuwan dapat menggunakan Operator Pelatihan Kubeflow sesuai dengan kuota komputasi yang dikelola oleh HyperPod, dan SageMaker AI yang dikelola MLflow untuk mengelola eksperimen dan pelatihan mL.