

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

# Mulai SageMaker HyperPod cepat Amazon
<a name="sagemaker-hyperpod-quickstart"></a>

Quickstart ini memandu Anda membuat HyperPod cluster pertama Anda dengan orkestrasi Slurm dan Amazon EKS (EKS). Pilih orkestrasi yang paling sesuai dengan kebutuhan infrastruktur Anda untuk memulai. SageMaker HyperPod

**Topics**
+ [Buat cluster yang diatur Slurm SageMaker HyperPod](#sagemaker-hyperpod-quickstart-slurm)
+ [Buat cluster yang diatur EKS SageMaker HyperPod](#sagemaker-hyperpod-quickstart-eks)
+ [Kirim beban kerja](#sagemaker-hyperpod-quickstart-workload)

## Buat cluster yang diatur Slurm SageMaker HyperPod
<a name="sagemaker-hyperpod-quickstart-slurm"></a>

Ikuti langkah-langkah ini untuk membuat SageMaker HyperPod cluster pertama Anda dengan orkestrasi Slurm.

1. Buka konsol Amazon SageMaker AI di [https://console.aws.amazon.com/sagemaker/](https://console.aws.amazon.com/sagemaker/).

1. Pilih **HyperPod Cluster** di panel navigasi kiri dan kemudian Manajemen **Cluster**.

1. Pada halaman **SageMaker HyperPod Clusters**, pilih **Create HyperPod cluster**. 

1. Pada drop-down **Create HyperPod cluster**, pilih **Orchestrated** by Slurm.

1. Pada halaman pembuatan cluster, pilih **Pengaturan cepat**. Dengan opsi ini, Anda segera memulai dengan pengaturan default. SageMaker AI akan membuat sumber daya baru seperti VPC, subnet, grup keamanan, bucket Amazon S3, peran IAM, dan FSx untuk Lustre dalam proses pembuatan cluster Anda.

1. Pada **pengaturan Umum**, tentukan nama untuk cluster baru. Anda tidak dapat mengubah nama setelah cluster dibuat.

1. Pada **grup Instance**, pilih **Tambah grup**. Setiap grup instans dapat dikonfigurasi secara berbeda, dan Anda dapat membuat klaster heterogen yang terdiri dari beberapa grup instans dengan berbagai jenis instance. Untuk menyebarkan cluster, Anda harus menambahkan setidaknya satu grup instance. Anda dapat menambahkan satu grup instance pada satu waktu. Untuk membuat beberapa grup instance, ulangi proses untuk setiap grup instance.

   Ikuti langkah-langkah ini untuk menambahkan grup instans.

   1. Untuk **tipe grup Instance**, pilih tipe untuk grup instans Anda. Untuk memulai cepat ini, pilih **Controller (head)** for`my-controller-group`, **Login** for`my-login-group`, dan **Compute (worker)** untuk. `worker-group-1` 

   1. Untuk **Nama**, tentukan nama untuk grup instance. Untuk quickstart ini, buat tiga grup instance bernama`my-controller-group`,`my-login-group`, dan`worker-group-1`.

   1.  Untuk **kapasitas Instans**, pilih kapasitas sesuai permintaan atau rencana pelatihan untuk memesan sumber daya komputasi Anda.

   1. Untuk **jenis Instance**, pilih instance untuk grup instance. Untuk memulai cepat ini, pilih `ml.c5.xlarge` untuk`my-controller-group`, `ml.m5.4xlarge` untuk`my-login-group`, dan `ml.trn1.32xlarge` untuk`worker-group-1`. 

      Pastikan Anda memilih jenis instans dengan kuota yang cukup di akun Anda, atau minta kuota tambahan dengan mengikuti petunjuk di. [SageMaker HyperPod kuota](sagemaker-hyperpod-prerequisites.md#sagemaker-hyperpod-prerequisites-quotas)

   1. Untuk **kuantitas Instance**, tentukan bilangan bulat yang tidak melebihi kuota instance untuk penggunaan klaster. Untuk memulai cepat ini, masukkan **1** untuk ketiga grup.

   1. Untuk **Zona Ketersediaan Target**, pilih Availability Zone tempat instance Anda akan disediakan. Availability Zone harus sesuai dengan lokasi kapasitas komputasi Anda yang dipercepat.

   1. Untuk **volume penyimpanan tambahan per instance (GB) - opsional**, tentukan bilangan bulat antara 1 dan 16384 untuk mengatur ukuran volume Elastic Block Store (EBS) tambahan dalam gigabyte (GB). Volume EBS dilampirkan ke setiap instance dari grup instance. Jalur pemasangan default untuk volume EBS tambahan adalah`/opt/sagemaker`. Setelah cluster berhasil dibuat, Anda dapat SSH ke instance cluster (node) dan memverifikasi apakah volume EBS dipasang dengan benar dengan menjalankan perintah. `df -h` Melampirkan volume EBS tambahan menyediakan penyimpanan yang stabil, off-instance, dan bertahan secara independen, seperti yang dijelaskan di [bagian volume Amazon EBS di Panduan Pengguna Amazon Elastic](https://docs.aws.amazon.com//ebs/latest/userguide/ebs-volumes.html) *Block Store*.

   1. Pilih **Tambahkan grup instans**.

1.  Pada **default konfigurasi cepat, tinjau pengaturan default**. Bagian ini mencantumkan semua pengaturan default untuk pembuatan klaster Anda, termasuk semua AWS sumber daya baru yang akan dibuat selama proses pembuatan klaster.

1. Pilih **Kirim**.

Untuk informasi selengkapnya, lihat [Memulai dengan SageMaker HyperPod menggunakan konsol SageMaker AI](smcluster-getting-started-slurm-console.md).

## Buat cluster yang diatur EKS SageMaker HyperPod
<a name="sagemaker-hyperpod-quickstart-eks"></a>

Ikuti langkah-langkah berikut untuk membuat SageMaker HyperPod cluster pertama Anda dengan orkestrasi Amazon EKS.

1. Buka konsol Amazon SageMaker AI di [https://console.aws.amazon.com/sagemaker/](https://console.aws.amazon.com/sagemaker/).

1. Pilih **HyperPod Cluster** di panel navigasi kiri dan kemudian Manajemen **Cluster**.

1. Pada halaman **SageMaker HyperPod Clusters**, pilih **Create HyperPod cluster**. 

1. Pada drop-down **Create HyperPod cluster**, pilih **Orchestrated by** Amazon EKS.

1. Pada halaman pembuatan cluster, pilih **Konfigurasi cepat**. Dengan opsi ini, Anda dapat segera memulai dengan pengaturan default. SageMaker AI akan membuat sumber daya baru seperti VPC, subnet, grup keamanan, bucket Amazon S3, peran IAM, dan FSx untuk Lustre dalam proses pembuatan cluster Anda.

1. Pada **pengaturan Umum**, tentukan nama untuk cluster baru. Anda tidak dapat mengubah nama setelah cluster dibuat. 

1. Pada **grup Instance**, pilih **Tambah grup**. Setiap grup instans dapat dikonfigurasi secara berbeda, dan Anda dapat membuat klaster heterogen yang terdiri dari beberapa grup instans dengan berbagai jenis instance. Untuk menyebarkan cluster, Anda harus menambahkan setidaknya satu grup instance. Anda dapat menambahkan satu grup instance pada satu waktu. Untuk membuat beberapa grup instance, ulangi proses untuk setiap grup instance.

   Ikuti langkah-langkah ini untuk menambahkan grup instans.

   1. Untuk **tipe grup Instance**, pilih **Standard** atau **Restricted Instance Group (RIG)**. Biasanya, Anda akan memilih **Standar**, yang menyediakan lingkungan komputasi tujuan umum tanpa batasan keamanan tambahan. **Restricted Instance Group (RIG)** adalah lingkungan khusus untuk kustomisasi model dasar seperti Amazon Nova. Untuk informasi selengkapnya tentang pengaturan RIG untuk kustomisasi model Amazon Nova, lihat kustomisasi Amazon Nova SageMaker HyperPod di [panduan pengguna Amazon Nova 1.0 atau panduan](https://docs.aws.amazon.com//nova/latest/userguide/nova-hp.html) [pengguna Amazon Nova 2.0](https://docs.aws.amazon.com//nova/latest/nova2-userguide/nova-hp.html).

   1. Untuk **Nama**, tentukan nama untuk grup instance.

   1.  Untuk **kapasitas Instans**, pilih kapasitas sesuai permintaan atau rencana pelatihan untuk memesan sumber daya komputasi Anda.

   1. Untuk **jenis Instance**, pilih instance untuk grup instance. Pastikan Anda memilih jenis instans dengan kuota yang cukup di akun Anda, atau minta kuota tambahan dengan mengikuti di. [SageMaker HyperPod kuota](sagemaker-hyperpod-prerequisites.md#sagemaker-hyperpod-prerequisites-quotas)

   1. Untuk **kuantitas Instance**, tentukan bilangan bulat yang tidak melebihi kuota instance untuk penggunaan klaster. Untuk memulai cepat ini, masukkan **1** untuk ketiga grup.

   1. Untuk **Zona Ketersediaan Target**, pilih Availability Zone tempat instance Anda akan disediakan. Availability Zone harus sesuai dengan lokasi kapasitas komputasi Anda yang dipercepat.

   1. Untuk **volume penyimpanan tambahan per instance (GB) - opsional**, tentukan bilangan bulat antara 1 dan 16384 untuk mengatur ukuran volume Elastic Block Store (EBS) tambahan dalam gigabyte (GB). Volume EBS dilampirkan ke setiap instance dari grup instance. Jalur pemasangan default untuk volume EBS tambahan adalah`/opt/sagemaker`. Setelah cluster berhasil dibuat, Anda dapat SSH ke instance cluster (node) dan memverifikasi apakah volume EBS dipasang dengan benar dengan menjalankan perintah. `df -h` Melampirkan volume EBS tambahan menyediakan penyimpanan yang stabil, off-instance, dan bertahan secara independen, seperti yang dijelaskan di [bagian volume Amazon EBS di Panduan Pengguna Amazon Elastic](https://docs.aws.amazon.com//ebs/latest/userguide/ebs-volumes.html) *Block Store*.

   1. **Misalnya pemeriksaan kesehatan mendalam**, pilih opsi Anda. Pemeriksaan kesehatan mendalam memantau kesehatan instans selama pembuatan dan setelah pembaruan perangkat lunak, secara otomatis memulihkan instance yang salah melalui reboot atau penggantian saat diaktifkan.

   1. Pilih **Tambahkan grup instans**.

1.  Pada **default konfigurasi cepat, tinjau pengaturan default**. Bagian ini mencantumkan semua pengaturan default untuk pembuatan klaster Anda, termasuk semua AWS sumber daya baru yang akan dibuat selama proses pembuatan klaster.

1. Pilih **Kirim**.

Untuk informasi selengkapnya, lihat [Membuat SageMaker HyperPod cluster dengan orkestrasi Amazon EKS](sagemaker-hyperpod-eks-operate-console-ui-create-cluster.md).

## Kirim beban kerja
<a name="sagemaker-hyperpod-quickstart-workload"></a>

Ikuti tutorial lokakarya ini untuk mengirimkan contoh beban kerja.
+ [Amazon SageMaker HyperPod untuk Slurm](https://catalog.workshops.aws/sagemaker-hyperpod/en-US)
+ [Amazon SageMaker HyperPod untuk Amazon EKS](https://catalog.workshops.aws/sagemaker-hyperpod-eks/en-US)