Menjalankan pekerjaan pertama Anda di AWS ParallelCluster - AWS ParallelCluster

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Menjalankan pekerjaan pertama Anda di AWS ParallelCluster

Tutorial ini memandu Anda menjalankan pekerjaan Hello World pertama Anda di AWS ParallelCluster

Saat menggunakan antarmuka baris AWS ParallelCluster perintah (CLI) atauAPI, Anda hanya membayar AWS sumber daya yang dibuat saat Anda membuat atau memperbarui AWS ParallelCluster gambar dan cluster. Untuk informasi selengkapnya, lihat AWS Layanan yang digunakan oleh AWS ParallelCluster.

AWS ParallelCluster UI dibangun di atas arsitektur tanpa server dan Anda dapat menggunakannya dalam kategori Tingkat AWS Gratis untuk sebagian besar kasus. Untuk informasi selengkapnya, lihat AWS ParallelCluster Biaya UI.

Prasyarat

Memverifikasi instalasi Anda

Pertama, kami memverifikasi yang AWS ParallelCluster benar, termasuk ketergantungan Node.js, diinstal dan dikonfigurasi.

$ node --version v16.8.0 $ pcluster version { "version": "3.7.0" }

Ini mengembalikan versi yang sedang berjalan dari AWS ParallelCluster.

Membuat cluster pertama Anda

Sekarang saatnya membuat cluster pertama Anda. Karena beban kerja untuk tutorial ini tidak intensif kinerja, kita dapat menggunakan ukuran instance default. t2.micro (Untuk beban kerja produksi, Anda memilih ukuran instans yang paling sesuai dengan kebutuhan Anda.) Mari kita panggil cluster Andahello-world.

$ pcluster create-cluster \ --cluster-name hello-world \ --cluster-configuration hello-world.yaml
catatan

Yang Wilayah AWS harus digunakan harus ditentukan untuk sebagian besar pcluster perintah. Jika tidak ditentukan dalam variabel AWS_DEFAULT_REGION lingkungan, atau region pengaturan di [default] bagian ~/.aws/config file, maka --region parameter harus disediakan pada baris pcluster perintah.

Jika output memberi Anda pesan tentang konfigurasi, Anda perlu menjalankan yang berikut ini untuk mengkonfigurasi AWS ParallelCluster:

$ pcluster configure --config hello-world.yaml

Jika pcluster create-cluster perintah berhasil, Anda melihat output yang mirip dengan berikut ini:

{ "cluster": { "clusterName": "hello-world", "cloudformationStackStatus": "CREATE_IN_PROGRESS", "cloudformationStackArn": "arn:aws:cloudformation:xxx:stack/xxx", "region": "...", "version": "...", "clusterStatus": "CREATE_IN_PROGRESS" } }

Anda memantau pembuatan cluster menggunakan:

$ pcluster describe-cluster --cluster-name hello-world

clusterStatusLaporan "CREATE_IN_PROGRESS" saat cluster sedang dibuat. clusterStatusTransisi ke "CREATE_COMPLETE" ketika cluster berhasil dibuat. Outputnya juga memberi kita publicIpAddress dan privateIpAddress dari simpul kepala kita.

Masuk ke node kepala Anda

Gunakan file Open SSH PEM Anda untuk masuk ke node kepala Anda.

$ pcluster ssh --cluster-name hello-world -i /path/to/keyfile.pem

Setelah Anda masuk, jalankan perintah sinfo untuk memverifikasi bahwa node komputasi Anda telah diatur dan dikonfigurasi.

$ sinfo PARTITION AVAIL TIMELIMIT NODES STATE NODELIST queue1* up infinite 10 idle~ queue1-dy-queue1t2micro-[1-10]

Outputnya menunjukkan bahwa kita memiliki satu antrian di cluster kita, dengan hingga sepuluh node.

Menjalankan pekerjaan pertama Anda menggunakan Slurm

Selanjutnya, kami membuat pekerjaan yang tidur sebentar dan kemudian mengeluarkan nama hostnya sendiri. Buat file bernamahellojob.sh, dengan konten berikut.

#!/bin/bash sleep 30 echo "Hello World from $(hostname)"

Selanjutnya, kirimkan pekerjaan menggunakansbatch, dan verifikasi bahwa itu berjalan.

$ sbatch hellojob.sh Submitted batch job 2

Sekarang, Anda dapat melihat antrian Anda dan memeriksa status pekerjaan. Penyediaan EC2 instans Amazon baru dimulai di latar belakang. Anda dapat memantau status instance cluster dengan sinfo perintah.

$ squeue JOBID PARTITION NAME USER ST TIME NODES NODELIST(REASON) 2 queue1 hellojob ec2-user CF 3:30 1 queue1-dy-queue1t2micro-1

Output menunjukkan bahwa pekerjaan telah diserahkan kequeue1. Tunggu 30 detik hingga pekerjaan selesai, lalu jalankan squeue lagi.

$ squeue JOBID PARTITION NAME USER ST TIME NODES NODELIST(REASON)

Sekarang tidak ada pekerjaan dalam antrian, kita dapat memeriksa output di direktori kita saat ini.

$ ls -l total 8 -rw-rw-r-- 1 ec2-user ec2-user 57 Sep 1 14:25 hellojob.sh -rw-rw-r-- 1 ec2-user ec2-user 43 Sep 1 14:30 slurm-2.out

Dalam output, kita melihat file out "”. Kita bisa melihat output dari pekerjaan kita:

$ cat slurm-2.out Hello World from queue1-dy-queue1t2micro-1

Outputnya juga menunjukkan bahwa pekerjaan kami berhasil berjalan pada instancequeue1-dy-queue1t2micro-1.

Di cluster yang baru saja Anda buat, hanya direktori home yang dibagikan di antara semua node cluster.

Untuk mempelajari lebih lanjut tentang membuat dan menggunakan cluster, lihatPraktik terbaik.

Jika aplikasi Anda memerlukan perangkat lunak, pustaka, atau data bersama, pertimbangkan opsi berikut:

  • Buat kustom yang AWS ParallelCluster diaktifkan AMI yang menyertakan perangkat lunak Anda seperti yang dijelaskan dalamMembangun kustom AWS ParallelCluster AMI.

  • Gunakan StorageSettingsopsi dalam file AWS ParallelCluster konfigurasi untuk menentukan sistem file bersama dan menyimpan perangkat lunak yang Anda instal di lokasi pemasangan yang ditentukan.

  • Gunakan Tindakan bootstrap kustom untuk mengotomatiskan prosedur bootstrap dari setiap node cluster Anda.