Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Menjalankan pekerjaan pertama Anda di AWS ParallelCluster
Tutorial ini memandu Anda menjalankan pekerjaan Hello World pertama Anda di AWS ParallelCluster
Saat menggunakan antarmuka baris AWS ParallelCluster perintah (CLI) atauAPI, Anda hanya membayar AWS sumber daya yang dibuat saat Anda membuat atau memperbarui AWS ParallelCluster gambar dan cluster. Untuk informasi selengkapnya, lihat AWS Layanan yang digunakan oleh AWS ParallelCluster.
PCUIIni dibangun di atas arsitektur tanpa server dan Anda dapat menggunakannya dalam kategori Tingkat AWS Gratis untuk sebagian besar kasus. Untuk informasi selengkapnya, lihat PCUIbiaya.
Prasyarat
-
AWS ParallelCluster diinstal.
-
AWS CLI Itu diinstal dan dikonfigurasi.
-
Anda memiliki EC2key pair Amazon.
-
Anda memiliki IAM peran dengan izin yang diperlukan untuk menjalankan file. pcluster CLI
Memverifikasi instalasi Anda
Pertama, kami memverifikasi yang AWS ParallelCluster benar, termasuk ketergantungan Node.js, diinstal dan dikonfigurasi.
$
node --version
v16.8.0
$
pcluster version
{ "version": "3.7.0" }
Ini mengembalikan versi yang sedang berjalan dari AWS ParallelCluster.
Membuat cluster pertama Anda
Sekarang saatnya membuat cluster pertama Anda. Karena beban kerja untuk tutorial ini tidak intensif kinerja, kita dapat menggunakan ukuran instance default. t2.micro
(Untuk beban kerja produksi, Anda memilih ukuran instans yang paling sesuai dengan kebutuhan Anda.) Mari kita panggil cluster Andahello-world
.
$
pcluster create-cluster \ --cluster-name hello-world \ --cluster-configuration hello-world.yaml
catatan
Yang Wilayah AWS harus digunakan harus ditentukan untuk sebagian besar pcluster
perintah. Jika tidak ditentukan dalam variabel AWS_DEFAULT_REGION
lingkungan, atau region
pengaturan di [default]
bagian ~/.aws/config
file, maka --region
parameter harus disediakan pada baris pcluster
perintah.
Jika output memberi Anda pesan tentang konfigurasi, Anda perlu menjalankan yang berikut ini untuk mengkonfigurasi AWS ParallelCluster:
$
pcluster configure --config hello-world.yaml
Jika pcluster create-cluster perintah berhasil, Anda melihat output yang mirip dengan berikut ini:
{ "cluster": { "clusterName": "hello-world", "cloudformationStackStatus": "CREATE_IN_PROGRESS", "cloudformationStackArn": "arn:aws:cloudformation:xxx:stack/xxx", "region": "...", "version": "...", "clusterStatus": "CREATE_IN_PROGRESS" } }
Anda memantau pembuatan cluster menggunakan:
$
pcluster describe-cluster --cluster-name hello-world
clusterStatus
Laporan "CREATE_IN_PROGRESS
" saat cluster sedang dibuat. clusterStatus
Transisi ke "CREATE_COMPLETE
" ketika cluster berhasil dibuat. Outputnya juga memberi kita publicIpAddress
dan privateIpAddress
dari simpul kepala kita.
Masuk ke node kepala Anda
Gunakan file Open SSH PEM Anda untuk masuk ke node kepala Anda.
$
pcluster ssh --cluster-name hello-world -i /path/to/keyfile.pem
Setelah Anda masuk, jalankan perintah sinfo
untuk memverifikasi bahwa node komputasi Anda telah diatur dan dikonfigurasi.
$
sinfo
PARTITION AVAIL TIMELIMIT NODES STATE NODELIST queue1* up infinite 10 idle~ queue1-dy-queue1t2micro-[1-10]
Outputnya menunjukkan bahwa kita memiliki satu antrian di cluster kita, dengan hingga sepuluh node.
Menjalankan pekerjaan pertama Anda menggunakan Slurm
Selanjutnya, kami membuat pekerjaan yang tidur sebentar dan kemudian mengeluarkan nama hostnya sendiri. Buat file bernamahellojob.sh
, dengan konten berikut.
#!/bin/bash sleep 30 echo "Hello World from $(hostname)"
Selanjutnya, kirimkan pekerjaan menggunakansbatch
, dan verifikasi bahwa itu berjalan.
$
sbatch hellojob.sh
Submitted batch job 2
Sekarang, Anda dapat melihat antrian Anda dan memeriksa status pekerjaan. Penyediaan EC2 instans Amazon baru dimulai di latar belakang. Anda dapat memantau status instance cluster dengan sinfo
perintah.
$
squeue
JOBID PARTITION NAME USER ST TIME NODES NODELIST(REASON) 2 queue1 hellojob ec2-user CF 3:30 1 queue1-dy-queue1t2micro-1
Output menunjukkan bahwa pekerjaan telah diserahkan kequeue1
. Tunggu 30 detik hingga pekerjaan selesai, lalu jalankan squeue
lagi.
$
squeue
JOBID PARTITION NAME USER ST TIME NODES NODELIST(REASON)
Sekarang tidak ada pekerjaan dalam antrian, kita dapat memeriksa output di direktori kita saat ini.
$
ls -l
total 8 -rw-rw-r-- 1 ec2-user ec2-user 57 Sep 1 14:25 hellojob.sh -rw-rw-r-- 1 ec2-user ec2-user 43 Sep 1 14:30 slurm-2.out
Dalam output, kita melihat file out
"”. Kita bisa melihat output dari pekerjaan kita:
$
cat slurm-2.out
Hello World from queue1-dy-queue1t2micro-1
Outputnya juga menunjukkan bahwa pekerjaan kami berhasil berjalan pada instancequeue1-dy-queue1t2micro-1
.
Di cluster yang baru saja Anda buat, hanya direktori home yang dibagikan di antara semua node cluster.
Untuk mempelajari lebih lanjut tentang membuat dan menggunakan cluster, lihatPraktik terbaik.
Jika aplikasi Anda memerlukan perangkat lunak, pustaka, atau data bersama, pertimbangkan opsi berikut:
-
Buat kustom yang AWS ParallelCluster diaktifkan AMI yang menyertakan perangkat lunak Anda seperti yang dijelaskan dalamMembangun kustom AWS ParallelCluster AMI.
-
Gunakan StorageSettingsopsi dalam file AWS ParallelCluster konfigurasi untuk menentukan sistem file bersama dan menyimpan perangkat lunak yang Anda instal di lokasi pemasangan yang ditentukan.
-
Gunakan Tindakan bootstrap kustom untuk mengotomatiskan prosedur bootstrap dari setiap node cluster Anda.