View a markdown version of this page

Memulai instans yang dipercepat GPU - Amazon Elastic Compute Cloud

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Memulai instans yang dipercepat GPU

Generasi terbaru dari jenis instans akselerasi GPU, seperti yang ditunjukkan dalam daftar berikut memberikan kemampuan kinerja tertinggi untuk pembelajaran mendalam dan aplikasi komputasi kinerja tinggi (HPC). Pilih tautan jenis instans untuk mempelajari lebih lanjut tentang kemampuannya.

Untuk daftar lengkap spesifikasi tipe instans untuk tipe instans yang dipercepat, lihat Komputasi yang dipercepat dalam referensi Jenis Instans Amazon EC2.

Konfigurasi perangkat lunak

Cara termudah untuk memulai dengan jenis instans akselerasi GPU generasi terbaru adalah dengan meluncurkan instance dari AMI Pembelajaran AWS Mendalam yang telah dikonfigurasi sebelumnya dengan semua perangkat lunak yang diperlukan. Untuk informasi terbaru AWS Deep Learning AMIs untuk digunakan dengan jenis instans akselerasi GPU, lihat DLAMI yang Didukung P6 di Panduan Pengembang.AWS Deep Learning AMIs

Jika Anda perlu membuat AMI khusus untuk meluncurkan instance yang menghosting pembelajaran mendalam atau aplikasi HPC, kami sarankan Anda menginstal versi perangkat lunak minimum berikut di atas gambar dasar Anda.

Tipe instans Pengemudi NVIDIA CUDA NVIDIA GDRCopy Pemasang EFA NCCL EFA K8s ¹
G7e 575 12.9 2.5 1.45.0 2.28.3 0.5.10
P5 530 12.1 2.3 1.24.1 2.18.3 0.4.4
P5.4xlarge 530 12.1 2.3 1.43,1 ² 2.18.3 0.4.4
P5e 550 12.1 2.3 1.24.1 2.18.3 0.5.5
P5en 550 12.1 2.3 1.24.1 2.18.3 0.5.6
P6-B200 570 12.8 2.5 1.41.0 2.26.2-1 0.5.10
P6e-GB200 570 12.8 2.5 1.41.0 2.26.2-1 0.5.10
P6-B300 580 13,0 2.5 1.44.0 2.28.3 0.5.10

¹ Kolom EFA K8s berisi versi minimum yang direkomendasikan untuk. aws-efa-k8s-device-plugin

² Ada masalah kompatibilitas yang mempengaruhi P5.4xlarge contoh ketika GPU-to-GPU komunikasi menggunakan Elastic Fabric Adapter (EFA) dan NVIDIA Collective Communications Library (NCCL). Untuk mengurangi masalah, atur variabel lingkungan FI_HMEM_DISABLE_P2P ke1, dan pastikan Anda menginstal EFA versi 1.43.1 atau yang lebih baru.

catatan

Jika Anda menggunakan versi 1.41.0 dari installer EFA, disertakan dengan itu. aws-ofi-nccl plugin Untuk versi penginstal EFA sebelumnya, gunakan aws-ofi-nccl plugin versi 1.7.2-aws atau yang lebih baru.

Kami juga menyarankan Anda mengonfigurasi instance agar tidak menggunakan lebih dalam C-states. Untuk informasi selengkapnya, lihat Kinerja tinggi dan latensi rendah dengan membatasi lebih C-states dalam di Panduan Pengguna Amazon Linux 2. AMI GPU AWS Deep Learning Base terbaru telah dikonfigurasi sebelumnya agar tidak digunakan lebih dalam. C-states

Untuk konfigurasi jaringan dan Elastic Fabric Adapter (EFA) lihat. Maksimalkan bandwidth jaringan pada instans Amazon EC2 dengan beberapa kartu jaringan