Erste Schritte mit GPU-beschleunigten Instances - Amazon Elastic Compute Cloud

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Erste Schritte mit GPU-beschleunigten Instances

GPU-beschleunigte Instance-Typen der fünften Generation, wie sie in der folgenden Liste aufgeführt sind, bieten die leistungsstärksten Funktionen für Deep-Learning- und High Performance Computing (HPC)-Anwendungen. Wählen Sie den Link zum Instancetyp aus, um mehr über seine Funktionen zu erfahren.

Eine vollständige Liste der Instance-Typspezifikationen für beschleunigte Instance-Typen finden Sie unter Accelerated Computing in der Amazon EC2 Instance Types-Referenz.

Softwarekonfiguration

Der einfachste Weg, mit GPU-beschleunigten Instance-Typen der fünften Generation zu beginnen, besteht darin, eine Instance über ein AWS Deep Learning-AMI zu starten, das mit der gesamten erforderlichen Software vorkonfiguriert ist. Die neuesten Informationen AWS Deep Learning AMIs zur Verwendung mit GPU-beschleunigten Instance-Typen finden Sie im AWS Deep Learning Base GPU AMI (Ubuntu 20.04).

Wenn Sie ein benutzerdefiniertes AMI erstellen müssen, um Instances zu starten, die Deep-Learning- oder HPC-Anwendungen hosten, sollten Sie die folgenden Mindest-Software-Versionen installieren:

Software Instance-Typ Mindestversion
NVIDIA-Treiber P5 530
NVIDIA-Treiber P5e, P5en 550
CUDA P5, P5e, P5en 12,1
NVIDIA GDRCopy P5, P5e, P5en 2.3
EFA-Installer P5, P5e, P5en 1.24.1
NCCL P5, P5e, P5en 2.18.3
aws-ofi-nccl Plugin P5, P5e, P5en 1.7.2-aws

Außerdem empfiehlt es sich, die Instance so zu konfigurieren, dass keine tieferen Ruhezustände verwendet werden. Weitere Informationen finden Sie unter Hohe Performance und geringe Latenz durch die Beschränkung von tieferen C-Zuständen im Benutzerhandbuch für Amazon Linux 2. Das neueste AWS Deep Learning Base GPU AMI ist so vorkonfiguriert, dass es keine tieferen C-States verwendet.

Informationen zu Netzwerk und Elastic Fabric Adapter (EFA)-Konfiguration finden Sie unter Maximieren Sie die Netzwerkbandbreite auf EC2 Amazon-Instances mit mehreren Netzwerkkarten.

Spezifische Empfehlungen für Ubuntu 20.04

Die folgenden Empfehlungen für Ubuntu 20.04 tragen dazu bei, unvorhersehbare Schnittstellenbenennungen beim Booten zu verhindern:

  • Vergewissern Sie sich, dass Sie systemd 245.4-4ubuntu3.19 oder eine neuere Version verwenden, indem Sie den folgenden Befehl eingeben:

    $ systemd --version
  • Stellen Sie sicher, dass Sie GRUB konfiguriert haben:

    • Öffnen Sie die /etc/default/grub-Konfigurationsdatei in einem Texteditor.

    • Bearbeiten Sie den GRUB_CMDLINE_LINUX_DEFAULT-Eintrag so, dass er net.naming-scheme=v247 einschließt.

    • Starten Sie Ihre Instance neu, indem Sie sudo update-grub ausführen.