

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

# Auswahl eines DLAMI-Instanztyps
<a name="instance-select"></a>

Generell sollten Sie bei der Auswahl eines Instance-Typs für ein DLAMI Folgendes beachten.
+ Wenn Sie mit Deep Learning noch nicht vertraut sind, könnte eine Instanz mit einer einzelnen GPU Ihren Anforderungen entsprechen.
+ Wenn Sie budgetbewusst sind, können Sie Instances verwenden, die nur auf CPUs basieren.
+ Wenn Sie die hohe Leistung und Kosteneffizienz für die Deep-Learning-Modellinferenz optimieren möchten, können Sie Instances mit Inferentia-Chips verwenden.AWS
+ Wenn Sie nach einer leistungsstarken GPU-Instanz mit einer ARM64-basierten CPU-Architektur suchen, können Sie den Instance-Typ G5g verwenden.
+  Wenn Sie daran interessiert sind, ein vortrainiertes Modell für Inferenz und Vorhersagen auszuführen, können Sie Ihrer Amazon-Instance eine [Amazon Elastic Inference](https://docs.aws.amazon.com/elastic-inference/latest/developerguide/what-is-ei.html) hinzufügen. EC2 Amazon Elastic Inference bietet Ihnen Zugriff auf einen Beschleuniger mit einem Bruchteil einer GPU.
+ Für umfangreiche Inferenzdienste könnte eine einzelne CPU-Instance mit viel Speicher oder ein Cluster solcher Instances die bessere Lösung sein. 
+  Wenn Sie ein großes Modell mit vielen Daten oder einer hohen Batchgröße verwenden, benötigen Sie eine größere Instanz mit mehr Speicher. Sie können Ihr Modell auch auf einen Cluster von verteilen GPUs. Möglicherweise stellt auch eine Instance mit weniger Speicher eine bessere Lösung für Sie dar, wenn Sie Ihre Batchgröße verringern. Dies kann sich auf die Genauigkeit und Schulungsgeschwindigkeit auswirken.
+  Wenn Sie daran interessiert sind, Anwendungen für maschinelles Lernen mithilfe der NVIDIA Collective Communications Library (NCCL) auszuführen, die ein hohes Maß an Kommunikation zwischen den Knoten in großem Umfang erfordern, sollten Sie den [Elastic Fabric Adapter (](https://docs.aws.amazon.com/dlami/latest/devguide/tutorial-efa-launching.html)EFA) verwenden.

[Weitere Informationen zu Instances finden Sie unter Instance-Typen und . EC2 ](https://aws.amazon.com/ec2/instance-types/)

Die folgenden Themen enthalten Informationen zu Überlegungen zu Instanztypen. 

**Wichtig**  
Deep Learning AMIs umfasst Treiber, Software oder Toolkits, die von der NVIDIA Corporation entwickelt wurden, im Eigentum der NVIDIA Corporation stehen oder von ihr bereitgestellt werden. Sie erklären sich damit einverstanden, diese NVIDIA-Treiber, -Software oder Toolkits nur auf EC2 Amazon-Instances zu verwenden, die NVIDIA-Hardware enthalten.

**Topics**
+ [Preise für das DLAMI](#pricing)
+ [Verfügbarkeit in der DLAMI Region](#region)
+ [Empfohlene GPU-Instances](gpu.md)
+ [Empfohlene CPU-Instances](cpu.md)
+ [Empfohlene Inferenzinstanzen](inferentia.md)
+ [Empfohlene Trainium-Instances](trainium.md)

## Preise für das DLAMI
<a name="pricing"></a>

Die im DLAMI enthaltenen Deep-Learning-Frameworks sind kostenlos und verfügen jeweils über eigene Open-Source-Lizenzen. Obwohl die im DLAMI enthaltene Software kostenlos ist, müssen Sie dennoch für die zugrunde liegende EC2 Amazon-Instance-Hardware bezahlen.

Einige EC2 Amazon-Instance-Typen sind als kostenlos gekennzeichnet. Es ist möglich, das DLAMI auf einer dieser kostenlosen Instanzen auszuführen. Das bedeutet, dass die Nutzung des DLAMI völlig kostenlos ist, wenn Sie nur die Kapazität dieser Instanz nutzen. Wenn Sie eine leistungsfähigere Instanz mit mehr CPU-Kernen, mehr Festplattenspeicher, mehr RAM oder einer oder mehreren benötigen, benötigen Sie eine Instanz GPUs, die nicht zur Instance-Klasse des kostenlosen Tiers gehört.

Weitere Informationen zur Instance-Auswahl und Preisgestaltung finden Sie unter [ EC2 Amazon-Preise](https://aws.amazon.com/ec2/pricing/).

## Verfügbarkeit in der DLAMI Region
<a name="region"></a>

Jede Region unterstützt eine andere Reihe von Instance-Typen, und oft fallen für einen Instance-Typ in verschiedenen Regionen leicht unterschiedliche Kosten an. DLAMIs sind nicht in jeder Region verfügbar, aber es ist möglich, in die Region Ihrer Wahl DLAMIs zu kopieren. Weitere Informationen finden Sie unter [AMI kopieren](https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/CopyingAMIs.html). Beachten Sie die Auswahlliste für Regionen und achten Sie darauf, dass Sie eine Region auswählen, die sich in Ihrer Nähe oder in der Nähe Ihrer Kunden befindet. Wenn Sie planen, mehr als ein DLAMI zu verwenden und möglicherweise einen Cluster zu erstellen, stellen Sie sicher, dass Sie dieselbe Region für alle Knoten im Cluster verwenden.

Weitere Informationen zu Regionen finden Sie unter — [Amazon EC2 Service Endpoints](https://docs.aws.amazon.com/general/latest/gr/ec2-service.html#ec2_region).

**Nächstes Thema**  
[Empfohlene GPU-Instances](gpu.md)

# Empfohlene GPU-Instances
<a name="gpu"></a>

Für die meisten Deep-Learning-Zwecke empfehlen wir eine GPU-Instanz. Das Trainieren neuer Modelle ist auf einer GPU-Instanz schneller als auf einer CPU-Instanz. Sie können sublinear skalieren, wenn Sie mehrere GPU-Instanzen haben oder wenn Sie verteiltes Training auf viele Instanzen mit verwenden. GPUs 

Die folgenden Instance-Typen unterstützen das DLAMI. Informationen zu den Optionen für GPU-Instanztypen und deren Verwendung finden Sie unter und wählen Sie **Accelerated** Computing aus.

**Anmerkung**  
Die Größe Ihres Modells sollte bei der Auswahl einer Instanz eine Rolle spielen. Wenn Ihr Modell den verfügbaren Arbeitsspeicher einer Instanz überschreitet, wählen Sie einen anderen Instance-Typ mit ausreichend Arbeitsspeicher für Ihre Anwendung. 
+ [Amazon EC2 P6-B200-Instances verfügen über bis zu 8 NVIDIA Blackwell B200](https://aws.amazon.com/ec2/instance-types/p6/). GPUs
+ [Amazon EC2 P6-B300-Instances](https://aws.amazon.com/ec2/instance-types/p6/) verfügen über bis zu 8 NVIDIA Blackwell B300. GPUs
+ [Amazon EC2 P6e- GB2 00 Instances](https://aws.amazon.com/ec2/instance-types/p6/) haben bis zu 4 NVIDIA GB2 Blackwell 00. GPUs
+ [Amazon EC2 P5e-Instances](https://aws.amazon.com/ec2/instance-types/p5/) verfügen über bis zu 8 NVIDIA Tesla H200. GPUs
+ [Amazon EC2 P5-Instances](https://aws.amazon.com/ec2/instance-types/p5/) verfügen über bis zu 8 NVIDIA Tesla GPUs H100.
+ [Amazon EC2 P4-Instances](https://aws.amazon.com/ec2/instance-types/p4/) verfügen über bis zu 8 NVIDIA Tesla GPUs A100.
+ [Amazon EC2 P3-Instances](https://aws.amazon.com/ec2/instance-types/p3/) verfügen über bis zu 8 NVIDIA Tesla GPUs V100.
+ [Amazon EC2 G3-Instances](https://aws.amazon.com/ec2/instance-types/g3/) verfügen über bis zu 4 NVIDIA Tesla GPUs M60.
+ [Amazon EC2 G4-Instances](https://aws.amazon.com/ec2/instance-types/g4/) verfügen über bis zu 4 NVIDIA GPUs T4.
+ [Amazon EC2 G5-Instances](https://aws.amazon.com/ec2/instance-types/g5/) verfügen über bis zu 8 NVIDIA GPUs A10G.
+ [Amazon EC2 G6-Instances](https://aws.amazon.com/ec2/instance-types/g6/) verfügen über bis zu 8 NVIDIA GPUs L4.
+ [Amazon EC2 G6e-Instances](https://aws.amazon.com/ec2/instance-types/g6e/) verfügen über bis zu 8 NVIDIA L40S Tensor Core. GPUs
+ [Amazon EC2 G5G-Instances](https://aws.amazon.com/ec2/instance-types/g5g/) [verfügen über ARM64-basierte AWS Graviton2-Prozessoren.](https://aws.amazon.com/ec2/graviton/)

DLAMI-Instanzen bieten Tools zur Überwachung und Optimierung Ihrer GPU-Prozesse. Weitere Informationen zur Überwachung Ihrer GPU-Prozesse finden Sie unter. [GPU-Überwachung und -Optimierung](tutorial-gpu.md)

Spezifische Tutorials zur Arbeit mit G5G-Instances finden Sie unter[Das ARM64 DLAMI](tutorial-arm64.md).

**Nächstes Thema**  
[Empfohlene CPU-Instances](cpu.md)

# Empfohlene CPU-Instances
<a name="cpu"></a>

Egal, ob Sie nur ein begrenztes Budget haben, etwas über Deep Learning lernen oder einfach nur einen Vorrausage-Service betreiben möchten, Sie haben viele günstige Optionen in der CPU-Kategorie. Einige Frameworks nutzen das MKL DNN von Intel, das das Training und die Inferenz für C5-CPU-Instance-Typen (nicht in allen Regionen verfügbar) beschleunigt. **Informationen zu CPU-Instance-Typen finden Sie unter Instance-Typen und . Wählen Sie dort [EC2 Compute Optimized](https://aws.amazon.com/ec2/instance-types/) aus.**

**Anmerkung**  
Die Größe Ihres Modells sollte ein Faktor bei der Auswahl einer Instanz sein. Wenn Ihr Modell den verfügbaren Arbeitsspeicher einer Instanz überschreitet, wählen Sie einen anderen Instance-Typ mit ausreichend Arbeitsspeicher für Ihre Anwendung. 
+ [Amazon EC2 C5-Instances](https://aws.amazon.com/ec2/instance-types/c5/) haben bis zu 72 Intel v. CPUs C5-Instances zeichnen sich durch wissenschaftliche Modellierung, Stapelverarbeitung, verteilte Analytik, Hochleistungsrechnen (HPC) sowie Inferenz für maschinelles Lernen und Deep Learning aus.

**Nächstes Thema**  
[Empfohlene Inferenzinstanzen](inferentia.md)

# Empfohlene Inferenzinstanzen
<a name="inferentia"></a>

AWS Inferentia-Instances sind so konzipiert, dass sie eine hohe Leistung und Kosteneffizienz für Inferenz-Workloads mit Deep-Learning-Modellen bieten. Insbesondere Inf2-Instance-Typen verwenden AWS Inferentia-Chips und das [AWS Neuron SDK](https://awsdocs-neuron.readthedocs-hosted.com/en/latest/), das in beliebte Frameworks für maschinelles Lernen wie und integriert ist. TensorFlow PyTorch

Kunden können Inf2-Instances verwenden, um umfangreiche Inferenzanwendungen für maschinelles Lernen wie Suche, Empfehlungsmaschinen, Computer Vision, Spracherkennung, Verarbeitung natürlicher Sprache, Personalisierung und Betrugserkennung zu den niedrigsten Kosten in der Cloud auszuführen.

**Anmerkung**  
Die Größe Ihres Modells sollte ein Faktor bei der Auswahl einer Instanz sein. Wenn Ihr Modell den verfügbaren Arbeitsspeicher einer Instanz überschreitet, wählen Sie einen anderen Instance-Typ mit ausreichend Arbeitsspeicher für Ihre Anwendung. 
+ [Amazon EC2 Inf2-Instances](https://aws.amazon.com/ec2/instance-types/inf2/) verfügen über bis zu 16 AWS Inferentia-Chips und einen Netzwerkdurchsatz von 100 Gbit/s.

Weitere Informationen zu den ersten Schritten mit AWS Inferentia finden Sie unter. DLAMIs [Der AWS Inferentia-Chip mit DLAMI](tutorial-inferentia.md)

**Nächstes Thema**  
[Empfohlene Trainium-Instances](trainium.md)

# Empfohlene Trainium-Instances
<a name="trainium"></a>

AWS Trainium-Instances sind darauf ausgelegt, hohe Leistung und Kosteneffizienz für Inferenz-Workloads mit Deep-Learning-Modellen zu bieten. Insbesondere Trn1-Instance-Typen verwenden AWS Trainium-Chips und das [AWS Neuron SDK](https://awsdocs-neuron.readthedocs-hosted.com/en/latest/), das in beliebte Frameworks für maschinelles Lernen wie und integriert ist. TensorFlow PyTorch

Kunden können Trn1-Instances verwenden, um umfangreiche Inferenzanwendungen für maschinelles Lernen wie Suche, Empfehlungsmaschinen, Computer Vision, Spracherkennung, Verarbeitung natürlicher Sprache, Personalisierung und Betrugserkennung zu den niedrigsten Kosten in der Cloud auszuführen.

**Anmerkung**  
Die Größe Ihres Modells sollte ein Faktor bei der Auswahl einer Instanz sein. Wenn Ihr Modell den verfügbaren Arbeitsspeicher einer Instanz überschreitet, wählen Sie einen anderen Instance-Typ mit ausreichend Arbeitsspeicher für Ihre Anwendung. 
+ [Amazon EC2 Trn1-Instances](https://aws.amazon.com/ec2/instance-types/trn1/) verfügen über bis zu 16 AWS Trainium-Chips und einen Netzwerkdurchsatz von 100 Gbit/s.