Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Verwenden Sie Capacity Blocks für Workloads für maschinelles Lernen
Capacity Blocks helfen Ihnen dabei, stark nachgefragte GPU Instances zu einem future Zeitpunkt zu reservieren, um Ihre kurzfristigen Workloads für maschinelles Lernen (ML) zu unterstützen.
Für einen Überblick über Capacity Blocks und wie sie funktionieren, finden Sie unter Capacity Blocks für ML im EC2Amazon-Benutzerhandbuch.
Um mit der Nutzung zu beginnen Capacity Blocks, erstellen Sie eine Kapazitätsreservierung in einer bestimmten Availability Zone. Capacity Blocks werden als targeted
Kapazitätsreservierungen in einer einzigen Availability Zone bereitgestellt. Wenn Sie Ihre Startvorlage erstellen, geben Sie die Reservierungs-ID und den Instanztyp des Kapazitätsblocks an. Aktualisieren Sie dann Ihre Auto Scaling Scaling-Gruppe so, dass sie die von Ihnen erstellte Startvorlage und die Availability Zone des Capacity Blocks verwendet. Wenn Ihre Capacity Block-Reservierung beginnt, verwenden Sie die geplante Skalierung, um dieselbe Anzahl von Instances wie Ihre Capacity Block-Reservierung zu starten.
Wichtig
Capacity Blocks sind nur für bestimmte EC2 Amazon-Instance-Typen und verfügbar AWS-Regionen. Weitere Informationen finden Sie unter Voraussetzungen im EC2Amazon-Benutzerhandbuch.
Inhalt
Betriebliche Richtlinien
Nachfolgend finden Sie grundlegende Richtlinien, die Sie bei der Verwendung eines Kapazitätsblocks mit einer Auto-Scaling-Gruppe beachten sollten.
-
Skalieren Sie Ihre Auto-Scaling-Gruppe mehr als 30 Minuten vor der Endzeit der Kapazitätsblockreservierung auf Null herunter. Amazon beendet EC2 alle Instances, die noch laufen, 30 Minuten vor dem Ende des Kapazitätsblocks.
-
Wir empfehlen Ihnen, die geplante Skalierung zu verwenden, um zu den entsprechenden Reservierungszeiten die horizontale Skalierung (Hinzufügen von Instances) und die Skalierung (Instances entfernen) durchzuführen. Weitere Informationen finden Sie unter Geplante Skalierung für Amazon EC2 Auto Scaling.
-
Fügen Sie bei Bedarf Lebenszyklus-Hooks hinzu, um Ihre Anwendung beim Skalieren innerhalb der Instances ordnungsgemäß herunterzufahren. Lassen Sie genügend Zeit, bis die Lifecycle-Aktion abgeschlossen ist, bevor Amazon 30 Minuten vor dem Ende der Kapazitätsblock-Reservierung EC2 beginnt, Ihre Instances zwangsweise zu beenden. Weitere Informationen finden Sie unter Lebenszyklus-Hooks bei Amazon EC2 Auto Scaling.
-
Stellen Sie sicher, dass die Auto-Scaling-Gruppe für die gesamte Dauer der Reservierung auf die richtige Version der Startvorlage verweist. Wir empfehlen, auf eine bestimmte Version der Startvorlage statt auf die Version
$Default
oder$Latest
zu verweisen.
Anmerkung
Wenn Sie eine Capacity Block-Instance bis zum Ende der Reservierung laufen lassen und Amazon sie EC2 zurückfordert, geben die Skalierungsaktivitäten für Ihre Auto Scaling Scaling-Gruppe an, dass sie "taken out of service in
response to an EC2 health check that indicated it had been
terminated or stopped
„war, obwohl sie am Ende des Kapazitätsblocks absichtlich zurückgefordert wurde. In ähnlicher Weise versucht Amazon EC2 Auto Scaling, die Instance auf dieselbe Weise zu ersetzen, wie es bei jeder Instance der Fall ist, die eine Zustandsprüfung nicht besteht. Weitere Informationen finden Sie unter Zustandsprüfungen für Instances in einer Auto-Scaling-Gruppe.
Geben Sie in Ihrer Startvorlage einen Kapazitätsblock an
Verwenden Sie eine der folgenden Methoden, um eine Startvorlage zu erstellen, die auf einen bestimmten Kapazitätsblock für Ihre Auto Scaling Scaling-Gruppe abzielt:
Einschränkungen
-
Unterstützung für Capacity Blocks ist nur verfügbar, wenn Ihre Auto Scaling Scaling-Gruppe über eine kompatible Konfiguration verfügt. Gruppen mit gemischten Instances und warmen Pools werden nicht unterstützt.
-
Sie können jeweils nur einen Kapazitätsblock als Ziel angeben.
Zugehörige Ressourcen
-
Die Voraussetzungen und Empfehlungen für die Verwendung von P5-Instances finden Sie unter Erste Schritte mit P5-Instances im EC2Amazon-Benutzerhandbuch.
-
Amazon EKS unterstützt die Verwendung von Capacity Blocks zur Unterstützung Ihrer kurzfristigen Workloads für maschinelles Lernen (ML) auf EKS Amazon-Clustern. Weitere Informationen finden Sie unter Capacity Blocks für ML im EKSAmazon-Benutzerhandbuch.
-
Sie können Folgendes verwenden … Capacity Blocks mit unterstützten Instance-Typen und Regionen. Kapazitätsreservierungen auf Abruf bieten jedoch die Flexibilität, Kapazität für andere Instance-Typen und Regionen zu reservieren. Ein Tutorial, das Ihnen zeigt, wie Sie die Option On-Demand-Kapazitätsreservierung verwenden, finden Sie unterReservieren Sie Kapazität in bestimmten Availability Zones mit Kapazitätsreservierungen .