

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

# Verwenden von Amazon EC2 EC2-Kapazitätsblöcken für ML mit AWS PCS
<a name="capacity-blocks"></a>

Amazon EC2 Capacity Blocks for ML ist eine Amazon EC2 EC2-Kaufoption, mit der Sie im Voraus bezahlen können, um GPU-basierte Accelerated Computing-Instances innerhalb eines bestimmten Datums und Zeitbereichs zu reservieren, um Workloads mit kurzer Dauer zu unterstützen. Instances, die innerhalb eines Kapazitätsblocks ausgeführt werden, werden in Amazon EC2 automatisch nahe beieinander platziert UltraClusters, um blockierungsfreie Netzwerke im Petabit-Bereich mit niedriger Latenz zu gewährleisten. Weitere Informationen finden Sie unter [Capacity Blocks for ML](https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/ec2-capacity-blocks.html) im *Amazon Elastic Compute Cloud-Benutzerhandbuch*.

Sie können eine Startvorlage verwenden, damit AWS PCS beim Starten von Instances für eine Rechenknotengruppe einen Kapazitätsblock verwendet.

**Anmerkung**  
AWS PCS hat seit Slurm-Version 24.05 Unterstützung für Capacity Blocks eingeführt.

## Einschränkungen
<a name="capacity-blocks-limitations"></a>
+ AWS PCS unterstützt nur Capacity-Blöcke mit den Instance-Familien P6-B300, P6-B200, P5en, P5e, P5 und P4d.
+ Sie können eine Rechenknotengruppe jeweils nur einem Kapazitätsblock zuordnen.
+ Sie können eine Rechenknotengruppe keiner Kapazitätsreservierungsgruppe zuordnen, die mehrere Kapazitätsblöcke kombiniert.
+ Kapazitätsblöcke müssen sich im `active` Status `scheduled` oder befinden, um sie mit AWS PCS verwenden zu können. Sie können Kapazitätsblöcke nicht in anderen Zuständen verwenden, `payment-failed` z. Weitere Informationen finden Sie unter [Kapazitätsblöcke anzeigen](https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/capacity-blocks-view.html) im *Amazon Elastic Compute Cloud-Benutzerhandbuch*.
+ Informationen zu den Instance-Typen P6 und P5 finden Sie in der entsprechenden AWS-Dokumentation: [Softwareanforderungen für P6-Instances](https://docs.aws.amazon.com/dlami/latest/devguide/p6-support-dlami.html#dlami-support-p6), [Maximieren der Netzwerkbandbreite auf Amazon EC2 EC2-Instances](https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/efa-acc-inst-types.html) mit mehreren Netzwerkkarten

## Ablauf des Kapazitätsblocks
<a name="capacity-blocks-expiration"></a>

Kapazitätsblöcke sind auf ein bestimmtes Datum und einen bestimmten Zeitraum beschränkt. Wenn ein Kapazitätsblock abläuft:
+ Die mit diesem Kapazitätsblock verknüpfte Rechenknotengruppe ist weiterhin vorhanden und bleibt denselben Warteschlangen zugeordnet.
+ Alle Instanzen in der Compute-Knotengruppe sind beendet und aktive Jobs können je nach Ihren Slurm-Einstellungen fehlschlagen.
+ AWS PCS kann keine neuen Instanzen in der Compute-Knotengruppe starten.
+ Alle in der Warteschlange befindlichen oder neu eingereichten Jobs verbleiben im Status „Ausstehend“, bis eine weitere Rechenknotengruppe an die Warteschlange angehängt wird oder Sie die Compute-Knotengruppe so aktualisieren, dass sie eine neue Startvorlage verwendet, die einen neuen Kapazitätsblock angibt.

# Konfigurieren Sie eine AWS PCS-Rechenknotengruppe für die Verwendung eines Kapazitätsblocks
<a name="capacity-blocks-configure-cng"></a>

**Um einen Kapazitätsblock einer Rechenknotengruppe zuzuordnen**

1. Erstellen Sie eine EC2 Amazon-Startvorlage für AWS PCS, die Ihren Kapazitätsblock spezifiziert. Weitere Informationen zum Erstellen einer Startvorlage für AWS PCS finden Sie unter[Verwenden von Amazon EC2 EC2-Startvorlagen mit AWS PCS](working-with_launch-templates.md).

   Ihre Startvorlage muss Folgendes enthalten:
   + Der Wert `MarketType` von `InstanceMarketOptions` muss auf gesetzt sein`capacity-block`.
   + A `CapacityReservationSpecification` mit einem gültigen `CapacityReservationId`
   + Ein gültiger `InstanceType` Wert, der dem Instance-Typ des von Ihnen gekauften Kapazitätsblocks entspricht.

1. Erstellen Sie eine Compute-Knotengruppe, die die Startvorlage verwendet. Weitere Informationen finden Sie unter [Erstellen einer Compute-Knotengruppe in AWS PCS](working-with_cng_create.md). Sie können auch eine bestehende Compute-Knotengruppe aktualisieren, um die Startvorlage zu verwenden. Weitere Informationen finden Sie unter [Aktualisierung einer AWS PCS-Compute-Knotengruppe](working-with_cng_update.md).

   Wenn Sie die Compute-Knotengruppe erstellen oder aktualisieren:
   + Die IAM-Identität, die Sie zum Erstellen oder Aktualisieren der Compute-Knotengruppe verwenden, muss über die folgenden Berechtigungen verfügen:

     ```
     ec2:DescribeCapacityReservations
     ```

     Weitere Informationen finden Sie unter [Mindestberechtigungen für AWS PCS](security-min-permissions.md).
   + Der Kapazitätsblock muss sich im `active` Status `scheduled` oder befinden.
   + Stellen Sie den `purchaseOption` Wert der Compute-Knotengruppe auf ein`CAPACITY_BLOCK`.
   + Der Wert `maxInstanceCount` der Rechenknotengruppe darf die Größe des Kapazitätsblocks nicht überschreiten.
   + Die Verfügbarkeitszone der Compute-Knotengruppe muss mit einer der Subnetz-Verfügbarkeitszonen der Compute-Knotengruppe übereinstimmen.

**Wichtig**  
Sie können den Instanztyp einer Compute-Knotengruppe nicht ändern, wenn Sie sie aktualisieren. Sie können einen Kapazitätsblock nur mit demselben Instanztyp wie die Compute-Knotengruppe verwenden. Wenn Sie einen Kapazitätsblock mit einem anderen Instanztyp verwenden möchten, müssen Sie eine neue Rechenknotengruppe erstellen.

# Häufig gestellte Fragen zur Verwendung von Capacity Blocks mit AWS PCS
<a name="capacity-blocks-faq"></a>

**Ich habe gerade für einen Kapazitätsblock bezahlt und sofort versucht, ihn mit AWS PCS zu verwenden, aber die Erstellung der Compute-Knotengruppe ist fehlgeschlagen. Was ist passiert?**  
Ihr Kapazitätsblock befindet sich möglicherweise nicht im `active` Status `scheduled` Oder. Versuchen Sie es erneut, wenn der Kapazitätsblock den Wert `scheduled` oder hat`active`.

**Ich verwende einen Capacity Block in AWS PCS und habe eine Erweiterung gekauft, bevor sie abgelaufen ist. Wie verwende ich ihn weiterhin in AWS PCS?**  
Sie müssen nichts tun, um den Capacity Block in AWS PCS weiterhin zu verwenden. Das Enddatum Ihres Capacity Blocks wird aktualisiert, sobald Ihre Verlängerungszahlung erfolgreich war. Solange Ihr Kapazitätsblock nicht abläuft, ist die Rechenknotengruppe weiterhin in Betrieb. Wenn Ihre Verlängerungszahlung fehlschlägt, bleibt Ihr Kapazitätsblock bestehen `active` und die Rechenknotengruppe funktioniert, bis der Kapazitätsblock an seinem ursprünglichen Enddatum abläuft.

**Was passiert mit meinen in der Warteschlange stehenden und laufenden Jobs, wenn mein Kapazitätsblock abläuft?**  
Jobs in der Warteschlange, die nicht gestartet wurden, bevor der Kapazitätsblock abgelaufen ist, bleiben solange ausstehend, bis Sie eine weitere Rechenknotengruppe an die Warteschlange anhängen oder die Rechenknotengruppe mit einem neuen Kapazitätsblock aktualisieren. Sie können weiterhin Jobs an die Warteschlange senden. Ihre Slurm-Einstellungen wirken sich auf aktive Jobs aus. Standardmäßig werden aktive Jobs automatisch erneut in die Warteschlange gestellt, können aber Fehler aufweisen oder fehlschlagen.

**Mein Kapazitätsblock ist abgelaufen. Sollte ich etwas tun?**  
Du musst nichts tun. Sie können in der Amazon EC2 EC2-Konsole den Status Ihrer EC2-Kapazitätsreservierungen überprüfen. Wenn ein Kapazitätsblock abläuft, ist die diesem Kapazitätsblock zugeordnete Rechenknotengruppe weiterhin vorhanden und verarbeitet dieselben Warteschlangen. Die Rechenknotengruppe hat keine Instanzen zum Ausführen von Jobs. Sie können die Compute-Knotengruppe löschen oder sie von den Warteschlangen trennen, um zu verhindern, dass Benutzer Jobs einreichen, die nicht ausgeführt werden können.

**Ich möchte einen neuen Kapazitätsblock mit meiner AWS PCS-Compute-Knotengruppe verwenden. Was soll ich tun?**  
Wir empfehlen Ihnen, eine neue Rechenknotengruppe zu erstellen, um den neuen Kapazitätsblock zu verwenden. Weitere Informationen finden Sie unter [Konfigurieren Sie eine AWS PCS-Rechenknotengruppe für die Verwendung eines Kapazitätsblocks](capacity-blocks-configure-cng.md).

**Wie kann ich einen Kapazitätsblock für Cluster und Dienste gemeinsam nutzen?**  
Sie können einen Kapazitätsblock auf mehrere Cluster und Dienste aufteilen. Um beispielsweise einen Kapazitätsblock mit 64 `p5.48xlarge` Instanzen mit 20 Knoten auf PCS-Cluster-1, 16 Knoten auf PCS-Cluster-2 und den verbleibenden Knoten für andere Dienste aufzuteilen, setzen Sie beide und auf 20 für PCS-Cluster-1 `minInstanceCount` und `maxInstanceCount` 16 für PCS-Cluster-2.

**Kann ich mehr als einen Kapazitätsblock oder kombinierte Kapazität mit einer Rechenknotengruppe verwenden?**  
Nein. Einer einzelnen Rechenknotengruppe kann nur 1 Kapazitätsblock zugeordnet werden. AWS PCS unterstützt keine Kapazitätsreservierungsgruppen, die mehrere Kapazitätsblöcke kombinieren.

**Woher weiß ich, wann meine Kapazitätsblöcke beginnen oder ablaufen?**  
Unabhängig von AWS PCS sendet Amazon EC2 ein `Capacity Block Reservation Delivered` Ereignis, EventBridge wenn eine Kapazitätsblock-Reservierung beginnt, und ein `Capacity Block Reservation Expiration Warning` Ereignis 40 Minuten vor Ablauf der Kapazitätsblock-Reservierung. Weitere Informationen finden Sie unter [Verwendung von Kapazitätsblöcken überwachen EventBridge](https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/capacity-blocks-monitor.html) im *Amazon Elastic Compute Cloud-Benutzerhandbuch*.

**Wie verfolgt Slurm den Status meines Kapazitätsblocks?**  
Du kannst laufen`sinfo`, um zu verstehen, wie AWS PCS den Capacity Block verwendet. In der folgenden Beispielausgabe ist eine Warteschlange einer Rechenknotengruppe zugeordnet, die 4 Instanzen aus einem `active` Kapazitätsblock ausführt. Die Knoten befinden sich im `idle` Slurm-Status (zur Verwendung verfügbar und noch keinen Jobs zugewiesen).  

```
$ sinfo  
PARTITION AVAIL TIMELIMIT NODES STATE NODELIST  
fanout up infinite 4 idle node-fanout-[1-4]
```
Wenn sich die Knoten stattdessen im `maint` Status befinden, können Sie den Befehl ausführen, `scontrol show res` um Details zur Slurm-Reservierung zu sehen, die diesen Status kontrolliert. In der folgenden Beispielausgabe hat der `scheduled` Capacity-Block ein future Startdatum.  

```
$ scontrol show res                                                                                                  
ReservationName=node-fanout-scheduled StartTime=2025-10-14T13:09:17 EndTime=2025-10-14T13:11:17 Duration=00:02:00    
   Nodes=node-fanout-[1-4] NodeCnt=4 CoreCnt=16 Features=(null) PartitionName=(null) Flags=MAINT,SPEC_NODES          
   TRES=cpu=16                                                                                                       
   Users=root Groups=(null) Accounts=(null) Licenses=(null) State=ACTIVE BurstBuffer=(null)                          
   MaxStartDelay=(null)                                                                                              
   Comment=node-fanout Scheduled
```

**Wie kann ich feststellen, ob die Fehler, die ich beim Starten von Capacity erhalte, darauf zurückzuführen sind, dass mein Capacity-Block gemeinsam genutzt wird?**  
Überprüfen Sie **Capacity Reservations** in der Amazon EC2 EC2-Konsole, um herauszufinden, wie viele Instances aus dem Capacity Block aktiv bereitgestellt werden. Überprüfen Sie die Tags der einzelnen Instances, um herauszufinden, welcher Service oder Cluster sie verwendet. Beispielsweise verfügen alle Instanzen für AWS PCS über AWS PCS-Tags, `aws:pcs:cluster-id = pcs_l0mizqyk5o | aws:pcs:compute-node-group-id = pcs_ic7onkmfqk` die angeben, zu welchen Clustern und Rechenknotengruppen die Instanz gehört. Sie können dann überprüfen, ob der Kapazitätsblock die maximale Kapazität erreicht hat.  
Sie verwenden`scontrol show nodes`, um zu überprüfen, ob ein Capacity Block-Knoten in einem AWS PCS-Cluster Folgendes auslöst`ReservationCapacityExceeded`:  

```
[root@ip-172-16-10-54 ~]# scontrol show nodes test-node-8-gamma-cb-2  
NodeName=test-8-gamma-cb-2 CoresPerSocket=1  
   CPUAlloc=0 CPUEfctv=8 CPUTot=8 CPULoad=0.00  
   AvailableFeatures=test-8-gamma-cb,gpu  
   ActiveFeatures=test-8-gamma-cb,gpu  
   Gres=gpu:H100:1  
   NodeAddr=test-8-gamma-cb-2 NodeHostName=test-8-gamma-cb-2  
   RealMemory=249036 AllocMem=0 FreeMem=N/A Sockets=8 Boards=1  
   State=IDLE+CLOUD+POWERING_DOWN ThreadsPerCore=1 TmpDisk=0 Weight=1 Owner=N/A MCS_label=N/A  
   Partitions=my-q  
   BootTime=None SlurmdStartTime=None  
   LastBusyTime=Unknown ResumeAfterTime=None  
   CfgTRES=cpu=8,mem=249036M,billing=8  
   AllocTRES=  
   CurrentWatts=0 AveWatts=0  
   Reason=Failed to launch backing instance (Error Code: ReservationCapacityExceeded) [root@2025-08-28T15:15:33]
```

**Wie kann ich erzwingen, dass ein Job auf Capacity Block-gestützten Instances ausgeführt wird, wenn mehrere Rechenknotengruppen an dieselbe Warteschlange angehängt sind?**  
Sie können die Funktionen und Einschränkungen von Slurm verwenden, um einen Job an eine bestimmte Gruppe von Knoten zu binden. Wir empfehlen, Slurm-Gewichtungen nicht für jede Rechenknotengruppe festzulegen, da dies nur mit Knoten funktioniert, die sich nicht im `maint` Status befinden.