

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

# Behebung von Problemen in Clustern mit AWS Batch Integration
<a name="troubleshooting-v3-batch"></a>

Dieser Abschnitt enthält mögliche Tipps zur Fehlerbehebung für Cluster mit AWS Batch Scheduler-Integration, insbesondere bei Problemen mit Hauptknoten, Rechenproblemen, Auftragsausfällen und Timeoutfehlern.

**Topics**
+ [Probleme mit dem Hauptknoten](#troubleshooting-v3-batch-head-node)
+ [Probleme mit der Datenverarbeitung](#troubleshooting-v3-batch-compute-nodes)
+ [Auftragsfehler](#troubleshooting-v3-batch-job-fail)
+ [Verbindungstimeout bei Endpunkt-URL-Fehler](#troubleshooting-v3-batch-connect-timeout)

## Probleme mit dem Hauptknoten
<a name="troubleshooting-v3-batch-head-node"></a>

Sie können Probleme mit der Einrichtung des Kopfknotens auf die gleiche Weise wie bei einem Slurm Cluster beheben (mit Ausnahme Slurm bestimmter Protokolle). Weitere Informationen zu diesen Problemen finden Sie unter [Hauptknoten](troubleshooting-v3-scaling-issues.md#troubleshooting-v3-node-init.head-node).

## Probleme mit der Datenverarbeitung
<a name="troubleshooting-v3-batch-compute-nodes"></a>

AWS Batch verwaltet die Skalierungs- und Rechenaspekte Ihrer Dienste. Wenn Sie auf Probleme im Zusammenhang mit der Datenverarbeitung stoßen, finden Sie in der Dokumentation AWS Batch [zur Fehlerbehebung](https://docs.aws.amazon.com/batch/latest/userguide/troubleshooting.html) Hilfe.

## Auftragsfehler
<a name="troubleshooting-v3-batch-job-fail"></a>

Wenn ein Job fehlschlägt, können Sie den [`awsbout`](awsbatchcli.awsbout-v3.md) Befehl ausführen, um die Jobausgabe abzurufen. Sie können den [`awsbstat`](awsbatchcli.awsbstat-v3.md) Befehl auch ausführen, um einen Link zu den von Amazon gespeicherten Jobprotokollen zu erhalten CloudWatch.

## Verbindungstimeout bei Endpunkt-URL-Fehler
<a name="troubleshooting-v3-batch-connect-timeout"></a>

Wenn parallel Jobs mit mehreren Knoten mit folgendem Fehler fehlschlagen: `Connect timeout on endpoint URL`
+ Überprüfen Sie im `awsbout` Ausgabelog, ob der Job parallel zur Ausgabe mehrere Knoten hat: `Detected 3/3 compute nodes. Waiting for all compute nodes to start.`
+ Überprüfen Sie, ob das Subnetz der Rechenknoten öffentlich ist.

parallel Jobs mit mehreren Knoten unterstützen nicht die Verwendung von öffentlichen Subnetzen bei der Verwendung AWS Batch von. AWS ParallelCluster Verwenden Sie ein privates Subnetz für Ihre Rechenknoten und Jobs. Weitere Informationen finden Sie im *AWS Batch Benutzerhandbuch* unter [Überlegungen zur Rechenumgebung](https://docs.aws.amazon.com/batch/latest/userguide/multi-node-parallel-jobs.html#mnp-ce). Informationen zur Konfiguration eines privaten Subnetzes für Ihre Rechenknoten finden Sie unter[AWS ParallelCluster mit AWS Batch Scheduler](network-configuration-v3-batch.md).