Überprüfen Sie die JSON Konfigurationsdateien, bevor Sie einen Slurm-Cluster erstellen auf HyperPod - Amazon SageMaker KI

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Überprüfen Sie die JSON Konfigurationsdateien, bevor Sie einen Slurm-Cluster erstellen auf HyperPod

Verwenden Sie das Skript zur JSON Konfigurationsvalidierung, um die Konfigurationsdateien zu validieren, bevor Sie eine Anfrage zur Clustererstellung einreichen validate-config.py. Dieses Skript analysiert und vergleicht Ihre HyperPod JSON Cluster-Konfigurationsdatei und die JSON Slurm-Konfigurationsdatei und ermittelt, ob zwischen den beiden Dateien und auch zwischen Amazon-EC2, Amazon- und Amazon-Ressourcen eine Fehlkonfiguration der Ressourcen VPC vorliegt. FSx Um beispielsweise die provisioning_parameters.json Dateien create_cluster.json und aus dem Beginnen Sie mit den grundlegenden Lebenszyklusskripten von HyperPod Abschnitt zu validieren, führen Sie das Validierungsskript wie folgt aus.

python3 validate-config.py --cluster-config create_cluster.json --provisioning-parameters provisioning_parameters.json

Im Folgenden finden Sie ein Beispiel für die Ausgabe einer erfolgreichen Überprüfung.

✔️ Validated instance group name worker-group-1 is correct ... ✔️ Validated subnet subnet-012345abcdef67890 ... ✔️ Validated security group sg-012345abcdef67890 ingress rules ... ✔️ Validated security group sg-012345abcdef67890 egress rules ... ✔️ Validated FSx Lustre DNS name fs-012345abcdef67890.fsx.us-east-1.amazonaws.com ✔️ Validated FSx Lustre mount name abcdefgh ✅ Cluster Validation succeeded