SageMaker HyperPod Clusterverwaltung - Amazon SageMaker KI

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

SageMaker HyperPod Clusterverwaltung

In den folgenden Themen werden die Protokollierung und Verwaltung von SageMaker HyperPod Clustern behandelt.

SageMaker HyperPod Ereignisse protokollieren

Alle Ereignisse und Protokolle von SageMaker HyperPod werden in Amazon CloudWatch unter dem Namen der Protokollgruppe gespeichert/aws/sagemaker/Clusters/[ClusterName]/[ClusterID]. Jeder Aufruf der CreateCluster API erstellt eine neue Protokollgruppe. Die folgende Liste enthält alle verfügbaren Protokollstreams, die in jeder Protokollgruppe gesammelt wurden.

Name der Protokollgruppe Name des Protokolldatenstroms
/aws/sagemaker/Clusters/[ClusterName]/[ClusterID] LifecycleConfig/[instance-group-name]/[instance-id]

Protokollierung SageMaker HyperPod auf Instanzebene

Sie können CloudWatch während der Konfiguration der Cluster-Instanz auf die veröffentlichten LifecycleScript Protokolle zugreifen. Jede Instanz innerhalb des erstellten Clusters generiert einen separaten Protokollstream, der sich durch das LifecycleConfig/[instance-group-name]/[instance-id] Format unterscheidet.

Alle Protokolle, in die geschrieben wird, /var/log/provision/provisioning.log werden in den vorherigen CloudWatch Stream hochgeladen. Beispiel LifecycleScripts bei der 1.architectures/5.sagemaker_hyperpods/LifecycleScripts/base-configWeiterleitung ihres stdout und stderr an diesen Speicherort. Wenn Sie Ihre benutzerdefinierten Skripts verwenden, schreiben Sie Ihre Protokolle an den /var/log/provision/provisioning.log Ort, an dem sie verfügbar sind CloudWatch.

Taggen von -Ressourcen

AWS Das Tagging-System hilft bei der Verwaltung, Identifizierung, Organisation, Suche und Filterung von Ressourcen. SageMaker HyperPod unterstützt Tagging, sodass Sie die Cluster als Ressource verwalten können. AWS Während der Clustererstellung oder Bearbeitung eines vorhandenen Clusters können Sie Tags für den Cluster hinzufügen oder bearbeiten. Weitere Informationen zum Taggen im Allgemeinen finden Sie unter Taggen Ihrer AWS Ressourcen.

Verwenden der Benutzeroberfläche der Konsole SageMaker HyperPod

Wenn Sie einen neuen Cluster erstellen und einen Cluster bearbeiten, können Sie Tags hinzufügen, entfernen oder bearbeiten.

Mit dem SageMaker HyperPod APIs

Wenn Sie eine CreateClusteroder UpdateClusterAPI-Anforderungsdatei im JSON-Format schreiben, bearbeiten Sie den Tags Abschnitt.

Verwenden Sie die AWS CLI Tagging-Befehle für KI SageMaker

Um einen Cluster zu taggen

Verwenden Sie aws sagemaker add-tagses wie folgt.

aws sagemaker add-tags --resource-arn cluster_ARN --tags Key=string,Value=string

Um die Markierung eines Clusters aufzuheben

Verwenden Sie aws sagemaker delete-tagses wie folgt.

aws sagemaker delete-tags --resource-arn cluster_ARN --tag-keys "tag_key"

Um Tags für eine Ressource aufzulisten

Verwenden Sie aws sagemaker list-tagses wie folgt.

aws sagemaker list-tags --resource-arn cluster_ARN