Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
SageMaker HyperPod Clusterverwaltung
In den folgenden Themen wird die Protokollierung und Verwaltung von SageMaker HyperPod Clustern behandelt.
Protokollieren von SageMaker HyperPod Ereignissen
Alle Ereignisse und Protokolle von SageMaker HyperPod werden in Amazon CloudWatch unter dem Namen der Protokollgruppe gespeichert/aws/sagemaker/Clusters/[ClusterName]/[ClusterID]
. Jeder APICreateCluster
-Aufruf erstellt eine neue Protokollgruppe. Die folgende Liste enthält alle verfügbaren Protokollstreams, die in jeder Protokollgruppe erfasst wurden.
Protokollgruppenname | Protokollstreamname |
/aws/sagemaker/Clusters/[ClusterName]/[ClusterID] |
LifecycleConfig/[instance-group-name]/[instance-id] |
Protokollierung SageMaker HyperPod auf Instance-Ebene
Sie können während der Cluster-Instance-Konfiguration auf die CloudWatch in veröffentlichten LifecycleScript Protokolle zugreifen. Jede Instance innerhalb des erstellten Clusters generiert einen separaten Protokollstream, der sich durch das LifecycleConfig/[instance-group-name]/[instance-id]
Format unterscheidet.
Alle Protokolle, die in geschrieben werden, /var/log/provision/provisioning.log
werden in den vorhergehenden CloudWatch Stream hochgeladen. Beispiel LifecycleScripts bei 1.architectures/5.sagemaker_hyperpods/LifecycleScripts/base-config
stdout
und stderr
an diesen Speicherort. Wenn Sie Ihre benutzerdefinierten Skripts verwenden, schreiben Sie Ihre Protokolle an den /var/log/provision/provisioning.log
Speicherort, an dem sie in verfügbar sind CloudWatch.
Markieren von Ressourcen
AWS Das Tagging-System hilft bei der Verwaltung, Identifizierung, Organisation, Suche und Filterung von -Ressourcen. SageMaker HyperPod unterstützt das Tagging, sodass Sie die Cluster als - AWS Ressource verwalten können. Während der Clustererstellung oder -bearbeitung eines vorhandenen Clusters können Sie Tags für den Cluster hinzufügen oder bearbeiten. Weitere Informationen zum Markieren im Allgemeinen finden Sie unter Markieren Ihrer AWS Ressourcen.
Verwenden der Benutzeroberfläche der SageMaker HyperPod Konsole
Wenn Sie einen neuen Cluster erstellen und einen Cluster bearbeiten, können Sie Tags hinzufügen, entfernen oder bearbeiten.
Verwenden der SageMaker HyperPod APIs
Wenn Sie eine - CreateCluster oder UpdateCluster-API-Anforderungsdatei im JSON-Format schreiben, bearbeiten Sie den Tags
Abschnitt .
Verwenden der AWS CLI Tagging-Befehle für SageMaker
So markieren Sie einen Cluster
Verwenden Sie aws sagemaker add-tags
wie folgt.
aws sagemaker add-tags --resource-arn
cluster_ARN
--tags Key=string
,Value=string
So heben Sie die Markierung eines Clusters auf
Verwenden Sie aws sagemaker delete-tags
wie folgt.
aws sagemaker delete-tags --resource-arn
cluster_ARN
--tag-keys"tag_key"
So listen Sie Tags für eine Ressource auf
Verwenden Sie aws sagemaker list-tags
wie folgt.
aws sagemaker list-tags --resource-arn
cluster_ARN