Voraussetzungen für die SageMaker HyperPod Cluster-Observability - Amazon SageMaker

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Voraussetzungen für die SageMaker HyperPod Cluster-Observability

Bevor Sie mit den Schritten bis fortfahrenInstallieren Sie Metrics Exporter-Pakete auf Ihrem Cluster HyperPod , stellen Sie sicher, dass die folgenden Voraussetzungen erfüllt sind.

Aktivieren Sie IAM Identity Center

Um Observability für Ihren SageMaker HyperPod Cluster zu aktivieren, müssen Sie zuerst IAM Identity Center aktivieren. Dies ist eine Voraussetzung für die Bereitstellung eines AWS CloudFormation Stack, der den Amazon Managed Grafana-Workspace und Amazon Managed Service für Prometheus einrichtet. Beide Dienste benötigen außerdem das IAM Identity Center für die Authentifizierung und Autorisierung, um den sicheren Benutzerzugriff und die Verwaltung der Überwachungsinfrastruktur zu gewährleisten.

Eine ausführliche Anleitung zur Aktivierung von IAM Identity Center finden Sie im Abschnitt zur Aktivierung von IAM Identity Center im AWS IAMIdentity Center-Benutzerhandbuch.

Nachdem Sie IAM Identity Center erfolgreich aktiviert haben, richten Sie ein Benutzerkonto ein, das während der folgenden Konfigurationsschritte als Administratorbenutzer dient.

Erstellen und implementieren Sie ein AWS CloudFormation Stapel für SageMaker HyperPod Beobachtbarkeit

Erstellen und implementieren Sie mithilfe von Amazon Managed Service for Prometheus und Amazon Managed Grafana einen CloudFormation Stack für SageMaker HyperPod Observability, um HyperPod Cluster-Metriken in Echtzeit zu überwachen. Beachten Sie, dass Sie vor der Bereitstellung des Stacks auch Ihr IAM Identity Center aktivieren sollten.

Verwenden Sie das CloudFormation Beispielskript cluster-observability.yaml, das Ihnen hilft, VPC Amazon-Subnetze, Amazon FSx for Lustre-Dateisysteme, Amazon S3-Buckets und IAM Rollen einzurichten, die für die Erstellung eines HyperPod Cluster-Observability-Stacks erforderlich sind.