Einrichtung des Dashboards - Amazon SageMaker KI

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Einrichtung des Dashboards

Verwenden Sie die folgenden Informationen, um das Amazon SageMaker HyperPod Amazon CloudWatch Observability EKS-Add-on einzurichten. Auf diese Weise erhalten Sie ein detailliertes visuelles Dashboard, das einen Überblick über die Kennzahlen Ihrer EKS-Cluster-Hardware, Teamzuweisung und Aufgaben bietet.

Falls Sie Probleme bei der Einrichtung haben, finden Fehlerbehebung Sie hier bekannte Lösungen zur Problembehebung.

HyperPodVoraussetzungen für das Amazon CloudWatch Observability EKS-Add-on

Der folgende Abschnitt enthält die Voraussetzungen, die für die Installation des Amazon EKS Observability-Add-ons erforderlich sind.

  • Falls Sie dies noch nicht getan haben, folgen Sie den Anweisungen unter, IAM-Benutzer für den Cluster-Administrator um sicherzustellen, dass Sie über die Mindestberechtigungen für HyperPod Cluster-Verwaltungsaufgaben verfügen.

  • Hängen Sie die CloudWatchAgentServerPolicy IAM-Richtlinie an Ihre Worker-Knoten an. Geben Sie dazu den folgenden Befehl ein. my-worker-node-roleErsetzen Sie sie durch die IAM-Rolle, die von Ihren Kubernetes-Worker-Knoten verwendet wird.

    aws iam attach-role-policy \ --role-name my-worker-node-role \ --policy-arn arn:aws:iam::aws:policy/CloudWatchAgentServerPolicy

HyperPod Einrichtung des Amazon CloudWatch Observability EKS-Add-ons

Verwenden Sie die folgenden Optionen, um das Amazon SageMaker HyperPod Amazon CloudWatch Observability EKS-Add-on einzurichten.

Setup using the SageMaker AI console

Die folgenden Berechtigungen sind für die Einrichtung und Visualisierung des HyperPod Task-Governance-Dashboards erforderlich. In diesem Abschnitt werden die unter aufgeführten Berechtigungen erweitert. IAM-Benutzer für den Cluster-Administrator

Verwenden Sie die Beispielrichtlinie, um die Task-Governance zu verwalten:

{ "Version": "2012-10-17", "Statement": [ { "Effect": "Allow", "Action": [ "sagemaker:ListClusters", "sagemaker:DescribeCluster", "sagemaker:ListComputeQuotas", "sagemaker:CreateComputeQuota", "sagemaker:UpdateComputeQuota", "sagemaker:DescribeComputeQuota", "sagemaker:DeleteComputeQuota", "sagemaker:ListClusterSchedulerConfigs", "sagemaker:DescribeClusterSchedulerConfig", "sagemaker:CreateClusterSchedulerConfig", "sagemaker:UpdateClusterSchedulerConfig", "sagemaker:DeleteClusterSchedulerConfig", "eks:ListAddons", "eks:CreateAddon", "eks:DescribeAddon", "eks:DescribeCluster", "eks:DescribeAccessEntry", "eks:ListAssociatedAccessPolicies", "eks:AssociateAccessPolicy", "eks:DisassociateAccessPolicy" ], "Resource": "*" } ] }

Verwenden Sie die folgende Beispielrichtlinie, um Berechtigungen zur Verwaltung von Amazon CloudWatch Observability Amazon EKS und zur Anzeige des HyperPod Cluster-Dashboards über die SageMaker KI-Konsole zu erteilen:

{ "Version": "2012-10-17", "Statement": [ { "Effect": "Allow", "Action": [ "eks:ListAddons", "eks:CreateAddon", "eks:UpdateAddon", "eks:DescribeAddon", "eks:DescribeAddonVersions", "sagemaker:DescribeCluster", "sagemaker:DescribeClusterNode", "sagemaker:ListClusterNodes", "sagemaker:ListClusters", "sagemaker:ListComputeQuotas", "sagemaker:DescribeComputeQuota", "sagemaker:ListClusterSchedulerConfigs", "sagemaker:DescribeClusterSchedulerConfig", "eks:DescribeCluster", "cloudwatch:GetMetricData", "eks:AccessKubernetesApi" ], "Resource": "*" } ] }

Navigieren Sie in der SageMaker HyperPod Konsole zur Registerkarte Dashboard, um Amazon CloudWatch Observability EKS zu installieren. Um sicherzustellen, dass Kennzahlen zur Task-Governance im Dashboard enthalten sind, aktivieren Sie das Kontrollkästchen Warteschlangen-Metriken. Wenn Sie die Kueue-Metriken aktivieren, werden Metrik-Kosten aktiviert CloudWatch, sobald das Limit für das kostenlose Nutzungskontingent erreicht ist. Weitere Informationen finden Sie unter Metriken in der CloudWatchAmazon-Preisgestaltung.

Setup using the EKS AWS CLI

Verwenden Sie den folgenden AWS CLI EKS-Befehl, um das Add-on zu installieren:

aws eks create-addon --cluster-name cluster-name --addon-name amazon-cloudwatch-observability --configuration-values "configuration json"

Im Folgenden finden Sie ein Beispiel für das JSON der Konfigurationswerte:

{ "agent": { "config": { "logs": { "metrics_collected": { "kubernetes": { "kueue_container_insights": true, "enhanced_container_insights": true }, "application_signals": { } } }, "traces": { "traces_collected": { "application_signals": { } } } }, }, }
Setup using the EKS Console UI
  1. Navigieren Sie zur EKS-Konsole.

  2. Wählen Sie Ihren Cluster aus.

  3. Wählen Sie Add-Ons.

  4. Suchen Sie das Amazon CloudWatch Observability-Add-on und installieren Sie es. Installieren Sie Version >= 2.4.0 für das Add-on.

  5. Fügen Sie die folgenden JSON-Konfigurationswerte hinzu:

    { "agent": { "config": { "logs": { "metrics_collected": { "kubernetes": { "kueue_container_insights": true, "enhanced_container_insights": true }, "application_signals": { } }, }, "traces": { "traces_collected": { "application_signals": { } } } }, }, }

Sobald das EKS-Observability-Add-on erfolgreich installiert wurde, können Sie Ihre EKS-Cluster-Metriken auf der Registerkarte Dashboard der HyperPod Konsole einsehen.