Configurazione della dashboard - Amazon SageMaker AI

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Configurazione della dashboard

Utilizza le seguenti informazioni per configurare il componente aggiuntivo Amazon SageMaker HyperPod Amazon CloudWatch Observability EKS. In questo modo avrai a disposizione una dashboard visiva dettagliata che fornisce una panoramica delle metriche relative all'hardware del cluster EKS, all'allocazione dei team e alle attività.

In caso di problemi di configurazione, consulta le soluzioni note Risoluzione dei problemi per la risoluzione dei problemi.

HyperPodPrerequisiti del componente aggiuntivo Amazon CloudWatch Observability EKS

La sezione seguente include i prerequisiti necessari prima di installare il componente aggiuntivo Amazon EKS Observability.

  • Se non l'hai ancora fatto, segui le istruzioni Utenti IAM per amministratori di cluster per assicurarti di disporre dell'autorizzazione minima per le attività amministrative del HyperPod cluster.

  • Collega la policy CloudWatchAgentServerPolicy IAM ai tuoi nodi di lavoro. A questo scopo, immetti il comando seguente. Sostituiscila my-worker-node-role con il ruolo IAM utilizzato dai nodi di lavoro Kubernetes.

    aws iam attach-role-policy \ --role-name my-worker-node-role \ --policy-arn arn:aws:iam::aws:policy/CloudWatchAgentServerPolicy

HyperPod Configurazione del componente aggiuntivo Amazon CloudWatch Observability EKS

Utilizza le seguenti opzioni per configurare il componente aggiuntivo Amazon SageMaker HyperPod Amazon CloudWatch Observability EKS.

Setup using the SageMaker AI console

Le seguenti autorizzazioni sono necessarie per configurare e visualizzare la dashboard di governance delle attività. HyperPod Questa sezione amplia le autorizzazioni elencate in. Utenti IAM per amministratori di cluster

Per gestire la governance delle attività, utilizza la politica di esempio:

{ "Version": "2012-10-17", "Statement": [ { "Effect": "Allow", "Action": [ "sagemaker:ListClusters", "sagemaker:DescribeCluster", "sagemaker:ListComputeQuotas", "sagemaker:CreateComputeQuota", "sagemaker:UpdateComputeQuota", "sagemaker:DescribeComputeQuota", "sagemaker:DeleteComputeQuota", "sagemaker:ListClusterSchedulerConfigs", "sagemaker:DescribeClusterSchedulerConfig", "sagemaker:CreateClusterSchedulerConfig", "sagemaker:UpdateClusterSchedulerConfig", "sagemaker:DeleteClusterSchedulerConfig", "eks:ListAddons", "eks:CreateAddon", "eks:DescribeAddon", "eks:DescribeCluster", "eks:DescribeAccessEntry", "eks:ListAssociatedAccessPolicies", "eks:AssociateAccessPolicy", "eks:DisassociateAccessPolicy" ], "Resource": "*" } ] }

Per concedere le autorizzazioni per gestire Amazon CloudWatch Observability Amazon EKS e visualizzare la dashboard del HyperPod cluster tramite la console SageMaker AI, utilizza la politica di esempio seguente:

{ "Version": "2012-10-17", "Statement": [ { "Effect": "Allow", "Action": [ "eks:ListAddons", "eks:CreateAddon", "eks:UpdateAddon", "eks:DescribeAddon", "eks:DescribeAddonVersions", "sagemaker:DescribeCluster", "sagemaker:DescribeClusterNode", "sagemaker:ListClusterNodes", "sagemaker:ListClusters", "sagemaker:ListComputeQuotas", "sagemaker:DescribeComputeQuota", "sagemaker:ListClusterSchedulerConfigs", "sagemaker:DescribeClusterSchedulerConfig", "eks:DescribeCluster", "cloudwatch:GetMetricData", "eks:AccessKubernetesApi" ], "Resource": "*" } ] }

Passa alla scheda Dashboard nella SageMaker HyperPod console per installare Amazon CloudWatch Observability EKS. Per garantire che le metriche relative alla governance delle attività siano incluse nella dashboard, abilita la casella di controllo delle metriche di Kueue. L'abilitazione delle metriche Kueue abilita i costi di Metrics, una volta raggiunto il limite del livello CloudWatch gratuito. Per ulteriori informazioni, consulta Metrics in Amazon CloudWatch Pricing.

Setup using the EKS AWS CLI

Utilizza il seguente AWS CLI comando EKS per installare il componente aggiuntivo:

aws eks create-addon --cluster-name cluster-name --addon-name amazon-cloudwatch-observability --configuration-values "configuration json"

Di seguito è riportato un esempio del codice JSON dei valori di configurazione:

{ "agent": { "config": { "logs": { "metrics_collected": { "kubernetes": { "kueue_container_insights": true, "enhanced_container_insights": true }, "application_signals": { } } }, "traces": { "traces_collected": { "application_signals": { } } } }, }, }
Setup using the EKS Console UI
  1. Vai alla console EKS.

  2. Scegli il tuo cluster.

  3. Scegli Componenti aggiuntivi.

  4. Trova il componente aggiuntivo Amazon CloudWatch Observability e installalo. Installa la versione >= 2.4.0 per il componente aggiuntivo.

  5. Includi i seguenti valori JSON, Configuration:

    { "agent": { "config": { "logs": { "metrics_collected": { "kubernetes": { "kueue_container_insights": true, "enhanced_container_insights": true }, "application_signals": { } }, }, "traces": { "traces_collected": { "application_signals": { } } } }, }, }

Una volta installato correttamente il componente aggiuntivo EKS Observability, puoi visualizzare le metriche del cluster EKS nella scheda Dashboard della HyperPod console.