Osservabilità per SageMaker HyperPod cluster orchestrati da Amazon EKS - Amazon SageMaker

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Osservabilità per SageMaker HyperPod cluster orchestrati da Amazon EKS

Per ottenere un'osservabilità completa nelle risorse del SageMaker HyperPod cluster e nei componenti software, integra il cluster con Amazon CloudWatch Container Insights, Amazon Managed Service for Prometheus e Amazon Managed Grafana.

L'integrazione con Amazon Managed Service for Prometheus consente l'esportazione di metriche relative alle HyperPod risorse del cluster, fornendo informazioni sulle loro prestazioni, utilizzo e integrità. L'integrazione con Amazon Managed Grafana consente la visualizzazione di queste metriche attraverso varie dashboard Grafana che offrono un'interfaccia intuitiva per il monitoraggio e l'analisi del comportamento del cluster. Sfruttando questi servizi, ottieni una visione centralizzata e unificata del HyperPod cluster, facilitando il monitoraggio proattivo, la risoluzione dei problemi e l'ottimizzazione dei carichi di lavoro di formazione distribuiti.

Suggerimento

Per trovare esempi e soluzioni pratiche, consulta anche la sezione Observability in Amazon EKS Support in SageMaker HyperPod workshop.

Passa ai seguenti argomenti per configurare l'osservabilità dei SageMaker HyperPod cluster.