Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Observabilitas untuk SageMaker HyperPod cluster yang diatur oleh Amazon EKS
Untuk mencapai observabilitas komprehensif ke dalam sumber daya SageMaker HyperPod klaster dan komponen perangkat lunak Anda, integrasikan cluster dengan Amazon CloudWatch Container Insights, AmazonManaged Service for Prometheus, dan Amazon Managed Grafana.
Integrasi dengan Amazon Managed Service untuk Prometheus memungkinkan ekspor metrik yang terkait dengan sumber daya klaster HyperPod Anda, memberikan wawasan tentang kinerja, pemanfaatan, dan kesehatannya. Integrasi dengan Grafana Terkelola Amazon memungkinkan visualisasi metrik ini melalui berbagai dasbor Grafana yang menawarkan antarmuka intuitif untuk memantau dan menganalisis perilaku cluster. Dengan memanfaatkan layanan ini, Anda mendapatkan tampilan HyperPod klaster yang terpusat dan terpadu, memfasilitasi pemantauan proaktif, pemecahan masalah, dan optimalisasi beban kerja pelatihan terdistribusi Anda.
Tip
Untuk menemukan contoh dan solusi praktis, lihat juga bagian Observability
Lanjutkan ke topik berikut untuk menyiapkan observabilitas SageMaker HyperPod cluster.