Surveillez votre cluster à l'aide du tableau de bord d'observabilité - Amazon EKS

Aidez à améliorer cette page

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Vous souhaitez contribuer à ce guide de l'utilisateur ? Faites défiler cette page vers le bas et sélectionnez Modifier cette page sur GitHub. Vos contributions contribueront à améliorer notre guide de l'utilisateur pour tous.

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Surveillez votre cluster à l'aide du tableau de bord d'observabilité

La EKS console Amazon inclut un tableau de bord d'observabilité qui donne une visibilité sur les performances de votre cluster. Les informations contenues dans ce tableau de bord vous aident à détecter, résoudre et résoudre rapidement les problèmes. Vous pouvez ouvrir la section appropriée du tableau de bord en choisissant un élément dans le résumé de la santé et des performances. Ce résumé est inclus à plusieurs endroits, notamment dans l'onglet Observabilité.

Le tableau de bord est divisé en plusieurs onglets.

Récapitulatif

Le résumé de la santé et des performances répertorie la quantité d'articles dans différentes catégories. Chaque numéro fait office de lien hypertexte vers un emplacement dans le tableau de bord avec une liste pour cette catégorie.

Problèmes de santé des clusters

Les problèmes de santé des clusters sont des notifications importantes à connaître, dont vous devrez peut-être prendre des mesures dès que possible. Cette liste vous permet de consulter les descriptions et les ressources concernées. Pour actualiser le statut, cliquez sur le bouton d'actualisation (↻).

Pour de plus amples informations, veuillez consulter Codes d'erreur FAQs et d'intégrité du cluster avec chemins de résolution.

Surveillance du plan de contrôle

L'onglet Surveillance du plan de contrôle est divisé en trois sections, chacune d'entre elles vous permettant de surveiller et de dépanner le plan de contrôle de votre cluster.

Métriques

La section Métriques présente des graphiques de plusieurs métriques collectées pour différents composants du plan de contrôle. Cette fonctionnalité spécifique n'est disponible que pour les nouveaux clusters et les clusters précédents dotés d'une version de plate-forme identique ou ultérieure par rapport au tableau suivant.

Version de Kubernetes Version de la plateforme

1.31

eks.12

1.30

eks.20

1.29

eks.23

1.28

eks.29

Vous pouvez définir la période utilisée par l'axe X de chaque graphique en effectuant des sélections en haut de la section. Vous pouvez actualiser les données à l'aide du bouton d'actualisation (↻). Pour chaque graphique distinct, le bouton représentant des ellipses verticales (1) ouvre un menu contenant les options de CloudWatch.

Ces métriques et bien d'autres sont automatiquement disponibles CloudWatch sous forme de métriques de surveillance de base dans l'espace de AWS/EKS noms. Pour plus d'informations, consultez les sections Surveillance de base et surveillance détaillée dans le guide de CloudWatch l'utilisateur Amazon. Pour obtenir des statistiques, des visualisations et des informations plus détaillées, consultez Container Insights dans le guide de CloudWatch l'utilisateur Amazon. Ou si tu préfères Prometheus surveillance basée, voirSurveillez les indicateurs de votre cluster avec Prometheus.

Le tableau suivant décrit les mesures disponibles.

Métrique Description

Demandes de APIServer

Les demandes par minute adressées au API serveur.

APIServerNombre total de demandes 4XX

Nombre de demandes de API serveur par minute contenant HTTP 4XX codes de réponse (erreurs côté client).

APIServerNombre total de demandes 5XX

Nombre de requêtes API serveur contenant HTTP 5XX codes de réponse par minute (erreurs côté serveur).

APIServerNombre total de demandes 429

Nombre de demandes de API serveur par minute contenant HTTP 429 codes de réponse (trop de demandes).

Taille de stockage

Taille de la base de données de stockage (etcd).

Tentatives du planificateur

Nombre de tentatives de planification des modules en fonction des résultats « non planifiables », « erreurs » et « planifiées ».

Pods en attente

Nombre de modules en attente par type de file d'attente : « actif », « en attente », « non planifiable » et « fermé ».

APIlatence des demandes du serveur

La latence des requêtes API du serveur.

APIdemandes de vol en cours du serveur

Les demandes en cours de vol pour le API serveur.

Demandes de webhook

Les demandes de webhook par minute.

Refus de demandes de webhook

Nombre de demandes de webhook rejetées.

Latence des requêtes Webhook P99

99e percentile de latence des demandes de webhook externes provenant de tiers.

CloudWatch Informations sur les journaux

La section CloudWatch Log Insights affiche différentes listes basées sur les journaux d'audit du plan de contrôle. Les journaux du plan EKS de contrôle Amazon doivent être activés pour utiliser cette fonctionnalité, ce que vous pouvez faire dans la section Afficher les journaux du plan de contrôle dans la CloudWatch section Afficher les journaux du plan de contrôle.

Lorsque suffisamment de temps s'est écoulé pour collecter les données, vous pouvez exécuter toutes les requêtes ou choisir Exécuter la requête pour une seule liste à la fois. Un coût supplémentaire sera facturé CloudWatch chaque fois que vous lancerez des requêtes. Choisissez la période des résultats que vous souhaitez afficher en haut de la section. Si vous souhaitez un contrôle plus avancé pour n'importe quelle requête, vous pouvez choisir Afficher dans CloudWatch. Cela vous permettra de mettre à jour une requête CloudWatch en fonction de vos besoins.

Pour plus d'informations, consultez Analyser les données des CloudWatch journaux avec Logs Insights dans le guide de l'utilisateur Amazon CloudWatch Logs.

Afficher les connexions au plan de contrôle CloudWatch

Choisissez Gérer la journalisation pour mettre à jour les types de journaux disponibles. Plusieurs minutes sont nécessaires pour que les journaux apparaissent dans CloudWatch les journaux une fois que vous avez activé la journalisation. Lorsque suffisamment de temps s'est écoulé, cliquez sur l'un des liens Afficher de cette section pour accéder au journal correspondant.

Pour de plus amples informations, veuillez consulter Envoyer les journaux du plan de contrôle à CloudWatch Logs.

Informations sur le cluster

Le tableau Upgrade Insights met en évidence les problèmes et recommande des mesures correctives, accélérant ainsi le processus de validation pour la mise à niveau vers les nouvelles versions de Kubernetes. Amazon analyse EKS automatiquement les clusters en fonction d'une liste de problèmes potentiels liés à la mise à niveau de la version de Kubernetes. Le tableau Upgrade Insights répertorie les vérifications d'informations effectuées par Amazon par EKS rapport à ce cluster, ainsi que leurs statuts associés.

Amazon EKS tient à jour et actualise régulièrement la liste des vérifications d'informations à effectuer sur la base des évaluations des modifications apportées au projet Kubernetes ainsi que des modifications des EKS services Amazon liées aux nouvelles versions. La EKS console Amazon actualise automatiquement le statut de chaque information, qui est visible dans la colonne relative à l'heure de dernière actualisation.

Pour de plus amples informations, veuillez consulter Préparez-vous pour Kubernetes mises à niveau de version avec informations sur le cluster.

Problèmes de santé des nœuds

L'agent de surveillance des EKS nœuds Amazon lit automatiquement les journaux des nœuds pour détecter les problèmes de santé. Quel que soit le paramètre de réparation automatique, tous les problèmes de santé du nœud sont signalés afin que vous puissiez les examiner si nécessaire. Si un type de problème est répertorié sans description, vous pouvez lire la description dans son élément contextuel.

Lorsque vous actualisez la page, tous les problèmes résolus disparaissent de la liste. Si la réparation auto est activée, vous pourriez voir temporairement certains problèmes de santé qui seront résolus sans action de votre part. Les problèmes qui ne sont pas pris en charge par la réparation auto peuvent nécessiter une action manuelle de votre part, selon le type.

Pour que les problèmes de santé des nœuds soient signalés, votre cluster doit utiliser le mode Amazon EKS Auto ou disposer du module complémentaire d'agent de surveillance des nœuds. Pour de plus amples informations, veuillez consulter Activez la réparation automatique des nœuds et étudiez les problèmes de santé des nœuds.

📝 Modifiez cette page sur GitHub