Récapitulatif Problèmes de santé des clusters Surveillance du plan de contrôle Informations sur le cluster Problèmes de santé des nœuds

Aidez à améliorer cette page

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Vous souhaitez contribuer à ce guide de l'utilisateur ? Faites défiler cette page vers le bas et sélectionnez Modifier cette page sur GitHub. Vos contributions contribueront à améliorer notre guide de l'utilisateur pour tous.

Surveillez votre cluster à l'aide du tableau de bord d'observabilité

La EKS console Amazon inclut un tableau de bord d'observabilité qui donne une visibilité sur les performances de votre cluster. Les informations contenues dans ce tableau de bord vous aident à détecter, résoudre et résoudre rapidement les problèmes. Vous pouvez ouvrir la section appropriée du tableau de bord en choisissant un élément dans le résumé de la santé et des performances. Ce résumé est inclus à plusieurs endroits, notamment dans l'onglet Observabilité.

Le tableau de bord est divisé en plusieurs onglets.

Récapitulatif

Le résumé de la santé et des performances répertorie la quantité d'articles dans différentes catégories. Chaque numéro fait office de lien hypertexte vers un emplacement dans le tableau de bord avec une liste pour cette catégorie.

Problèmes de santé des clusters

Les problèmes de santé des clusters sont des notifications importantes à connaître, dont vous devrez peut-être prendre des mesures dès que possible. Cette liste vous permet de consulter les descriptions et les ressources concernées. Pour actualiser le statut, cliquez sur le bouton d'actualisation (↻).

Pour de plus amples informations, veuillez consulter Codes d'erreur FAQs et d'intégrité du cluster avec chemins de résolution.

Surveillance du plan de contrôle

L'onglet Surveillance du plan de contrôle est divisé en trois sections, chacune d'entre elles vous permettant de surveiller et de dépanner le plan de contrôle de votre cluster.

Métriques

La section Métriques présente des graphiques de plusieurs métriques collectées pour différents composants du plan de contrôle. Cette fonctionnalité spécifique n'est disponible que pour les nouveaux clusters et les clusters précédents dotés d'une version de plate-forme identique ou ultérieure par rapport au tableau suivant.

Version de Kubernetes	Version de la plateforme
`1.31`	`eks.12`
`1.30`	`eks.20`
`1.29`	`eks.23`
`1.28`	`eks.29`

Vous pouvez définir la période utilisée par l'axe X de chaque graphique en effectuant des sélections en haut de la section. Vous pouvez actualiser les données à l'aide du bouton d'actualisation (↻). Pour chaque graphique distinct, le bouton représentant des ellipses verticales (1) ouvre un menu contenant les options de CloudWatch.

Ces métriques et bien d'autres sont automatiquement disponibles CloudWatch sous forme de métriques de surveillance de base dans l'espace de AWS/EKS noms. Pour plus d'informations, consultez les sections Surveillance de base et surveillance détaillée dans le guide de CloudWatch l'utilisateur Amazon. Pour obtenir des statistiques, des visualisations et des informations plus détaillées, consultez Container Insights dans le guide de CloudWatch l'utilisateur Amazon. Ou si tu préfères Prometheus surveillance basée, voirSurveillez les indicateurs de votre cluster avec Prometheus.

Le tableau suivant décrit les mesures disponibles.

Métrique	Description
Demandes de APIServer	Les demandes par minute adressées au API serveur.
APIServerNombre total de demandes 4XX	Nombre de demandes de API serveur par minute contenant HTTP 4XX codes de réponse (erreurs côté client).
APIServerNombre total de demandes 5XX	Nombre de requêtes API serveur contenant HTTP 5XX codes de réponse par minute (erreurs côté serveur).
APIServerNombre total de demandes 429	Nombre de demandes de API serveur par minute contenant HTTP 429 codes de réponse (trop de demandes).
Taille de stockage	Taille de la base de données de stockage (`etcd`).
Tentatives du planificateur	Nombre de tentatives de planification des modules en fonction des résultats « non planifiables », « erreurs » et « planifiées ».
Pods en attente	Nombre de modules en attente par type de file d'attente : « actif », « en attente », « non planifiable » et « fermé ».
APIlatence des demandes du serveur	La latence des requêtes API du serveur.
APIdemandes de vol en cours du serveur	Les demandes en cours de vol pour le API serveur.
Demandes de webhook	Les demandes de webhook par minute.
Refus de demandes de webhook	Nombre de demandes de webhook rejetées.
Latence des requêtes Webhook P99	99e percentile de latence des demandes de webhook externes provenant de tiers.

CloudWatch Informations sur les journaux

La section CloudWatch Log Insights affiche différentes listes basées sur les journaux d'audit du plan de contrôle. Les journaux du plan EKS de contrôle Amazon doivent être activés pour utiliser cette fonctionnalité, ce que vous pouvez faire dans la section Afficher les journaux du plan de contrôle dans la CloudWatch section Afficher les journaux du plan de contrôle.

Lorsque suffisamment de temps s'est écoulé pour collecter les données, vous pouvez exécuter toutes les requêtes ou choisir Exécuter la requête pour une seule liste à la fois. Un coût supplémentaire sera facturé CloudWatch chaque fois que vous lancerez des requêtes. Choisissez la période des résultats que vous souhaitez afficher en haut de la section. Si vous souhaitez un contrôle plus avancé pour n'importe quelle requête, vous pouvez choisir Afficher dans CloudWatch. Cela vous permettra de mettre à jour une requête CloudWatch en fonction de vos besoins.

Pour plus d'informations, consultez Analyser les données des CloudWatch journaux avec Logs Insights dans le guide de l'utilisateur Amazon CloudWatch Logs.

Afficher les connexions au plan de contrôle CloudWatch

Choisissez Gérer la journalisation pour mettre à jour les types de journaux disponibles. Plusieurs minutes sont nécessaires pour que les journaux apparaissent dans CloudWatch les journaux une fois que vous avez activé la journalisation. Lorsque suffisamment de temps s'est écoulé, cliquez sur l'un des liens Afficher de cette section pour accéder au journal correspondant.

Pour de plus amples informations, veuillez consulter Envoyer les journaux du plan de contrôle à CloudWatch Logs.

Informations sur le cluster

Le tableau Upgrade Insights met en évidence les problèmes et recommande des mesures correctives, accélérant ainsi le processus de validation pour la mise à niveau vers les nouvelles versions de Kubernetes. Amazon analyse EKS automatiquement les clusters en fonction d'une liste de problèmes potentiels liés à la mise à niveau de la version de Kubernetes. Le tableau Upgrade Insights répertorie les vérifications d'informations effectuées par Amazon par EKS rapport à ce cluster, ainsi que leurs statuts associés.

Amazon EKS tient à jour et actualise régulièrement la liste des vérifications d'informations à effectuer sur la base des évaluations des modifications apportées au projet Kubernetes ainsi que des modifications des EKS services Amazon liées aux nouvelles versions. La EKS console Amazon actualise automatiquement le statut de chaque information, qui est visible dans la colonne relative à l'heure de dernière actualisation.

Pour de plus amples informations, veuillez consulter Préparez-vous pour Kubernetes mises à niveau de version avec informations sur le cluster.

Problèmes de santé des nœuds

L'agent de surveillance des EKS nœuds Amazon lit automatiquement les journaux des nœuds pour détecter les problèmes de santé. Quel que soit le paramètre de réparation automatique, tous les problèmes de santé du nœud sont signalés afin que vous puissiez les examiner si nécessaire. Si un type de problème est répertorié sans description, vous pouvez lire la description dans son élément contextuel.

Lorsque vous actualisez la page, tous les problèmes résolus disparaissent de la liste. Si la réparation auto est activée, vous pourriez voir temporairement certains problèmes de santé qui seront résolus sans action de votre part. Les problèmes qui ne sont pas pris en charge par la réparation auto peuvent nécessiter une action manuelle de votre part, selon le type.

Pour que les problèmes de santé des nœuds soient signalés, votre cluster doit utiliser le mode Amazon EKS Auto ou disposer du module complémentaire d'agent de surveillance des nœuds. Pour de plus amples informations, veuillez consulter Activez la réparation automatique des nœuds et étudiez les problèmes de santé des nœuds.

📝 Modifiez cette page sur GitHub

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

Surveiller les clusters

Métriques Prometheus