Sélectionner vos préférences de cookies

Nous utilisons des cookies essentiels et des outils similaires qui sont nécessaires au fonctionnement de notre site et à la fourniture de nos services. Nous utilisons des cookies de performance pour collecter des statistiques anonymes afin de comprendre comment les clients utilisent notre site et d’apporter des améliorations. Les cookies essentiels ne peuvent pas être désactivés, mais vous pouvez cliquer sur « Personnaliser » ou « Refuser » pour refuser les cookies de performance.

Si vous êtes d’accord, AWS et les tiers approuvés utiliseront également des cookies pour fournir des fonctionnalités utiles au site, mémoriser vos préférences et afficher du contenu pertinent, y compris des publicités pertinentes. Pour accepter ou refuser tous les cookies non essentiels, cliquez sur « Accepter » ou « Refuser ». Pour effectuer des choix plus détaillés, cliquez sur « Personnaliser ».

Surveillez les données du cluster avec Amazon CloudWatch

Mode de mise au point
Surveillez les données du cluster avec Amazon CloudWatch - Amazon EKS

Aidez à améliorer cette page

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Pour contribuer à ce guide de l'utilisateur, cliquez sur le GitHub lien Modifier cette page sur qui se trouve dans le volet droit de chaque page.

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Aidez à améliorer cette page

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Pour contribuer à ce guide de l'utilisateur, cliquez sur le GitHub lien Modifier cette page sur qui se trouve dans le volet droit de chaque page.

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Amazon CloudWatch est un service de surveillance qui collecte des statistiques et des journaux à partir de vos ressources cloud. CloudWatch fournit gratuitement des métriques Amazon EKS de base lorsque vous utilisez un nouveau cluster de version 1.28 ou supérieure. Toutefois, lorsque vous utilisez l'opérateur CloudWatch d'observabilité en tant que module complémentaire Amazon EKS, vous pouvez bénéficier de fonctionnalités d'observabilité améliorées.

Statistiques de base sur Amazon CloudWatch

Pour les clusters de versions 1.28 Kubernetes ou supérieures, vous pouvez obtenir des métriques vendues gratuitement CloudWatch dans l'espace de noms. AWS/EKS Le tableau suivant fournit une liste des mesures de base disponibles pour les versions prises en charge. Chaque métrique répertoriée a une fréquence d'une minute.

Nom des métriques Description

scheduler_schedule_attempts_total

Nombre total de tentatives effectuées par le planificateur pour planifier des pods dans le cluster pendant une période donnée. Cette métrique permet de surveiller la charge de travail du planificateur et peut indiquer la pression de planification ou les problèmes potentiels liés au placement des pods.

Unités : Nombre

Statistiques valides : Sum

scheduler_schedule_attempts_SCHEDULED

Le nombre de tentatives réussies du planificateur pour programmer des pods vers des nœuds du cluster pendant une période donnée.

Unités : Nombre

Statistiques valides : Sum

scheduler_schedule_attempts_UNSCHEDULABLE

Le nombre de tentatives de planification de pods qui n'étaient pas planifiables pour une période donnée en raison de contraintes valides, telles que l'insuffisance du processeur ou de la mémoire sur un nœud.

Unités : Nombre

Statistiques valides : Sum

scheduler_schedule_attempts_ERROR

Le nombre de tentatives de planification de pods qui ont échoué pendant une période donnée en raison d'un problème interne lié au planificateur lui-même, tel que des problèmes de connectivité au serveur API.

Unités : Nombre

Statistiques valides : Sum

scheduler_pending_pods

Le nombre total de pods en attente à planifier par le planificateur dans le cluster pour une période donnée.

Unités : Nombre

Statistiques valides : Sum

scheduler_pending_pods_ACTIVEQ

Le nombre de pods en attente dans ActiveQ, qui attendent d'être planifiés dans le cluster pour une période donnée.

Unités : Nombre

Statistiques valides : Sum

scheduler_pending_pods_UNSCHEDULABLE

Le nombre de pods en attente que le planificateur a tenté de planifier mais qui ont échoué, et qui sont maintenus dans un état non planifiable en cas de nouvelle tentative.

Unités : Nombre

Statistiques valides : Sum

scheduler_pending_pods_BACKOFF

Le nombre de pods en attente backoffQ dans un état d'attente qui attendent l'expiration de leur période d'attente.

Unités : Nombre

Statistiques valides : Sum

scheduler_pending_pods_GATED

Le nombre de pods en attente qui attendent actuellement dans un état fermé, car ils ne peuvent pas être programmés tant qu'ils ne répondent pas aux conditions requises.

Unités : Nombre

Statistiques valides : Sum

apiserver_request_total

Le nombre de requêtes HTTP effectuées sur tous les serveurs d'API du cluster.

Unités : Nombre

Statistiques valides : Sum

apiserver_request_total_4XX

Nombre de requêtes HTTP adressées à tous les serveurs d'API du cluster qui ont généré des codes d'état 4XX (erreur client).

Unités : Nombre

Statistiques valides : Sum

apiserver_request_total_429

Nombre de requêtes HTTP adressées à tous les serveurs d'API du cluster qui ont généré un code d'429état, ce qui se produit lorsque les clients dépassent les seuils de limitation de débit.

Unités : Nombre

Statistiques valides : Sum

apiserver_request_total_5XX

Nombre de requêtes HTTP adressées à tous les serveurs d'API du cluster qui ont généré des codes d'état 5XX (erreur de serveur).

Unités : Nombre

Statistiques valides : Sum

apiserver_request_total_LIST_PODS

Le nombre de requêtes LIST Pods adressées à tous les serveurs d'API du cluster.

Unités : Nombre

Statistiques valides : Sum

apiserver_request_duration_seconds_PUT_P99

99e percentile de latence pour les PUT demandes calculé à partir de toutes les demandes sur tous les serveurs d'API du cluster. Représente le temps de réponse en dessous duquel 99 % de toutes les PUT demandes sont traitées.

Unités : secondes

Statistiques valides : moyenne

apiserver_request_duration_seconds_PATCH_P99

99e percentile de latence pour les PATCH demandes calculé à partir de toutes les demandes sur tous les serveurs d'API du cluster. Représente le temps de réponse en dessous duquel 99 % de toutes les PATCH demandes sont traitées.

Unités : secondes

Statistiques valides : moyenne

apiserver_request_duration_seconds_POST_P99

99e percentile de latence pour les POST demandes calculé à partir de toutes les demandes sur tous les serveurs d'API du cluster. Représente le temps de réponse en dessous duquel 99 % de toutes les POST demandes sont traitées.

Unités : secondes

Statistiques valides : moyenne

apiserver_request_duration_seconds_GET_P99

99e percentile de latence pour les GET demandes calculé à partir de toutes les demandes sur tous les serveurs d'API du cluster. Représente le temps de réponse en dessous duquel 99 % de toutes les GET demandes sont traitées.

Unités : secondes

Statistiques valides : moyenne

apiserver_request_duration_seconds_LIST_P99

99e percentile de latence pour les LIST demandes calculé à partir de toutes les demandes sur tous les serveurs d'API du cluster. Représente le temps de réponse en dessous duquel 99 % de toutes les LIST demandes sont traitées.

Unités : secondes

Statistiques valides : moyenne

apiserver_request_duration_seconds_DELETE_P99

99e percentile de latence pour les DELETE demandes calculé à partir de toutes les demandes sur tous les serveurs d'API du cluster. Représente le temps de réponse en dessous duquel 99 % de toutes les DELETE demandes sont traitées.

Unités : secondes

Statistiques valides : moyenne

apiserver_current_inflight_requests_MUTATING

Le nombre de demandes mutantes (POST,, PUTDELETE,PATCH) en cours de traitement sur tous les serveurs d'API du cluster. Cette métrique représente les demandes en cours de traitement dont le traitement n'est pas encore terminé.

Unités : Nombre

Statistiques valides : Sum

apiserver_current_inflight_requests_READONLY

Le nombre de demandes en lecture seule (GET,LIST) actuellement traitées sur tous les serveurs d'API du cluster. Cette métrique représente les demandes en cours de traitement dont le traitement n'est pas encore terminé.

Unités : Nombre

Statistiques valides : Sum

apiserver_admission_webhook_request_total

Le nombre de demandes de webhook d'admission effectuées sur tous les serveurs d'API du cluster.

Unités : Nombre

Statistiques valides : Sum

apiserver_admission_webhook_request_total_ADMIT

Le nombre de demandes de webhook d'admission mutantes effectuées sur tous les serveurs d'API du cluster.

Unités : Nombre

Statistiques valides : Sum

apiserver_admission_webhook_request_total_VALIDATING

Le nombre de demandes de webhook d'admission validantes effectuées sur tous les serveurs d'API du cluster.

Unités : Nombre

Statistiques valides : Sum

apiserver_admission_webhook_rejection_count

Le nombre de demandes d'admission au webhook effectuées sur tous les serveurs d'API du cluster qui ont été rejetées.

Unités : Nombre

Statistiques valides : Sum

apiserver_admission_webhook_rejection_count_ADMIT

Le nombre de demandes de webhook d'admission mutantes effectuées sur tous les serveurs d'API du cluster qui ont été rejetées.

Unités : Nombre

Statistiques valides : Sum

apiserver_admission_webhook_rejection_count_VALIDATING

Le nombre de demandes de webhook d'admission en cours de validation effectuées sur tous les serveurs d'API du cluster qui ont été rejetées.

Unités : Nombre

Statistiques valides : Sum

apiserver_admission_webhook_admission_duration_seconds

Le 99e percentile de latence pour les demandes webhook d'admission tierces est calculé à partir de toutes les demandes sur tous les serveurs d'API du cluster. Représente le temps de réponse en dessous duquel 99 % de toutes les demandes de webhook d'admission de tiers sont traitées.

Unités : secondes

Statistiques valides : moyenne

apiserver_admission_webhook_admission_duration_seconds_ADMIT_P99

Le 99e percentile de latence pour les demandes webhook d'admission mutantes tierces est calculé à partir de toutes les demandes sur tous les serveurs d'API du cluster. Représente le temps de réponse en dessous duquel 99 % de toutes les demandes de webhook d'admission mutantes tierces sont traitées.

Unités : secondes

Statistiques valides : moyenne

apiserver_admission_webhook_admission_duration_seconds_VALIDATING_P99

99e percentile de latence pour les demandes webhook d'admission validées par des tiers, calculé à partir de toutes les demandes sur tous les serveurs d'API du cluster. Représente le temps de réponse en dessous duquel 99 % de toutes les demandes de webhook d'admission validées par des tiers sont traitées.

Unités : secondes

Statistiques valides : moyenne

apiserver_storage_size_bytes

Taille physique en octets du fichier de base de données de stockage etcd utilisé par les serveurs d'API du cluster. Cette métrique représente l'espace disque réellement alloué au stockage.

Unités : octets

Statistiques valides : Maximum

Opérateur Amazon CloudWatch Observability

Amazon CloudWatch Observability collecte des journaux, des métriques et des données de suivi en temps réel. Il les envoie à Amazon CloudWatch et à AWS X-Ray. Vous pouvez installer ce module complémentaire pour activer à la fois CloudWatch Application Signals et CloudWatch Container Insights avec une observabilité améliorée pour Amazon EKS. Cela vous aide à surveiller l’état et les performances de votre infrastructure et de vos applications conteneurisées. L'opérateur Amazon CloudWatch Observability est conçu pour installer et configurer les composants nécessaires.

Amazon EKS prend en charge l'opérateur CloudWatch d'observabilité en tant que module complémentaire Amazon EKS. Le module complémentaire permet d'utiliser Container Insights sur les nœuds de travail Linux et Windows du cluster. Pour activer Container Insights sous Windows, la version du module complémentaire Amazon EKS doit être 1.5.0 ou supérieure. Actuellement, CloudWatch Application Signals n'est pas pris en charge sur Amazon EKS Windows.

Les rubriques ci-dessous décrivent comment commencer à utiliser CloudWatch Observability Operator pour votre cluster Amazon EKS.

Rubrique précédente :

Plan de contrôle
ConfidentialitéConditions d'utilisation du sitePréférences de cookies
© 2025, Amazon Web Services, Inc. ou ses affiliés. Tous droits réservés.