Métriques collectées par l' CloudWatchagent - Amazon CloudWatch

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Métriques collectées par l' CloudWatchagent

Vous pouvez collecter des métriques auprès des serveurs en installant l' CloudWatch agent sur le serveur. Vous pouvez installer l'agent sur les deux instances Amazon EC2 et les serveurs locaux, ainsi que sur les ordinateurs exécutant Linux, Windows Server ou macOS. Si vous installez l'agent sur une instance Amazon EC2, les métriques collectées s'ajoutent aux métriques activées par défaut sur les instances Amazon EC2.

Pour plus d'informations sur l'installation de l' CloudWatch agent sur une instance, consultezCollectez des métriques, des journaux et des traces avec l' CloudWatch agent.

Toutes les métriques abordées dans cette section sont collectées directement par l' CloudWatch agent.

Mesures collectées par l' CloudWatchagent sur les instances Windows Server

Sur un serveur exécutant Windows Server, l'installation de l' CloudWatch agent vous permet de collecter les métriques associées aux compteurs dans Windows Performance Monitor. Les noms des CloudWatch métriques de ces compteurs sont créés en plaçant un espace entre le nom de l'objet et le nom du compteur. Par exemple, le nom de la métrique est attribué au % Interrupt Time compteur de l'Processorobjet Processor % Interrupt Time dans CloudWatch. Pour plus d'informations sur les compteurs Windows Performance Monitor, consultez la documentation Microsoft Windows Server.

L'espace de noms par défaut pour les métriques collectées par l' CloudWatch agent estCWAgent, bien que vous puissiez spécifier un espace de noms différent lorsque vous configurez l'agent.

Métriques collectées par l' CloudWatchagent sur les instances Linux et macOS

Le tableau suivant répertorie les mesures que vous pouvez collecter avec l' CloudWatch agent sur les serveurs Linux et les ordinateurs macOS.

Métrique Description

cpu_time_active

Durée pendant laquelle l'UC est active dans n'importe quelle capacité. Cette métrique est présentée en centièmes de seconde.

Unité : aucune

cpu_time_guest

Durée pendant laquelle l'UC exécute une UC virtuelle pour un système d'exploitation invité. Cette métrique est présentée en centièmes de seconde.

Unité : aucune

cpu_time_guest_nice

Durée pendant laquelle l'UC exécute une UC virtuelle pour un système d'exploitation invité ayant une priorité faible et qui peut être interrompu par d'autres processus. Cette métrique est présentée en centièmes de seconde.

Unité : aucune

cpu_time_idle

Durée pendant laquelle l'UC est inactive. Cette métrique est présentée en centièmes de seconde.

Unité : aucune

cpu_time_iowait

Durée pendant laquelle l'UC est en attente d'exécution d'opérations d'I/O. Cette métrique est présentée en centièmes de seconde.

Unité : aucune

cpu_time_irq

Durée pendant laquelle l'UC prend en charge des interruptions. Cette métrique est présentée en centièmes de seconde.

Unité : aucune

cpu_time_nice

Durée pendant laquelle l'UC est en mode utilisateur avec des processus à faible priorité pouvant facilement être interrompus par des processus à priorité élevée. Cette métrique est présentée en centièmes de seconde.

Unité : aucune

cpu_time_softirq

Durée pendant laquelle l'UC prend en charge des interruptions logicielles. Cette métrique est présentée en centièmes de seconde.

Unité : aucune

cpu_time_steal

Durée pendant laquelle l'UC subit un vol de temps, c'est-à-dire qu'elle se consacre à d'autres systèmes d'exploitation dans un environnement virtualisé. Cette métrique est présentée en centièmes de seconde.

Unité : aucune

cpu_time_system

Durée pendant laquelle l'UC est en mode système. Cette métrique est présentée en centièmes de seconde.

Unité : aucune

cpu_time_user

Durée pendant laquelle l'UC est en mode utilisateur. Cette métrique est présentée en centièmes de seconde.

Unité : aucune

cpu_usage_active

Durée, en pourcentage, pendant laquelle l'UC est active dans n'importe quelle capacité.

Unité : pourcentage

cpu_usage_guest

Pourcentage du temps pendant lequel l'UC exécute une UC virtuelle pour un système d'exploitation invité.

Unité : pourcentage

cpu_usage_guest_nice

Pourcentage du temps pendant lequel l'UC exécute une UC virtuelle pour un système d'exploitation invité ayant une priorité faible et qui peut être interrompu par d'autres processus.

Unité : pourcentage

cpu_usage_idle

Pourcentage de temps durant lequel l'UC est inactive.

Unité : pourcentage

cpu_usage_iowait

Pourcentage du temps pendant lequel l'UC est en attente d'exécution d'opérations d'I/O.

Unité : pourcentage

cpu_usage_irq

Pourcentage du temps pendant lequel l'UC prend en charge des interruptions.

Unité : pourcentage

cpu_usage_nice

Pourcentage du temps pendant lequel l'UC est en mode utilisateur avec des processus à faible priorité pouvant facilement être interrompus par des processus à priorité élevée.

Unité : pourcentage

cpu_usage_softirq

Pourcentage du temps pendant lequel l'UC prend en charge des interruptions logicielles.

Unité : pourcentage

cpu_usage_steal

Pourcentage du temps pendant lequel l'UC subit un vol de temps, c'est-à-dire qu'elle se consacre à d'autres systèmes d'exploitation dans un environnement virtualisé.

Unité : pourcentage

cpu_usage_system

Pourcentage du temps pendant lequel l'UC est en mode système.

Unité : pourcentage

cpu_usage_user

Pourcentage du temps pendant lequel l'UC est en mode utilisateur.

Unité : pourcentage

disk_free

Espace libre sur les disques.

Unité : octets

disk_inodes_free

Nombre de nœuds d'index disponibles sur le disque.

Unité : nombre

disk_inodes_total

Nombre total de nœuds d'index réservés sur le disque.

Unité : nombre

disk_inodes_used

Nombre de nœuds d'index utilisés sur le disque.

Unité : nombre

disk_total

Espace total sur les disques, y compris l'espace utilisé et l'espace libre.

Unité : octets

disk_used

Espace utilisé sur les disques.

Unité : octets

disk_used_percent

Pourcentage d'espace disque total utilisé.

Unité : pourcentage

diskio_iops_in_progress

Nombre de demandes d'I/O émises pour le pilote du périphérique mais qui n'ont pas encore été exécutées.

Unité : nombre

diskio_io_time

Durée pendant laquelle le disque a eu des demandes d'I/O placées en file d'attente.

Unité : millisecondes

La seule statistique qui doit être utilisée pour cette métrique est Sum. N'utilisez pas  Average.

diskio_reads

Nombre d'opérations de lecture sur disque.

Unité : nombre

La seule statistique qui doit être utilisée pour cette métrique est Sum. N'utilisez pas  Average.

diskio_read_bytes

Nombre d'octets lus sur les disques.

Unité : octets

La seule statistique qui doit être utilisée pour cette métrique est Sum. N'utilisez pas  Average.

diskio_read_time

Durée pendant laquelle les demandes de lecture ont attendu sur les disques. Plusieurs demandes de lecture simultanément en attente peuvent augmenter ce chiffre. Par exemple, si 5 demandes attendent toutes pendant 100 millisecondes en moyenne, 500 est indiqué.

Unité : millisecondes

La seule statistique qui doit être utilisée pour cette métrique est Sum. N'utilisez pas  Average.

diskio_writes

Nombre d'opérations d'écriture sur disque.

Unité : nombre

La seule statistique qui doit être utilisée pour cette métrique est Sum. N'utilisez pas  Average.

diskio_write_bytes

Nombre d'octets écrits sur les disques.

Unité : octets

La seule statistique qui doit être utilisée pour cette métrique est Sum. N'utilisez pas  Average.

diskio_write_time

Durée pendant laquelle les demandes d'écriture ont attendu sur les disques. Plusieurs demandes d'écriture simultanément en attente peuvent augmenter ce chiffre. Par exemple, si 8 demandes attendent toutes pendant 1 000 millisecondes en moyenne, 8 000 est indiqué.

Unité : millisecondes

La seule statistique qui doit être utilisée pour cette métrique est Sum. N'utilisez pas  Average.

ethtool_bw_in_allowance_exceeded

Nombre de paquets mis en file d'attente et/ou ignorés parce que la bande passante agrégée entrante a dépassé le maximum de l'instance.

Cette métrique n'est collectée que si vous l'avez répertoriée dans la ethtool sous-section de la metrics_collected section du fichier de configuration de l' CloudWatch agent. Pour de plus amples informations, veuillez consulter Récupérez des métriques des performances réseau

Unité : aucune

ethtool_bw_out_allowance_exceeded

Nombre de paquets mis en file d'attente ou ignorés parce que la bande passante agrégée sortante a dépassé le maximum de l'instance.

Cette métrique n'est collectée que si vous l'avez répertoriée dans la ethtool sous-section de la metrics_collected section du fichier de configuration de l' CloudWatch agent. Pour de plus amples informations, veuillez consulter Récupérez des métriques des performances réseau

Unité : aucune

ethtool_conntrack_allowance_exceeded

Nombre de paquets ignorés flottee que le suivi des connexions a dépassé le maximum de l’instance et que de nouvelles connexions n’ont pas pu être établies. Cela peut entraîner une perte de paquets pour le trafic vers ou en provenance de l’instance.

Cette métrique n'est collectée que si vous l'avez répertoriée dans la ethtool sous-section de la metrics_collected section du fichier de configuration de l' CloudWatch agent. Pour de plus amples informations, veuillez consulter Récupérez des métriques des performances réseau

Unité : aucune

ethtool_linklocal_allowance_exceeded

Nombre de paquets ignorés abandonné que le PPS du trafic vers les services proxy locaux a dépassé le maximum de l’interface réseau. Cela affecte le trafic vers le service DNS, le service des métadonnées d’instance et le service Amazon Time Sync.

Cette métrique n'est collectée que si vous l'avez répertoriée dans la ethtool sous-section de la metrics_collected section du fichier de configuration de l' CloudWatch agent. Pour de plus amples informations, veuillez consulter Récupérez des métriques des performances réseau

Unité : aucune

ethtool_pps_allowance_exceeded

Nombre de paquets mis en file d'attente et/ou ignorés parce que le PPS bidirectionnel a dépassé le maximum de l'instance.

Cette métrique n'est collectée que si vous l'avez répertoriée dans la ethtool sous-section de la metrics_collected section du fichier de configuration de l' CloudWatch agent. Pour plus d’informations, consultez Récupérez des métriques des performances réseau.

Unité : aucune

mem_active

Quantité de mémoire utilisée d'une manière ou d'une autre pendant la dernière période d'échantillonnage.

Unité : octets

mem_available

Quantité de mémoire disponible et qui peut être attribuée instantanément aux processus.

Unité : octets

mem_available_percent

Pourcentage de mémoire disponible et qui peut être attribuée instantanément aux processus.

Unité : pourcentage

mem_buffered

Quantité de mémoire en cours d'utilisation pour les tampons.

Unité : octets

mem_cached

Quantité de mémoire en cours d'utilisation pour les caches de fichier.

Unité : octets

mem_free

Quantité de mémoire qui n'est pas en cours d'utilisation.

Unité : octets

mem_inactive

Quantité de mémoire non utilisée d'une manière ou d'une autre pendant la dernière période d'échantillonnage

Unité : octets

mem_total

Quantité totale de mémoire.

Unité : octets

mem_used

Quantité de mémoire actuellement en cours d'utilisation.

Unité : octets

mem_used_percent

Pourcentage de mémoire actuellement en cours d'utilisation.

Unité : pourcentage

net_bytes_recv

Nombre d'octets reçus par l'interface réseau.

Unité : octets

La seule statistique qui doit être utilisée pour cette métrique est Sum. N'utilisez pas  Average.

net_bytes_sent

Nombre d'octets envoyés par l'interface réseau.

Unité : octets

La seule statistique qui doit être utilisée pour cette métrique est Sum. N'utilisez pas  Average.

net_drop_in

Nombre de paquets reçus par cette interface réseau qui ont été abandonnés.

Unité : nombre

La seule statistique qui doit être utilisée pour cette métrique est Sum. N'utilisez pas  Average.

net_drop_out

Nombre de paquets transmis par cette interface réseau qui ont été abandonnés.

Unité : nombre

La seule statistique qui doit être utilisée pour cette métrique est Sum. N'utilisez pas  Average.

net_err_in

Nombre d'erreurs de réception détectées par cette interface réseau.

Unité : nombre

La seule statistique qui doit être utilisée pour cette métrique est Sum. N'utilisez pas  Average.

net_err_out

Nombre d'erreurs de transmission détectées par cette interface réseau.

Unité : nombre

La seule statistique qui doit être utilisée pour cette métrique est Sum. N'utilisez pas  Average.

net_packets_sent

Nombre de paquets envoyés par cette interface réseau.

Unité : nombre

La seule statistique qui doit être utilisée pour cette métrique est Sum. N'utilisez pas  Average.

net_packets_recv

Nombre de paquets reçus par cette interface réseau.

Unité : nombre

La seule statistique qui doit être utilisée pour cette métrique est Sum. N'utilisez pas  Average.

netstat_tcp_close

Nombre de connexions TCP sans état.

Unité : nombre

netstat_tcp_close_wait

Nombre de connexions TCP en attente d'une demande de mise hors service de la part du client.

Unité : nombre

netstat_tcp_closing

Nombre de connexions TCP en attente d'une demande de mise hors service avec accusé de réception du client.

Unité : nombre

netstat_tcp_established

Nombre de connexions TCP établies.

Unité : nombre

netstat_tcp_fin_wait1

Nombre de connexions TCP dans l'état FIN_WAIT1 pendant le processus de clôture d'une connexion.

Unité : nombre

netstat_tcp_fin_wait2

Nombre de connexions TCP dans l'état FIN_WAIT2 pendant le processus de clôture d'une connexion.

Unité : nombre

netstat_tcp_last_ack

Nombre de connexions TCP en attente de l'envoi par le client de son accusé de réception du message de mise hors service de la connexion. Il s'agit du dernier état juste avant la clôture de la connexion.

Unité : nombre

netstat_tcp_listen

Nombre de ports TCP actuellement à l'écoute d'une demande de connexion.

Unité : nombre

netstat_tcp_none

Nombre de connexions TCP comportant des clients inactifs.

Unité : nombre

netstat_tcp_syn_sent

Nombre de connexions TCP en attente d'une demande de connexion correspondante après avoir envoyé une demande de connexion.

Unité : nombre

netstat_tcp_syn_recv

Nombre de connexions TCP en attente d'un accusé de réception de demande de connexion après avoir envoyé et reçu une demande de connexion.

Unité : nombre

netstat_tcp_time_wait

Nombre de connexions TCP actuellement en attente de la confirmation de la réception par le client de l'accusé de réception de sa demande de mise hors service de la connexion.

Unité : nombre

netstat_udp_socket

Nombre de connexions UDP actuelles.

Unité : nombre

processes_blocked

Nombre de processus bloqués.

Unité : nombre

processes_dead

Nombre de processus morts, indiqué par le code d'état X sous Linux.

Cette métrique n'est pas collectée sur les ordinateurs macOS.

Unité : nombre

processes_idle

Nombre de processus inactifs (en veille depuis plus de 20 secondes). Disponible uniquement sur les instances FreeBSD.

Unité : nombre

processes_paging

Nombre de processus en cours de pagination, indiqué par le code d'état W sous Linux.

Cette métrique n'est pas collectée sur les ordinateurs macOS.

Unité : nombre

processes_running

Nombre de processus en cours d'exécution, indiquée par le code d'état R sous Linux.

Unité : nombre

processes_sleeping

Nombre de processus en veille, indiqué par le code d'état S sous Linux.

Unité : nombre

processes_stopped

Nombre de processus arrêtés, indiqué par le code d'état T sous Linux.

Unité : nombre

processes_total

Nombre total de processus sur l'instance.

Unité : nombre

processes_total_threads

Nombre total de threads composant les processus. Cette métrique n'est disponible que sur les instances Linux.

Cette métrique n'est pas collectée sur les ordinateurs macOS.

Unité : nombre

processes_wait

Nombre de processus en cours de pagination, indiqué par le code d'état W sur les instances FreeBSD. Cette métrique est disponible uniquement sur les instances FreeBSD et n'est pas disponible sur les instances Linux, Windows Server ou macOS.

Unité : nombre

processes_zombies

Nombre de processus zombies, indiqué par le code d'état Z sous Linux.

Unité : nombre

swap_free

Quantité d'espace d'échange qui n'est pas en cours d'utilisation.

Unité : octets

swap_used

Quantité d'espace d'échange actuellement en cours d'utilisation.

Unité : octets

swap_used_percent

Pourcentage d'espace d'échange actuellement en cours d'utilisation.

Unité : pourcentage

Définitions des métriques de mémoire collectées par l' CloudWatch agent

Lorsque l' CloudWatch agent collecte des métriques de mémoire, la source est le sous-système de gestion de la mémoire de l'hôte. Par exemple, le noyau Linux expose les données conservées par le système d'exploitation dans /proc. Pour ce qui est de la mémoire, les données sont dans /proc/meminfo.

Chaque système d'exploitation et chaque architecture utilisent des calculs différents des ressources utilisées par les processus. Pour plus d'informations, consultez les sections suivantes.

Au cours de chaque intervalle de collecte, l' CloudWatch agent de chaque instance collecte les ressources de l'instance et calcule les ressources utilisées par tous les processus exécutés dans cette instance. Ces informations sont reproduites dans les CloudWatch métriques. Vous pouvez configurer la durée de l'intervalle de collecte dans le fichier de configuration de l' CloudWatch agent. Pour plus d’informations, consultez CloudWatch fichier de configuration de l'agent : section Agent.

La liste suivante explique comment sont définies les métriques de mémoire collectées par l' CloudWatch agent.

  • Mémoire active : mémoire utilisée par un processus. En d'autres termes, la mémoire utilisée par des applications en cours d'exécution.

  • Mémoire disponible : mémoire qui peut être instantanément attribuée aux processus sans que le système soit remplacé (également appelée mémoire virtuelle).

  • Mémoire tampon : zone de données partagée par des périphériques matériels ou des processus de programme qui fonctionnent à des vitesses et à des priorités différentes.

  • Mémoire mise en cache : stocke les instructions et les données du programme qui sont utilisées à plusieurs reprises dans le cadre des programmes dont le processeur est susceptible d'avoir besoin par la suite.

  • Mémoire libre : mémoire qui n'est pas du tout utilisée et qui est facilement disponible. L'utilisation du système est totalement gratuite en cas de besoin.

  • Mémoire inactive : pages qui n'ont pas été consultées « récemment ».

  • Mémoire totale : taille de la mémoire vive physique.

  • Mémoire utilisée : mémoire actuellement utilisée par les programmes et les processus.

Linux : métriques collectées et calculs utilisés

Métriques collectées et unités :

  • Active (octets)

  • Disponible (octets)

  • Pourcentage disponible (pourcentage)

  • Mise en tampon (octets)

  • Mise en cache (octets)

  • Gratuite (octets)

  • Inactive (octets)

  • Totale (octets)

  • Utilisée (octets)

  • Pourcentage utilisé (pourcentage)

Mémoire utilisée = Mémoire totale - Mémoire libre - Mémoire en cache - Mémoire tampon

Mémoire totale = Mémoire utilisée + Mémoire libre + Mémoire en cache + Mémoire tampon

macOS : métriques collectées et calculs utilisés

Métriques collectées et unités :

  • Active (octets)

  • Disponible (octets)

  • Pourcentage disponible (pourcentage)

  • Gratuite (octets)

  • Inactive (octets)

  • Totale (octets)

  • Utilisée (octets)

  • Pourcentage utilisé (pourcentage)

Mémoire disponible = Mémoire libre + Mémoire inactive

Mémoire utilisée = Mémoire totale - Mémoire disponible

Mémoire totale = Mémoire disponible + Mémoire utilisée

Windows : métriques collectées

Les métriques collectées sur les hôtes Windows sont répertoriées ci-dessous. Toutes ces métriques ont None pour Unit.

  • Disponible (octets)

  • Défauts de cache/sec

  • Défauts de page/sec

  • Pages/sec

Aucun calcul n'est utilisé pour les métriques Windows car l' CloudWatch agent analyse les événements à partir des compteurs de performance.

Exemple : calcul des métriques de mémoire sous Linux

Par exemple, supposons que la saisie de la commande cat /proc/meminfo sur un hôte Linux donne les résultats suivants :

MemTotal: 3824388 kB MemFree: 462704 kB MemAvailable: 2157328 kB Buffers: 126268 kB Cached: 1560520 kB SReclaimable: 289080 kB>

Dans cet exemple, l' CloudWatch agent collectera les valeurs suivantes. Toutes les valeurs que l' CloudWatch agent collecte et rapporte sont exprimées en octets.

  • mem_total : 3 916 173 312 octets

  • mem_available: 2209103872 octets (+ en cache) MemFree

  • mem_free : 473 808 896 octets

  • mem_cached : 1 893 990 400 octets (cachedSReclaimable)

  • mem_used : 1 419 075 584 octets (MemTotal – (MemFreeBuffers + (CachedSReclaimable)))

  • mem_buffered : 129 667 072 octets

  • mem_available_percent : 56,41 %

  • mem_used_percent : 36,24 % (mem_usedmem_total) * 100