Mesures collectées par l' CloudWatch agent sur les instances Windows Server Métriques collectées par l' CloudWatch agent sur les instances Linux et macOS Définitions des métriques de mémoire

Métriques collectées par l' CloudWatch agent

Vous pouvez collecter des métriques auprès des serveurs en installant l' CloudWatch agent sur le serveur. Vous pouvez installer l'agent à la fois sur les EC2 instances Amazon et sur les serveurs locaux. Vous pouvez également installer l'agent sur des ordinateurs exécutant Linux, Windows Server ou macOS. Si vous installez l'agent sur une EC2 instance Amazon, les métriques collectées par l'agent s'ajoutent aux métriques activées par défaut sur les EC2 instances Amazon. Pour plus d'informations sur l'installation de l' CloudWatch agent sur une instance, consultezCollectez des métriques, des journaux et des traces avec l' CloudWatch agent. Vous pouvez utiliser cette section pour en savoir plus sur les métriques collectées par l' CloudWatch agent.

Mesures collectées par l' CloudWatch agent sur les instances Windows Server

Sur un serveur exécutant Windows Server, l'installation de l' CloudWatch agent vous permet de collecter les métriques associées aux compteurs dans Windows Performance Monitor. Les noms des CloudWatch métriques de ces compteurs sont créés en insérant un espace entre le nom de l'objet et le nom du compteur. Par exemple, le compteur % Interrupt Time de l'objet Processor reçoit le nom de la métrique Processor % Interrupt Time dans CloudWatch. Pour plus d'informations sur les compteurs Windows Performance Monitor, consultez la documentation Microsoft Windows Server.

L'espace de noms par défaut pour les métriques collectées par l' CloudWatch agent estCWAgent, bien que vous puissiez spécifier un espace de noms différent lorsque vous configurez l'agent.

Métriques collectées par l' CloudWatchagent sur les instances Linux et macOS

Le tableau suivant répertorie les mesures que vous pouvez collecter avec l' CloudWatch agent sur les serveurs Linux et les ordinateurs macOS.

Métrique	Description
`cpu_time_active`	Durée pendant laquelle l'UC est active dans n'importe quelle capacité. Cette métrique est présentée en centièmes de seconde. Unité : aucune
`cpu_time_guest`	Durée pendant laquelle l'UC exécute une UC virtuelle pour un système d'exploitation invité. Cette métrique est présentée en centièmes de seconde. Unité : aucune
`cpu_time_guest_nice`	Durée pendant laquelle l'UC exécute une UC virtuelle pour un système d'exploitation invité ayant une priorité faible et qui peut être interrompu par d'autres processus. Cette métrique est présentée en centièmes de seconde. Unité : aucune
`cpu_time_idle`	Durée pendant laquelle l'UC est inactive. Cette métrique est présentée en centièmes de seconde. Unité : aucune
`cpu_time_iowait`	Durée pendant laquelle l'UC est en attente d'exécution d'opérations d'I/O. Cette métrique est présentée en centièmes de seconde. Unité : aucune
`cpu_time_irq`	Durée pendant laquelle l'UC prend en charge des interruptions. Cette métrique est présentée en centièmes de seconde. Unité : aucune
`cpu_time_nice`	Durée pendant laquelle l'UC est en mode utilisateur avec des processus à faible priorité pouvant facilement être interrompus par des processus à priorité élevée. Cette métrique est présentée en centièmes de seconde. Unité : aucune
`cpu_time_softirq`	Durée pendant laquelle l'UC prend en charge des interruptions logicielles. Cette métrique est présentée en centièmes de seconde. Unité : aucune
`cpu_time_steal`	Durée pendant laquelle l'UC subit un vol de temps, c'est-à-dire qu'elle se consacre à d'autres systèmes d'exploitation dans un environnement virtualisé. Cette métrique est présentée en centièmes de seconde. Unité : aucune
`cpu_time_system`	Durée pendant laquelle l'UC est en mode système. Cette métrique est présentée en centièmes de seconde. Unité : aucune
`cpu_time_user`	Durée pendant laquelle l'UC est en mode utilisateur. Cette métrique est présentée en centièmes de seconde. Unité : aucune
`cpu_usage_active`	Durée, en pourcentage, pendant laquelle l'UC est active dans n'importe quelle capacité. Unité : pourcentage
`cpu_usage_guest`	Pourcentage du temps pendant lequel l'UC exécute une UC virtuelle pour un système d'exploitation invité. Unité : pourcentage
`cpu_usage_guest_nice`	Pourcentage du temps pendant lequel l'UC exécute une UC virtuelle pour un système d'exploitation invité ayant une priorité faible et qui peut être interrompu par d'autres processus. Unité : pourcentage
`cpu_usage_idle`	Pourcentage de temps durant lequel l'UC est inactive. Unité : pourcentage
`cpu_usage_iowait`	Pourcentage du temps pendant lequel l'UC est en attente d'exécution d'opérations d'I/O. Unité : pourcentage
`cpu_usage_irq`	Pourcentage du temps pendant lequel l'UC prend en charge des interruptions. Unité : pourcentage
`cpu_usage_nice`	Pourcentage du temps pendant lequel l'UC est en mode utilisateur avec des processus à faible priorité pouvant facilement être interrompus par des processus à priorité élevée. Unité : pourcentage
`cpu_usage_softirq`	Pourcentage du temps pendant lequel l'UC prend en charge des interruptions logicielles. Unité : pourcentage
`cpu_usage_steal`	Pourcentage du temps pendant lequel l'UC subit un vol de temps, c'est-à-dire qu'elle se consacre à d'autres systèmes d'exploitation dans un environnement virtualisé. Unité : pourcentage
`cpu_usage_system`	Pourcentage du temps pendant lequel l'UC est en mode système. Unité : pourcentage
`cpu_usage_user`	Pourcentage du temps pendant lequel l'UC est en mode utilisateur. Unité : pourcentage
`disk_free`	Espace libre sur les disques. Unité : octets
`disk_inodes_free`	Nombre de nœuds d'index disponibles sur le disque. Unité : nombre
`disk_inodes_total`	Nombre total de nœuds d'index réservés sur le disque. Unité : nombre
`disk_inodes_used`	Nombre de nœuds d'index utilisés sur le disque. Unité : nombre
`disk_total`	Espace total sur les disques, y compris l'espace utilisé et l'espace libre. Unité : octets
`disk_used`	Espace utilisé sur les disques. Unité : octets
`disk_used_percent`	Pourcentage d'espace disque total utilisé. Unité : pourcentage
`diskio_iops_in_progress`	Nombre de demandes d'I/O émises pour le pilote du périphérique mais qui n'ont pas encore été exécutées. Unité : nombre
`diskio_io_time`	Durée pendant laquelle le disque a eu des demandes d'I/O placées en file d'attente. Unité : millisecondes La seule statistique qui doit être utilisée pour cette métrique est `Sum`. N'utilisez pas `Average`.
`diskio_reads`	Nombre d'opérations de lecture sur disque. Unité : nombre La seule statistique qui doit être utilisée pour cette métrique est `Sum`. N'utilisez pas `Average`.
`diskio_read_bytes`	Nombre d'octets lus sur les disques. Unité : octets La seule statistique qui doit être utilisée pour cette métrique est `Sum`. N'utilisez pas `Average`.
`diskio_read_time`	Durée pendant laquelle les demandes de lecture ont attendu sur les disques. Plusieurs demandes de lecture simultanément en attente peuvent augmenter ce chiffre. Par exemple, si 5 demandes attendent toutes pendant 100 millisecondes en moyenne, 500 est indiqué. Unité : millisecondes La seule statistique qui doit être utilisée pour cette métrique est `Sum`. N'utilisez pas `Average`.
`diskio_writes`	Nombre d'opérations d'écriture sur disque. Unité : nombre La seule statistique qui doit être utilisée pour cette métrique est `Sum`. N'utilisez pas `Average`.
`diskio_write_bytes`	Nombre d'octets écrits sur les disques. Unité : octets La seule statistique qui doit être utilisée pour cette métrique est `Sum`. N'utilisez pas `Average`.
`diskio_write_time`	Durée pendant laquelle les demandes d'écriture ont attendu sur les disques. Plusieurs demandes d'écriture simultanément en attente peuvent augmenter ce chiffre. Par exemple, si 8 demandes attendent toutes pendant 1 000 millisecondes en moyenne, 8 000 est indiqué. Unité : millisecondes La seule statistique qui doit être utilisée pour cette métrique est `Sum`. N'utilisez pas `Average`.
`ethtool_bw_in_allowance_exceeded`	Le nombre de paquets mis en file d'attente et/ou abandonnés parce que la bande passante agrégée entrante a dépassé le maximum pour l'instance. Cette métrique n'est collectée que si vous l'avez répertoriée dans la `ethtool` sous-section de la `metrics_collected` section du fichier de configuration de l' CloudWatch agent. Pour de plus amples informations, veuillez consulter Récupérez des métriques des performances réseau Unité : aucune
`ethtool_bw_out_allowance_exceeded`	Nombre de paquets mis en file d'attente et/ou ignorés parce que la bande passante agrégée sortante a dépassé le maximum de l'instance. Cette métrique n'est collectée que si vous l'avez répertoriée dans la `ethtool` sous-section de la `metrics_collected` section du fichier de configuration de l' CloudWatch agent. Pour de plus amples informations, veuillez consulter Récupérez des métriques des performances réseau Unité : aucune
`ethtool_conntrack_allowance_exceeded`	Nombre de paquets ignorés flottee que le suivi des connexions a dépassé le maximum de l’instance et que de nouvelles connexions n’ont pas pu être établies. Cela peut entraîner une perte de paquets pour le trafic vers ou en provenance de l’instance. Cette métrique n'est collectée que si vous l'avez répertoriée dans la `ethtool` sous-section de la `metrics_collected` section du fichier de configuration de l' CloudWatch agent. Pour de plus amples informations, veuillez consulter Récupérez des métriques des performances réseau Unité : aucune
`ethtool_linklocal_allowance_exceeded`	Nombre de paquets ignorés abandonné que le PPS du trafic vers les services proxy locaux a dépassé le maximum de l’interface réseau. Cela affecte le trafic vers le service DNS, le service des métadonnées d’instance et le service Amazon Time Sync. Cette métrique n'est collectée que si vous l'avez répertoriée dans la `ethtool` sous-section de la `metrics_collected` section du fichier de configuration de l' CloudWatch agent. Pour de plus amples informations, veuillez consulter Récupérez des métriques des performances réseau Unité : aucune
`ethtool_pps_allowance_exceeded`	Nombre de paquets mis en file d'attente et/ou ignorés parce que le PPS bidirectionnel a dépassé le maximum de l'instance. Cette métrique n'est collectée que si vous l'avez répertoriée dans la `ethtool` sous-section de la `metrics_collected` section du fichier de configuration de l' CloudWatch agent. Pour de plus amples informations, veuillez consulter Récupérez des métriques des performances réseau. Unité : aucune
`mem_active`	Quantité de mémoire utilisée d'une manière ou d'une autre pendant la dernière période d'échantillonnage. Unité : octets
`mem_available`	Quantité de mémoire disponible et qui peut être attribuée instantanément aux processus. Unité : octets
`mem_available_percent`	Pourcentage de mémoire disponible et qui peut être attribuée instantanément aux processus. Unité : pourcentage
`mem_buffered`	Quantité de mémoire en cours d'utilisation pour les tampons. Unité : octets
`mem_cached`	Quantité de mémoire en cours d'utilisation pour les caches de fichier. Unité : octets
`mem_free`	Quantité de mémoire qui n'est pas en cours d'utilisation. Unité : octets
`mem_inactive`	Quantité de mémoire non utilisée d'une manière ou d'une autre pendant la dernière période d'échantillonnage Unité : octets
`mem_total`	Quantité totale de mémoire. Unité : octets
`mem_used`	Quantité de mémoire actuellement en cours d'utilisation. Unité : octets
`mem_used_percent`	Pourcentage de mémoire actuellement en cours d'utilisation. Unité : pourcentage
`net_bytes_recv`	Nombre d'octets reçus par l'interface réseau. Unité : octets La seule statistique qui doit être utilisée pour cette métrique est `Sum`. N'utilisez pas `Average`.
`net_bytes_sent`	Nombre d'octets envoyés par l'interface réseau. Unité : octets La seule statistique qui doit être utilisée pour cette métrique est `Sum`. N'utilisez pas `Average`.
`net_drop_in`	Nombre de paquets reçus par cette interface réseau qui ont été abandonnés. Unité : nombre La seule statistique qui doit être utilisée pour cette métrique est `Sum`. N'utilisez pas `Average`.
`net_drop_out`	Nombre de paquets transmis par cette interface réseau qui ont été abandonnés. Unité : nombre La seule statistique qui doit être utilisée pour cette métrique est `Sum`. N'utilisez pas `Average`.
`net_err_in`	Nombre d'erreurs de réception détectées par cette interface réseau. Unité : nombre La seule statistique qui doit être utilisée pour cette métrique est `Sum`. N'utilisez pas `Average`.
`net_err_out`	Nombre d'erreurs de transmission détectées par cette interface réseau. Unité : nombre La seule statistique qui doit être utilisée pour cette métrique est `Sum`. N'utilisez pas `Average`.
`net_packets_sent`	Nombre de paquets envoyés par cette interface réseau. Unité : nombre La seule statistique qui doit être utilisée pour cette métrique est `Sum`. N'utilisez pas `Average`.
`net_packets_recv`	Nombre de paquets reçus par cette interface réseau. Unité : nombre La seule statistique qui doit être utilisée pour cette métrique est `Sum`. N'utilisez pas `Average`.
`netstat_tcp_close`	Nombre de connexions TCP sans état. Unité : nombre
`netstat_tcp_close_wait`	Nombre de connexions TCP en attente d'une demande de mise hors service de la part du client. Unité : nombre
`netstat_tcp_closing`	Nombre de connexions TCP en attente d'une demande de mise hors service avec accusé de réception du client. Unité : nombre
`netstat_tcp_established`	Nombre de connexions TCP établies. Unité : nombre
`netstat_tcp_fin_wait1`	Nombre de connexions TCP dans l'état `FIN_WAIT1` pendant le processus de clôture d'une connexion. Unité : nombre
`netstat_tcp_fin_wait2`	Nombre de connexions TCP dans l'état `FIN_WAIT2` pendant le processus de clôture d'une connexion. Unité : nombre
`netstat_tcp_last_ack`	Nombre de connexions TCP en attente de l'envoi par le client de son accusé de réception du message de mise hors service de la connexion. Il s'agit du dernier état juste avant la clôture de la connexion. Unité : nombre
`netstat_tcp_listen`	Nombre de ports TCP actuellement à l'écoute d'une demande de connexion. Unité : nombre
`netstat_tcp_none`	Nombre de connexions TCP comportant des clients inactifs. Unité : nombre
`netstat_tcp_syn_sent`	Nombre de connexions TCP en attente d'une demande de connexion correspondante après avoir envoyé une demande de connexion. Unité : nombre
`netstat_tcp_syn_recv`	Nombre de connexions TCP en attente d'un accusé de réception de demande de connexion après avoir envoyé et reçu une demande de connexion. Unité : nombre
`netstat_tcp_time_wait`	Nombre de connexions TCP actuellement en attente de la confirmation de la réception par le client de l'accusé de réception de sa demande de mise hors service de la connexion. Unité : nombre
`netstat_udp_socket`	Nombre de connexions UDP actuelles. Unité : nombre
`processes_blocked`	Nombre de processus bloqués. Unité : nombre
`processes_dead`	Nombre de processus morts, indiqué par le code d'état `X` sous Linux. Cette métrique n'est pas collectée sur les ordinateurs macOS. Unité : nombre
`processes_idle`	Nombre de processus inactifs (en veille depuis plus de 20 secondes). Disponible uniquement sur les instances FreeBSD. Unité : nombre
`processes_paging`	Nombre de processus en cours de pagination, indiqué par le code d'état `W` sous Linux. Cette métrique n'est pas collectée sur les ordinateurs macOS. Unité : nombre
`processes_running`	Nombre de processus en cours d'exécution, indiquée par le code d'état `R` sous Linux. Unité : nombre
`processes_sleeping`	Nombre de processus en veille, indiqué par le code d'état `S` sous Linux. Unité : nombre
`processes_stopped`	Nombre de processus arrêtés, indiqué par le code d'état `T` sous Linux. Unité : nombre
`processes_total`	Nombre total de processus sur l'instance. Unité : nombre
`processes_total_threads`	Nombre total de threads composant les processus. Cette métrique n'est disponible que sur les instances Linux. Cette métrique n'est pas collectée sur les ordinateurs macOS. Unité : nombre
`processes_wait`	Nombre de processus en cours de pagination, indiqué par le code d'état `W` sur les instances FreeBSD. Cette métrique est disponible uniquement sur les instances FreeBSD et n'est pas disponible sur les instances Linux, Windows Server ou macOS. Unité : nombre
`processes_zombies`	Nombre de processus zombies, indiqué par le code d'état `Z` sous Linux. Unité : nombre
`swap_free`	Quantité d'espace d'échange qui n'est pas en cours d'utilisation. Unité : octets
`swap_used`	Quantité d'espace d'échange actuellement en cours d'utilisation. Unité : octets
`swap_used_percent`	Pourcentage d'espace d'échange actuellement en cours d'utilisation. Unité : pourcentage

Définitions des métriques de mémoire collectées par l' CloudWatch agent

Lorsque l' CloudWatch agent collecte des métriques de mémoire, la source est le sous-système de gestion de la mémoire de l'hôte. Par exemple, le noyau Linux expose les données conservées par le système d'exploitation dans /proc. Pour ce qui est de la mémoire, les données sont dans /proc/meminfo.

Chaque système d'exploitation et chaque architecture utilisent des calculs différents des ressources utilisées par les processus. Pour plus d’informations, consultez les sections suivantes.

Au cours de chaque intervalle de collecte, l' CloudWatch agent de chaque instance collecte les ressources de l'instance et calcule les ressources utilisées par tous les processus exécutés dans cette instance. Ces informations sont reproduites dans les CloudWatch métriques. Vous pouvez configurer la durée de l'intervalle de collecte dans le fichier de configuration de l' CloudWatch agent. Pour de plus amples informations, veuillez consulter CloudWatch fichier de configuration de l'agent : section Agent.

La liste suivante explique comment sont définies les métriques de mémoire collectées par l' CloudWatch agent.

Mémoire active : mémoire utilisée par un processus. En d'autres termes, la mémoire utilisée par des applications en cours d'exécution.
Mémoire disponible : mémoire qui peut être instantanément attribuée aux processus sans que le système soit remplacé (également appelée mémoire virtuelle).
Mémoire tampon : zone de données partagée par des périphériques matériels ou des processus de programme qui fonctionnent à des vitesses et à des priorités différentes.
Mémoire mise en cache : stocke les instructions et les données du programme qui sont utilisées à plusieurs reprises dans le cadre des programmes dont le processeur est susceptible d'avoir besoin par la suite.
Mémoire libre : mémoire qui n'est pas du tout utilisée et qui est facilement disponible. L'utilisation du système est totalement gratuite en cas de besoin.
Mémoire inactive : pages qui n'ont pas été consultées « récemment ».
Mémoire totale : taille de la mémoire vive physique.
Mémoire utilisée : mémoire actuellement utilisée par les programmes et les processus.

Rubriques

Linux : métriques collectées et calculs utilisés
macOS : métriques collectées et calculs utilisés
Windows : métriques collectées
Exemple : calcul des métriques de mémoire sous Linux

Linux : métriques collectées et calculs utilisés

Métriques collectées et unités :

Active (octets)
Disponible (octets)
Pourcentage disponible (pourcentage)
Mise en tampon (octets)
Mise en cache (octets)
Gratuite (octets)
Inactive (octets)
Totale (octets)
Utilisée (octets)
Pourcentage utilisé (pourcentage)

Mémoire utilisée = Mémoire totale - Mémoire libre - Mémoire en cache - Mémoire tampon

Mémoire totale = Mémoire utilisée + Mémoire libre + Mémoire en cache + Mémoire tampon

macOS : métriques collectées et calculs utilisés

Métriques collectées et unités :

Active (octets)
Disponible (octets)
Pourcentage disponible (pourcentage)
Gratuite (octets)
Inactive (octets)
Totale (octets)
Utilisée (octets)
Pourcentage utilisé (pourcentage)

Mémoire disponible = Mémoire libre + Mémoire inactive

Mémoire utilisée = Mémoire totale - Mémoire disponible

Mémoire totale = Mémoire disponible + Mémoire utilisée

Windows : métriques collectées

Les métriques collectées sur les hôtes Windows sont répertoriées ci-dessous. Toutes ces métriques ont None pour Unit.

Disponible (octets)
Défauts de cache/sec
Défauts de page/sec
Pages/sec

Aucun calcul n'est utilisé pour les métriques Windows car l' CloudWatch agent analyse les événements à partir des compteurs de performance.

Exemple : calcul des métriques de mémoire sous Linux

Par exemple, supposons que la saisie de la commande cat /proc/meminfo sur un hôte Linux donne les résultats suivants :


MemTotal:       3824388 kB
MemFree:         462704 kB
MemAvailable:   2157328 kB
Buffers:         126268 kB
Cached:         1560520 kB
SReclaimable:    289080 kB>

Dans cet exemple, l' CloudWatch agent collectera les valeurs suivantes. Toutes les valeurs que l' CloudWatch agent collecte et rapporte sont exprimées en octets.

mem_total : 3 916 173 312 octets
mem_available: 2209103872 octets (+ en cache) MemFree
mem_free : 473 808 896 octets
mem_cached : 1 893 990 400 octets (cached + SReclaimable)
mem_used : 1 419 075 584 octets (MemTotal – (MemFree + Buffers + (Cached + SReclaimable)))
mem_buffered : 129 667 072 octets
mem_available_percent : 56,41 %
mem_used_percent : 36,24 % (mem_used / mem_total) * 100

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

Installez l' CloudWatch agent avec le module complémentaire Amazon CloudWatch Observability EKS ou le graphique Helm

Utilisation de l' CloudWatch agent avec la télémétrie associée