Métricas que el agente de CloudWatch ha recopilado - Amazon CloudWatch

Métricas que el agente de CloudWatch ha recopilado

Puede recopilar las métricas de los servidores con el agente de CloudWatch en el servidor. Puede instalar el agente en instancias de Amazon EC2 o en servidores en las instalaciones. También puede instalar el agente en equipos que ejecuten Linux, Windows Server o macOS. Si instala el agente en una instancia de Amazon EC2, las métricas que recopila el agente se suman a las métricas habilitadas de forma predeterminada en las instancias de Amazon EC2. Para obtener información acerca de la instalación del agente de CloudWatch en una instancia, consulte Recopile las métricas, registros y seguimientos con el agente de CloudWatch. Puede utilizar esta sección para obtener información sobre las métricas que recopila el agente de CloudWatch.

Métricas que el agente de CloudWatch recopila en instancias de Windows Server

En un servidor con Windows Server, la instalación del agente de CloudWatch le permite recopilar las métricas asociadas con los contadores en la supervisión de rendimiento de Windows. Los nombres de métrica de CloudWatch para estos contadores se crean con la inclusión de un espacio entre el nombre de objeto y el nombre de contador. Por ejemplo, al contador % Interrupt Time del objeto Processor se le ha asignado el nombre de métrica Processor % Interrupt Time en CloudWatch. Para obtener más información acerca de los contadores de Monitor de rendimiento de Windows, consulte la documentación de Microsoft Windows Server.

El espacio de nombres predeterminado para las métricas que el agente de CloudWatch recopila es CWAgent, aunque se puede especificar otro espacio de nombres al configurar el agente.

Métricas que el agente de CloudWatch recopila en instancias de Linux y de macOS

En la siguiente tabla se muestran las métricas que se pueden recopilar con el agente de CloudWatch en servidores Linux y en equipos macOS.

Métrica Descripción

cpu_time_active

El periodo de tiempo que la CPU está activa en cualquier capacidad. Esta métrica se mide en centésimas de segundo.

Unidad: ninguna

cpu_time_guest

El periodo de tiempo que la CPU está ejecutando una CPU virtual para un sistema operativo invitado. Esta métrica se mide en centésimas de segundo.

Unidad: ninguna

cpu_time_guest_nice

El periodo de tiempo que la CPU está ejecutando una CPU virtual para un sistema operativo invitado que es de baja prioridad y otros procesos pueden interrumpirlo. Esta métrica se mide en centésimas de segundo.

Unidad: ninguna

cpu_time_idle

El periodo de tiempo que la CPU está inactiva. Esta métrica se mide en centésimas de segundo.

Unidad: ninguna

cpu_time_iowait

El periodo de tiempo que la CPU está a la espera de que se completen las operaciones de entrada/salida. Esta métrica se mide en centésimas de segundo.

Unidad: ninguna

cpu_time_irq

El periodo de tiempo que la CPU está atendiendo interrupciones. Esta métrica se mide en centésimas de segundo.

Unidad: ninguna

cpu_time_nice

El periodo de tiempo que la CPU está en modo de usuario con procesos de baja prioridad que otros procesos de mayor prioridad pueden interrumpir fácilmente. Esta métrica se mide en centésimas de segundo.

Unidad: ninguna

cpu_time_softirq

El periodo de tiempo que la CPU está atendiendo interrupciones de software. Esta métrica se mide en centésimas de segundo.

Unidad: ninguna

cpu_time_steal

El periodo de tiempo que la CPU se encuentra en tiempo descartado, que es el tiempo empleado en otros sistemas operativos en un entorno virtualizado. Esta métrica se mide en centésimas de segundo.

Unidad: ninguna

cpu_time_system

El periodo de tiempo que la CPU está en modo de sistema. Esta métrica se mide en centésimas de segundo.

Unidad: ninguna

cpu_time_user

El periodo de tiempo que la CPU está en modo de usuario. Esta métrica se mide en centésimas de segundo.

Unidad: ninguna

cpu_usage_active

El porcentaje de tiempo que la CPU está activa en cualquier capacidad.

Unidad: porcentaje

cpu_usage_guest

El porcentaje de tiempo que la CPU está ejecutando una CPU virtual para un sistema operativo invitado.

Unidad: porcentaje

cpu_usage_guest_nice

El porcentaje de tiempo que la CPU está ejecutando una CPU virtual para un sistema operativo invitado que es de baja prioridad y otros procesos pueden interrumpirlo.

Unidad: porcentaje

cpu_usage_idle

El porcentaje de tiempo que la CPU está inactiva.

Unidad: porcentaje

cpu_usage_iowait

El porcentaje de tiempo que la CPU está a la espera de que se completen las operaciones de entrada/salida.

Unidad: porcentaje

cpu_usage_irq

El porcentaje de tiempo que la CPU está atendiendo interrupciones.

Unidad: porcentaje

cpu_usage_nice

El porcentaje de tiempo que la CPU está en modo de usuario con procesos de baja prioridad, que otros procesos de mayor prioridad pueden interrumpir fácilmente.

Unidad: porcentaje

cpu_usage_softirq

El porcentaje de tiempo que la CPU está atendiendo interrupciones de software.

Unidad: porcentaje

cpu_usage_steal

El porcentaje de tiempo que la CPU se encuentra en tiempo descartado, que es el tiempo empleado en otros sistemas operativos en un entorno virtualizado.

Unidad: porcentaje

cpu_usage_system

El porcentaje de tiempo que la CPU está en modo de sistema.

Unidad: porcentaje

cpu_usage_user

El porcentaje de tiempo que la CPU está en modo de usuario.

Unidad: porcentaje

disk_free

Espacio libre en los discos.

Unidades: bytes

disk_inodes_free

El número de nodos de índice disponibles en el disco.

Unidad: recuento

disk_inodes_total

El número total de nodos de índice reservados en el disco.

Unidad: recuento

disk_inodes_used

El número de nodos de índice usados en el disco.

Unidad: recuento

disk_total

Espacio total en los discos, incluido el usado y el libre.

Unidades: bytes

disk_used

Espacio usado en los discos.

Unidades: bytes

disk_used_percent

El porcentaje de espacio total en disco que está utilizado.

Unidad: porcentaje

diskio_iops_in_progress

El número de solicitudes de E/S que se han enviado al controlador de dispositivo, pero todavía no han completado.

Unidad: recuento

diskio_io_time

El periodo de tiempo que el disco ha tenido las solicitudes de E/S en cola.

Unidad: milisegundos

La única estadística que debe utilizarse para esta métrica es Sum. No utilice Average.

diskio_reads

El número de operaciones de lectura de disco.

Unidad: recuento

La única estadística que debe utilizarse para esta métrica es Sum. No utilice Average.

diskio_read_bytes

El número de bytes que se leyeron de los discos.

Unidades: bytes

La única estadística que debe utilizarse para esta métrica es Sum. No utilice Average.

diskio_read_time

El periodo de tiempo que las solicitudes de lectura han esperado en los discos. Si hay varias solicitudes de lectura en espera simultáneamente, se aumentará el número. Por ejemplo, si hay cinco solicitudes que esperan un promedio de 100 milisegundos, el valor registrado es 500.

Unidad: milisegundos

La única estadística que debe utilizarse para esta métrica es Sum. No utilice Average.

diskio_writes

El número de operaciones de escritura de disco.

Unidad: recuento

La única estadística que debe utilizarse para esta métrica es Sum. No utilice Average.

diskio_write_bytes

El número de bytes escritos en los discos.

Unidades: bytes

La única estadística que debe utilizarse para esta métrica es Sum. No utilice Average.

diskio_write_time

El periodo de tiempo que las solicitudes de escritura han esperado en los discos. Si hay varias solicitudes de escritura en espera simultáneamente, se aumentará el número. Por ejemplo, si hay ocho solicitudes que esperan un promedio de 1000 milisegundos, el valor registrado es 8000.

Unidad: milisegundos

La única estadística que debe utilizarse para esta métrica es Sum. No utilice Average.

ethtool_bw_in_allowance_exceeded

El número de paquetes en cola o descartados como consecuencia de que la capacidad de subida agregada superó el máximo para esta instancia.

Esta métrica sólo se recopila si la ha incluido en la subsección ethtool de la sección metrics_collected del archivo de configuración del agente de CloudWatch Para obtener más información, consulte Recopilación de las métricas de rendimiento de la red.

Unidad: ninguna

ethtool_bw_out_allowance_exceeded

El número de paquetes en cola o eliminados debido a que la banda ancha de subida agregada superó el máximo de la instancia.

Esta métrica sólo se recopila si se la ha incluido en la subsección ethtool de la sección metrics_collected del archivo de configuración del agente de CloudWatch Para obtener más información, consulte Recopilación de las métricas de rendimiento de la red.

Unidad: ninguna

ethtool_conntrack_allowance_exceeded

El número de paquetes eliminados porque el seguimiento de conexiones superó el máximo de la instancia y no se pudieron establecer nuevas conexiones. Esto puede provocar la pérdida de paquetes para el tráfico hacia o desde la instancia.

Esta métrica sólo se recopila si la ha incluido en la subsección ethtool de la sección metrics_collected del archivo de configuración del agente de CloudWatch Para obtener más información, consulte Recopilación de las métricas de rendimiento de la red.

Unidad: ninguna

ethtool_linklocal_allowance_exceeded

El número de paquetes eliminados porque el PPS del tráfico a los servicios proxy locales superó el máximo para la interfaz de red. Esto afecta al tráfico hacia el servicio de DNS, el servicio de metadatos de instancia y el Servicio de sincronización temporal de Amazon.

Esta métrica sólo se recopila si la ha incluido en la subsección ethtool de la sección metrics_collected del archivo de configuración del agente de CloudWatch Para obtener más información, consulte Recopilación de las métricas de rendimiento de la red.

Unidad: ninguna

ethtool_pps_allowance_exceeded

El número de paquetes en cola o eliminados debido a que el PPS bidireccional superó el máximo de la instancia.

Esta métrica sólo se recopila si la ha incluido en la subsección ethtool de la sección metrics_collected del archivo de configuración del agente de CloudWatch Para obtener más información, consulte Recopilación de las métricas de rendimiento de la red.

Unidad: ninguna

mem_active

La cantidad de memoria que se ha utilizado de alguna manera durante el último periodo de muestreo.

Unidades: bytes

mem_available

La cantidad de memoria que está disponible y que se puede asignar de manera instantánea a los procesos.

Unidades: bytes

mem_available_percent

El porcentaje de memoria que está disponible y que se puede asignar de manera instantánea a los procesos.

Unidad: porcentaje

mem_buffered

La cantidad de memoria que se utiliza para los búferes.

Unidades: bytes

mem_cached

La cantidad de memoria que se utiliza para la memoria caché de archivo.

Unidades: bytes

mem_free

La cantidad de memoria que no se está utilizando.

Unidades: bytes

mem_inactive

La cantidad de memoria que no se ha utilizado de alguna manera durante el último periodo de muestreo.

Unidades: bytes

mem_total

La cantidad total de memoria.

Unidades: bytes

mem_used

La cantidad de memoria en uso actualmente.

Unidades: bytes

mem_used_percent

El porcentaje de memoria en uso actualmente.

Unidad: porcentaje

net_bytes_recv

El número de bytes recibidos por la interfaz de red.

Unidades: bytes

La única estadística que debe utilizarse para esta métrica es Sum. No utilice Average.

net_bytes_sent

El número de bytes enviados por la interfaz de red.

Unidades: bytes

La única estadística que debe utilizarse para esta métrica es Sum. No utilice Average.

net_drop_in

El número de paquetes recibidos por esta interfaz de red que se han descartado.

Unidad: recuento

La única estadística que debe utilizarse para esta métrica es Sum. No utilice Average.

net_drop_out

El número de paquetes transmitidos por esta interfaz de red que se han descartado.

Unidad: recuento

La única estadística que debe utilizarse para esta métrica es Sum. No utilice Average.

net_err_in

El número de errores de recepción detectados por esta interfaz de red.

Unidad: recuento

La única estadística que debe utilizarse para esta métrica es Sum. No utilice Average.

net_err_out

El número de errores de transmisión detectados por esta interfaz de red.

Unidad: recuento

La única estadística que debe utilizarse para esta métrica es Sum. No utilice Average.

net_packets_sent

El número de paquetes enviados por esta interfaz de red.

Unidad: recuento

La única estadística que debe utilizarse para esta métrica es Sum. No utilice Average.

net_packets_recv

El número de paquetes recibidos por esta interfaz de red.

Unidad: recuento

La única estadística que debe utilizarse para esta métrica es Sum. No utilice Average.

netstat_tcp_close

El número de conexiones TCP sin estado.

Unidad: recuento

netstat_tcp_close_wait

El número de conexiones TCP esperando una solicitud de finalización del cliente.

Unidad: recuento

netstat_tcp_closing

El número de conexiones TCP que están esperando una solicitud de finalización con confirmación del cliente.

Unidad: recuento

netstat_tcp_established

El número de conexiones TCP establecidas.

Unidad: recuento

netstat_tcp_fin_wait1

El número de conexiones TCP en estado FIN_WAIT1 durante el proceso de cierre de una conexión.

Unidad: recuento

netstat_tcp_fin_wait2

El número de conexiones TCP en estado FIN_WAIT2 durante el proceso de cierre de una conexión.

Unidad: recuento

netstat_tcp_last_ack

El número de conexiones TCP esperando a que el cliente envíe la confirmación del mensaje de finalización de conexión. Es el último estado antes de que se cierre la conexión.

Unidad: recuento

netstat_tcp_listen

El número de puertos TCP que se escuchan actualmente para una solicitud de conexión.

Unidad: recuento

netstat_tcp_none

El número de conexiones TCP con clientes inactivos.

Unidad: recuento

netstat_tcp_syn_sent

El número de conexiones TCP que esperan una solicitud de conexión coincidente después de haber enviado una solicitud de conexión.

Unidad: recuento

netstat_tcp_syn_recv

El número de conexiones TCP que esperan una confirmación de solicitud de conexión después de haber enviado y recibido una solicitud de conexión.

Unidad: recuento

netstat_tcp_time_wait

El número de conexiones TCP en espera actualmente para garantizar que el cliente ha recibido la confirmación de su solicitud de finalización de conexión.

Unidad: recuento

netstat_udp_socket

El número de conexiones UDP actuales.

Unidad: recuento

processes_blocked

El número de procesos que están bloqueados.

Unidad: recuento

processes_dead

El número de procesos que están “muertos”, lo que se indica mediante el código de estado X en Linux.

Esta métrica no se recopila en ordenadores con macOS.

Unidad: recuento

processes_idle

El número de procesos que han estado inactivos (sin actividad durante más de 20 segundos). Disponible en instancias de FreeBSD.

Unidad: recuento

processes_paging

El número de procesos que están paginando, lo que se indica mediante el código de estado W en Linux.

Esta métrica no se recopila en ordenadores con macOS.

Unidad: recuento

processes_running

El número de procesos que están en ejecución, lo que se indica mediante el código de estado R.

Unidad: recuento

processes_sleeping

El número de procesos que están inactivos, lo que se indica mediante el código de estado S.

Unidad: recuento

processes_stopped

El número de procesos que están detenidos, lo que se indica mediante el código de estado T.

Unidad: recuento

processes_total

El número total de procesos en la instancia.

Unidad: recuento

processes_total_threads

El número total de subprocesos que componen los procesos. Esta métrica solo está disponible en instancias Linux.

Esta métrica no se recopila en ordenadores con macOS.

Unidad: recuento

processes_wait

El número de procesos que están paginando, lo que se indica mediante el código de estado W en instancias de FreeBSD. Esta métrica sólo está disponible en instancias de FreeBSD y no está disponible en instancias de Linux, Windows Server o de macOS.

Unidad: recuento

processes_zombies

El número de procesos zombis, lo que se indica mediante el código de estado Z.

Unidad: recuento

swap_free

La cantidad de espacio de intercambio que no se está utilizando.

Unidades: bytes

swap_used

La cantidad de espacio de intercambio en uso actualmente.

Unidades: bytes

swap_used_percent

El porcentaje de espacio de intercambio en uso actualmente.

Unidad: porcentaje

Definiciones de las métricas de memoria que el agente CloudWatch ha recopilado

Cuando el agente CloudWatch recopila métricas de memoria, la fuente es el subsistema de administración de memoria del host. Por ejemplo, el núcleo Linux expone los datos mantenidos por el sistema operativo en /proc. En el caso de la memoria, los datos están en /proc/meminfo.

Cada arquitectura y sistema operativo distintos tienen cálculos diferentes de los recursos que utilizan los procesos. Para obtener más información, consulte las siguientes secciones.

Durante cada intervalo de recopilación, el agente de CloudWatch de cada instancia recopila los recursos de la instancia y calcula los recursos que utilizan todos los procesos que se ejecutan en esa instancia. Esta información se remite a las métricas de CloudWatch. Puede configurar la duración del intervalo de recopilación en el archivo de configuración del agente de CloudWatch. Para obtener más información, consulte Archivo de configuración del agente de CloudWatch: sección del agente.

En la siguiente lista se explica cómo se definen las métricas de memoria que recopila el agente de CloudWatch.

  • Memoria activa: memoria que utiliza un proceso. En otras palabras, la memoria que utilizan las aplicaciones que se están ejecutando.

  • Memoria disponible: memoria que se puede asignar instantáneamente a los procesos sin que el sistema la intercambie (también conocida como memoria virtual).

  • Memoria intermedia: área de datos que comparten los dispositivos de hardware o los procesos de programa que funcionan a diferentes velocidades y prioridades.

  • Memoria en caché: almacena las instrucciones y los datos del programa que se utilizan repetidamente en el funcionamiento de los programas que probablemente la CPU necesite a continuación.

  • Memoria libre: memoria que no se utiliza en absoluto y que está fácilmente disponible. Es completamente gratuito para que el sistema pueda usarse cuando sea necesario.

  • Memoria inactiva: páginas a las que no se ha accedido “recientemente”.

  • Memoria total: el tamaño de la memoria RAM física real.

  • Memoria usada: memoria que los programas y procesos utilizan actualmente.

Linux: métricas recopiladas y cálculos utilizados

Métricas recopiladas y unidades:

  • Activo (bytes)

  • Disponible (bytes)

  • Porcentaje disponible (porcentaje)

  • Almacenado en búfer (bytes)

  • En caché (bytes)

  • Gratis (bytes)

  • Inactivo (bytes)

  • Total (Bytes)

  • Usado (bytes)

  • Porcentaje de uso (por ciento)

Memoria utilizada = Memoria total - Memoria libre - Memoria en caché - Memoria en búfer

Memoria total = Memoria utilizada + Memoria libre + Memoria caché + Memoria en búfer

macOS: métricas recopiladas y cálculos utilizados

Métricas recopiladas y unidades:

  • Activo (bytes)

  • Disponible (bytes)

  • Porcentaje disponible (porcentaje)

  • Gratis (bytes)

  • Inactivo (bytes)

  • Total (Bytes)

  • Usado (bytes)

  • Porcentaje de uso (por ciento)

Memoria disponible = memoria libre + memoria inactiva

Memoria usada = Memoria total - Memoria disponible

Memoria total = Memoria disponible + Memoria utilizada

Windows: métricas recopiladas

Las métricas recopiladas en los hosts de Windows se muestran a continuación. Todas estas métricas tienen None para Unit.

  • Bytes disponibles

  • Fallos de caché por segundo

  • Errores de página por segundo

  • Páginas por segundo

No se utilizan cálculos para las métricas de Windows porque el agente de CloudWatch analiza los eventos de los contadores de rendimiento.

Ejemplo: calcular las métricas de memoria en Linux

Como ejemplo, supongamos que al introducir el comando cat /proc/meminfo en un host Linux se obtienen los siguientes resultados:

MemTotal: 3824388 kB MemFree: 462704 kB MemAvailable: 2157328 kB Buffers: 126268 kB Cached: 1560520 kB SReclaimable: 289080 kB>

En este ejemplo, el agente de CloudWatch recopilará los siguientes valores. Todos los valores que recopila e informa el agente de CloudWatch están en bytes.

  • mem_total: 3 916 173 312 bytes

  • mem_available: 2 209 103 872 bytes (MemFree + Cached)

  • mem_free: 473 808 896 bytes

  • mem_cached: 1 893 990 400 bytes (cached + SReclaimable

  • mem_used: 1 419 075 584 bytes (MemTotal – (MemFree + Buffers + (Cached + SReclaimable)))

  • mem_buffered: 129 667 072 bytes

  • mem_available_percent: 56,41 %

  • mem_used_percent: 36,24 % (mem_used/mem_total) * 100