¿Qué métricas debo monitorear? - Amazon ElastiCache

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

¿Qué métricas debo monitorear?

Las siguientes CloudWatch métricas ofrecen una buena visión ElastiCache del rendimiento. En la mayoría de los casos, le recomendamos que configure CloudWatch alarmas para estas métricas, de modo que pueda tomar medidas correctivas antes de que se produzcan problemas de rendimiento.

CPUUtilization

Se trata de una métrica de nivel de host que muestra un valor como un porcentaje. Para obtener más información, consulte Métricas de nivel de host.

Valley y Redis OSS

Para tipos de nodos más pequeños con 2 vCPUs o menos, usa la CPUUtilization métrica para monitorear tu carga de trabajo.

En términos generales, le sugerimos que establezca su umbral en el 90% de lo que esté disponibleCPU. Como tanto Valkey como Redis OSS son de un solo subproceso, el valor umbral real debe calcularse como una fracción de la capacidad total del nodo. Por ejemplo, supongamos que está usando un tipo de nodo con dos núcleos. En este caso, el umbral CPUUtilization sería de 90/2, es decir, del 45%.

Deberá determinar su propio umbral en función del número de núcleos del nodo de caché que use. Si supera este umbral y su carga de trabajo principal es de solicitudes de lectura, escale el clúster de caché de forma ascendente agregando réplicas de lectura. Si la carga de trabajo principal es de solicitudes de escritura, en función de la configuración del clúster, recomendamos que:

  • Clústeres de Valkey o Redis OSS (modo de clúster desactivado): amplíelos mediante un tipo de instancia de caché más grande.

  • Clústeres de Valkey o Redis OSS (modo de clúster activado): añada más fragmentos para distribuir la carga de trabajo de escritura entre más nodos principales.

sugerencia

En lugar de utilizar la métrica a nivel de hostCPUUtilization, es posible que OSS los usuarios de Valkey y Redis puedan utilizar la métricaEngineCPUUtilization, que indica el porcentaje de uso en el núcleo del motor de Valkey o Redis. OSS Para comprobar si esta métrica está disponible en sus nodos y obtener más información, consulte Métricas de Valkey y Redis. OSS

Para tipos de nodos más grandes con 4 vCPUs o más, puede que desees usar la EngineCPUUtilization métrica, que indica el porcentaje de uso en el núcleo del motor de Valkey o OSS Redis. Para comprobar si esta métrica está disponible en sus nodos y obtener más información, consulte Metrics for Redis. OSS

Memcached

Como Memcached usa múltiples subprocesos, esta métrica puede llegar hasta el 90 %. Si supera este umbral, amplíe el clúster de caché utilizando un tipo de nodo de caché más grande o amplíe el clúster añadiendo más nodos de caché.

E ngineCPUUtilization

Para tipos de nodos más grandes con 4 vCPUs o más, es posible que desee utilizar la EngineCPUUtilization métrica, que indica el porcentaje de uso en el núcleo del OSS motor Redis. Para comprobar si esta métrica está disponible en sus nodos y para obtener más información, consulte Métricas para Valkey y Redis. OSS

Para obtener más información, consulte la CPUssección Supervisión de las mejores prácticas con Amazon ElastiCache (RedisOSS) mediante Amazon CloudWatch.

SwapUsage (Valkey y Redis) OSS

Se trata de una métrica de nivel de host que muestra un valor en bytes. Para obtener más información, consulte Métricas de nivel de host.

Una FreeableMemory CloudWatch métrica cercana a 0 (es decir, inferior a 100 MB) o una SwapUsage métrica superior a la FreeableMemory métrica indica que un nodo está bajo presión de memoria. Si esto sucede, consulte los siguientes temas:

Evictions

Es una métrica del motor de la caché Recomendamos que determine su propio umbral de alarma para esta métrica en función de las necesidades de su aplicación.

Si utiliza Memcached y supera el umbral elegido, amplíe el clúster con un tipo de nodo más grande o amplíe el clúster añadiendo más nodos.

CurrConnections

Es una métrica del motor de la caché Recomendamos que determine su propio umbral de alarma para esta métrica en función de las necesidades de su aplicación.

Un número creciente de ellos CurrConnectionspodría indicar un problema con la aplicación; tendrá que investigar el comportamiento de la aplicación para solucionar este problema.

Para obtener más información, consulte la sección Conexiones en Supervisión de las mejores prácticas con Amazon ElastiCache (RedisOSS) mediante Amazon CloudWatch.

Memoria (Valkey y Redis) OSS

La memoria es un aspecto fundamental de Valkey y Redis. OSS Es necesario comprender la utilización de la memoria de un clúster para evitar la pérdida de datos y adaptarse al crecimiento futuro del conjunto de datos. Las estadísticas sobre la utilización de la memoria de un nodo están disponibles en la sección de memoria del INFOcomando.

Para obtener más información, consulte la sección Memoria en Supervisión de las mejores prácticas con Amazon ElastiCache (RedisOSS) mediante Amazon CloudWatch.

Network

Uno de los factores determinantes de la capacidad de la banda ancha de red del clúster es el tipo de nodo seleccionado. Para obtener más información sobre la capacidad de red de tu nodo, consulta los ElastiCache precios de Amazon.

Para obtener más información, consulte la sección Red en Supervisión de las mejores prácticas con Amazon ElastiCache (RedisOSS) mediante Amazon CloudWatch.

Latencia

Puede medir la latencia de un comando con un conjunto de CloudWatch métricas que proporcionan latencias agregadas por estructura de datos. Estas métricas de latencia se calculan mediante la commandstats estadística del comando INFOValkey.

Para obtener más información, consulta la sección Latencia en Monitorización de las mejores prácticas con Amazon ElastiCache mediante Amazon CloudWatch.

Replicación

El volumen de datos que se replican es visible a través de la métrica ReplicationBytes. Aunque esta métrica representa la carga de escritura del grupo de replicación, no proporciona información acerca del estado de replicación. Para este propósito, puede utilizar la métrica ReplicationLag.

Para obtener más información, consulte la sección Replicación en Supervisión de las mejores prácticas con Amazon ElastiCache (RedisOSS) mediante Amazon CloudWatch.

Gestión del tráfico (Valkey y Redis) OSS

ElastiCache (RedisOSS) gestiona automáticamente el tráfico de un nodo cuando se envían al nodo más comandos entrantes de los que pueden procesar Valkey o Redis. OSS Esto se hace para mantener un funcionamiento y una estabilidad óptimos del motor.

Cuando el tráfico se administra activamente en un nodo, la métrica TrafficManagementActive emite puntos de datos de 1. Esto indica que el nodo ha disminuido la escala para la carga de trabajo que se proporciona. Si esta métrica sigue siendo 1 durante largos periodos de tiempo, evalúe el clúster para decidir si es necesario escalar verticalmente o escalar horizontalmente.

Para obtener más información, consulte la métrica TrafficManagementActive en la página Métricas.