Supervisión de métricas en un clúster de Amazon Aurora - Amazon Aurora

Supervisión de métricas en un clúster de Amazon Aurora

Amazon Aurora utiliza un clúster de servidores de base de datos replicados. Monitorear un clúster de Aurora suele precisar de una comprobación del estado de varias instancias de base de datos. Es posible que las instancias tengan roles especializados, controlen, en su mayoría, operaciones de escritura, de solo lectura o una combinación. También supervisa el estado general del clúster al medir el retraso de replicación. Es la cantidad de tiempo para que los cambios realizados por una instancia de base de datos estén disponibles para las otras instancias.

Plan de monitoreo

Antes de comenzar la monitorización Amazon Aurora, cree un plan de monitorización. El plan debe responder a las siguientes preguntas:

  • ¿Cuáles son los objetivos de la monitorización?

  • ¿Qué recursos va a monitorizar?

  • ¿Con qué frecuencia va a monitorizar estos recursos?

  • ¿Qué herramientas de monitorización va a utilizar?

  • ¿Quién se encargará de realizar las tareas de monitorización?

  • ¿Quién debe recibir una notificación cuando surjan problemas?

Referencia de rendimiento

Para lograr sus objetivos de monitoreo, debe establecer una referencia. Para ello, mida el rendimiento bajo distintas condiciones de carga en diferentes momentos en su entorno de Amazon Aurora. Puede monitorear métricas como las siguientes:

  • Network throughput

  • Conexiones de clientes

  • E/S para operaciones de lectura, escritura o metadatos

  • Saldos de crédito de ráfagas para sus instancias de base de datos

Le recomendamos que almacene datos históricos de rendimiento para Amazon Aurora. Utilizando los datos almacenados, puede comparar el rendimiento actual frente a las tendencias anteriores. También puede distinguir los patrones de rendimiento normales de las anomalías y diseñar técnicas para solucionar problemas.

Directrices de rendimiento

En general, los valores aceptables para las métricas de rendimiento dependen de lo que hace la aplicación respecto a la referencia. Investigue las variaciones coherentes o de las tendencias con respecto a la referencia. Las siguientes métricas suelen ser la fuente de problemas de rendimiento:

  • Consumo elevado de CPU o RAM: unos valores elevados de consumo de CPU o RAM es posible que sean si se ajustan a los objetivos de su aplicación (de rendimiento o simultaneidad, por ejemplo) y son los esperados.

  • Consumo de espacio en disco: investigue el consumo de espacio en el disco si el espacio utilizado está por sistema alrededor o por encima del 85 % del espacio total disponible en el disco. Compruebe si es posible eliminar datos de la instancia o archivar los datos en un sistema diferente para liberar espacio.

  • Tráfico de red: para el tráfico de red, hable con el administrador de su sistema para saber cuál es el rendimiento esperado para la red de su dominio y para su conexión a Internet. Investigue el tráfico de red si el rendimiento es por sistema inferior al esperado.

  • Conexiones a bases de datos: si ve que hay un alto número de conexiones de usuarios además de una reducción en el rendimiento y el tiempo de respuesta de la instancia, valore la posibilidad de restringir las conexiones a las bases de datos. El mejor número de conexiones de usuarios para su instancia de base de datos varía en función de la clase de instancia y de la complejidad de las operaciones que se estén llevando a cabo. Para determinar el número de conexiones a bases de datos, asocie la instancia de base de datos con un grupo de parámetros en el que el parámetro User Connections se haya establecido en un valor distinto de 0 (ilimitado). Puede utilizar un grupo de parámetros existente o crear uno nuevo. Para obtener más información, consulte Grupos de parámetros para Amazon Aurora.

  • Métricas de IOPS: los valores esperados para las métricas de IOPS dependen de la especificación del disco y la configuración del servidor, así que debe usar su referencia para conocer los valores típicos. Investigue si los valores son por sistema diferentes de los de la referencia. Para un rendimiento óptimo de IOPS, asegúrese de que el conjunto de trabajo típico se ajuste a la memoria para minimizar las operaciones de lectura y escritura.

Cuando el rendimiento está fuera del punto de referencia establecido, es posible que tenga que realizar cambios para optimizar la disponibilidad de la base de datos para la carga de trabajo. Por ejemplo, es posible que necesite cambiar la clase de instancia de su instancia de base de datos. O es posible que necesite cambiar el número de instancias de base de datos y réplicas de lectura disponibles para los clientes.