OPS08-BP01 Análisis de las métricas de la carga de trabajo
Después de implementar la telemetría de la aplicación, analice periódicamente las métricas recopiladas. Si bien la latencia, las solicitudes, los errores y la capacidad (o las cuotas) proporcionan información sobre el rendimiento del sistema, es fundamental dar prioridad la revisión de las métricas de resultados empresariales. Esto garantiza que tome decisiones basadas en datos alineadas con sus objetivos empresariales.
Resultado deseado: información veraz sobre el rendimiento de la carga de trabajo que genera decisiones basadas en datos y garantiza la alineación con los objetivos empresariales.
Patrones comunes de uso no recomendados:
-
Analizar las métricas de forma aislada sin tener en cuenta su impacto en los resultados empresariales.
-
Confiar de forma excesiva en las métricas técnicas y, al mismo tiempo, dejar de lado las métricas empresariales.
-
Revisar infrecuentemente las métricas, lo que hace que se pierdan oportunidades de toma de decisiones en tiempo real.
Beneficios de establecer esta práctica recomendada:
-
Comprensión mejorada de la correlación entre el rendimiento técnico y los resultados empresariales.
-
Proceso de toma de decisiones mejorado basado en datos en tiempo real.
-
Identificación y mitigación proactivas de los problemas antes de que afecten a los resultados empresariales.
Nivel de riesgo expuesto si no se establece esta práctica recomendada: medio
Guía para la implementación
Utilice herramientas como Amazon CloudWatch para llevar a cabo análisis de métricas. Los servicios de AWS como detección de anomalías de CloudWatch y Amazon DevOps Guru pueden utilizarse para detectar anomalías, especialmente cuando se desconocen los umbrales estáticos o cuando los patrones de comportamiento son más adecuados para la detección de anomalías.
Pasos para la implementación
-
Análisis y revisión: revise e interprete periódicamente las métricas de carga de trabajo.
-
Priorice las métricas de resultados empresariales sobre las métricas puramente técnicas.
-
Comprenda la importancia de los picos, las caídas o los patrones en sus datos.
-
-
Uso de Amazon CloudWatch: utilice Amazon CloudWatch para obtener una vista centralizada y un análisis exhaustivo.
-
Configure paneles de CloudWatch para visualizar sus métricas y compararlas a lo largo del tiempo.
-
Utilice percentiles de CloudWatch
para obtener una vista clara de la distribución de métricas, lo que puede ayudar a definir los SLA y comprender los valores atípicos. -
Configure la detección de anomalías de CloudWatch para identificar patrones inusuales sin depender de umbrales estáticos.
-
Implemente la observabilidad entre cuentas de CloudWatch para supervisar y solucionar problemas en las aplicaciones que abarcan varias cuentas de una región.
-
Utilice Información de métricas de CloudWatch para consultar y analizar datos de métricas en cuentas y regiones, identificando tendencias y anomalías.
-
Aplique calculadora de métricas para transformar, agregar o hacer cálculos en sus métricas a fin de obtener información más detallada.
-
-
Uso de Amazon DevOps Guru: integre Amazon DevOps Guru
por su detección de anomalías mejorada con machine learning para identificar los primeros signos de problemas operativos en sus aplicaciones sin servidor y solucionarlos antes de que afecten a sus clientes. -
Optimización basada en información: tome decisiones fundamentadas en función de su análisis de métricas para ajustar y mejorar sus cargas de trabajo.
Nivel de esfuerzo para el plan de implementación: medio
Recursos
Prácticas recomendadas relacionadas:
Documentos relacionados:
Videos relacionados:
Ejemplos relacionados: