OPS08-BP03 Análisis de los rastreos de la carga de trabajo - Operational Excellence Pillar

OPS08-BP03 Análisis de los rastreos de la carga de trabajo

El análisis de los datos de rastreo es crucial para lograr una visión integral del recorrido operativo de una aplicación. Al visualizar y comprender las interacciones entre varios componentes, se puede ajustar el rendimiento, identificar los cuellos de botella y mejorar las experiencias de los usuarios.

Resultado deseado: logre una visibilidad clara de las operaciones distribuidas de su aplicación, lo que permite una resolución de problemas más rápida y una mejor experiencia del usuario.

Patrones comunes de uso no recomendados:

  • Pasar por alto los datos de rastreo y confiar únicamente en los registros y las métricas.

  • No se correlacionan los datos de rastreo con los registros asociados.

  • Hacer caso omiso de las métricas derivadas de los rastreos, como la latencia y las tasas de errores.

Beneficios de establecer esta práctica recomendada:

  • Mejore la solución de problemas y reduzca el tiempo medio de resolución (MTTR).

  • Obtenga información sobre las dependencias y su impacto.

  • Identifique y corrija rápidamente los problemas de rendimiento.

  • Utilice las métricas derivadas de los rastreos para tomar decisiones informadas.

  • Mejore la experiencia del usuario mediante interacciones de componentes optimizadas.

Nivel de riesgo expuesto si no se establece esta práctica recomendada: medio

Guía para la implementación

AWS X-Ray ofrece un conjunto completo para el análisis de datos de rastreo, que proporciona una visión integral de las interacciones del servicio, supervisa las actividades de los usuarios y detecta problemas de rendimiento. Características como ServiceLens, X-Ray Insights, X-Ray Analytics y Amazon DevOps Guru mejoran la profundidad de la información procesable derivada de los datos de rastreo.

Pasos para la implementación

Los siguientes pasos ofrecen un enfoque estructurado para implementar de manera eficaz el análisis de datos de rastreo mediante servicios de AWS:

  1. Integración de AWS X-Ray: asegúrese de que X-Ray esté integrado con sus aplicaciones para obtener datos de rastreo.

  2. Análisis de las métricas de X-Ray: profundice en las métricas obtenidas de los rastreos de X-Ray, como la latencia, las tasas de solicitudes, las tasas de errores y las distribuciones del tiempo de respuesta mediante el mapa de servicios para supervisar el estado de las aplicaciones.

  3. Uso de ServiceLens: aproveche el mapa de ServiceLens para mejorar la observabilidad de sus servicios y aplicaciones. Esto permite la visualización integrada de rastreos, métricas, registros, alarmas y otra información de estado.

  4. Activación de X-Ray Insights:

    1. Active X-Ray Insights para la detección automática de anomalías en los rastreos.

    2. Examine la información para identificar patrones y determinar las causas raíz, como el aumento de tasas de errores o latencias.

    3. Consulte el cronograma de información para obtener un análisis cronológico de los problemas detectados.

  5. Uso de X-Ray Analytics: X-Ray Analytics le permite explorar a fondo los datos de rastreo, identificar patrones y extraer información.

  6. Uso de grupos en X-Ray: cree grupos en X-Ray para filtrar los rastreos en función de criterios como la alta latencia, lo que permite un análisis más específico.

  7. Integración de Amazon DevOps Guru: utilice Amazon DevOps Guru para beneficiarse de los modelos de machine learning que identifican anomalías operativas en los rastreos.

  8. Uso de CloudWatch Synthetics: utilice CloudWatch Synthetics para crear canarios para supervisar continuamente sus puntos de enlace y flujos de trabajo. Estos canarios pueden integrarse con X-Ray para proporcionar datos de rastreo para un análisis en profundidad de las aplicaciones que se están probando.

  9. Uso de Real User Monitoring (RUM): con AWS X-Ray y CloudWatch RUM, puede analizar y depurar la ruta de solicitud a partir de los usuarios finales de su aplicación y hasta los servicios administrados de AWS posteriores. Eso le ayuda a identificar las tendencias de latencia y los errores que afectan a sus usuarios finales.

  10. Correlación con registros: correlacione los datos de seguimiento con los registros relacionados en la vista de rastreo de X-Ray para obtener una perspectiva detallada del comportamiento de las aplicaciones. Esto le permite ver los eventos de registro directamente asociados con las transacciones rastreadas.

  11. Implementación de la observabilidad entre cuentas de CloudWatch: supervise y solucione problemas en las aplicaciones que abarcan varias cuentas de una región.

Nivel de esfuerzo para el plan de implementación: medio

Recursos

Prácticas recomendadas relacionadas:

Documentos relacionados:

Videos relacionados:

Ejemplos relacionados: