Monitoreo del estado operativo de sus aplicaciones con Application Signals - Amazon CloudWatch

Monitoreo del estado operativo de sus aplicaciones con Application Signals

Utilice Application Signals en la consola de CloudWatch para monitorear y solucionar problemas del estado operativo de sus aplicaciones:

  • Monitoree los servicios de sus aplicaciones: como parte del monitoreo operativo diario, utilice la página Servicios para ver un resumen de todos los servicios. Consulte los servicios con la mayor tasa de errores o latencia y compruebe qué servicios tienen indicadores de nivel de servicio (SLI) que no funcionan de forma correcta. Seleccione un servicio para abrir la página Detalles del servicio y ver las métricas detalladas, las operaciones del servicio, los valores controlados de Synthetics y las solicitudes de los clientes. Esto le permite solucionar problemas e identificar la causa raíz de los problemas operativos.

  • Inspeccione la topología de su aplicación: utilice el Mapa de servicio para comprender y monitorear la topología de su aplicación a lo largo del tiempo, incluidas las relaciones entre los clientes, los valores controlados de Synthetics, los servicios y las dependencias. Vea al instante el estado del indicador de nivel de servicio (SLI) y consulte las métricas clave, como el volumen de llamadas, la tasa de errores y la latencia. Para obtener información más detallada, desplácese a la página Detalles del servicio.

Explore un ejemplo de escenario que demuestra cómo se pueden utilizar estas páginas para solucionar con rapidez un problema de estado del servicio operativo, desde la detección inicial hasta la identificación de la causa raíz.

Cómo Application Signals permite el monitoreo del estado operativo

Después de activar su aplicación para Application Signals, los servicios de la aplicación, las API y sus dependencias se detectan de manera automática y se muestran en las páginas Servicios, Detalles del servicio y Mapa de servicios. Application Signals recopila información de varios orígenes para poder activar la detección de servicios y la supervisión del estado operativo:

  • AWS Distro para OpenTelemetry (ADOT): como parte de la habilitación de Application Signals, se configuran bibliotecas de autoinstrumentación OpenTelemetry Java y Python para emitir métricas y seguimientos recopilados por el agente de CloudWatch. Las métricas y los seguimientos se utilizan para activar la detección de servicios, operaciones, dependencias y otra información de servicio.

  • Objetivos de nivel de servicio (SLO): después de crear objetivos de nivel de servicio para sus servicios, las páginas Servicios, Detalles del servicio y Mapa de servicios muestran el estado del indicador de nivel de servicio (SLI). Los SLI pueden monitorear la latencia, la disponibilidad y otras métricas operativas.

  • Valores controlados de CloudWatch: cuando configura el rastreo de rayos X en los valores controlados, las llamadas a sus servicios desde los scripts de los valores controlados se asocian a su servicio y se muestran en la página de detalles del servicio.

  • Monitoreo de usuarios reales (RUM) de CloudWatch: cuando el rastreo de rayos X está activado en el cliente web RUM de CloudWatch RUM, las solicitudes a los servicios se asocian de manera automática y se muestran en la página de detalles del servicio.

  • AWS Service Catalog AppRegistry: Application Signals descubre automáticamente los recursos de AWS de su cuenta y le permite agruparlos en aplicaciones lógicas creadas en AppRegistry. El nombre de la aplicación que aparece en la página de servicios se basa en el recurso informático subyacente en el que se ejecutan los servicios.

nota

Application Signals muestra los servicios y operaciones en función de las métricas y los seguimientos emitidos en el filtro de tiempo actual que haya elegido. (De forma predeterminada, son las últimas tres horas). Si no hay actividad en el filtro de tiempo actual para un servicio, operación, dependencia, valor controlado de Synthetics o página de cliente, no se mostrará.

Actualmente, se pueden mostrar hasta 1000 servicios. La detección de los servicios y su topología puede demorar hasta 10 minutos. La evaluación del estado del indicador de nivel de servicio (SLI) puede demorar hasta 15 minutos.