Información general - Amazon Managed Grafana

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Información general

Este tema de documentación está diseñado para los espacios de trabajo de Grafana que admiten la versión 10.x de Grafana.

Para ver los espacios de trabajo de Grafana que admiten la versión 9.x de Grafana, consulte. Trabajando en Grafana versión 9

Para ver los espacios de trabajo de Grafana que admiten la versión 8.x de Grafana, consulte. Trabajando en Grafana versión 8

Tanto si acabas de empezar como si eres un usuario más experimentado de Grafana Alerting, obtén más información sobre los aspectos básicos y las funciones disponibles que te ayudan a crear, gestionar y responder a las alertas, y a mejorar la capacidad de tu equipo para resolver problemas rápidamente.

Principios

En los sistemas de alertas basados en Prometheus, dispone de un generador de alertas que crea alertas y un receptor de alertas que las recibe. Por ejemplo, Prometheus es un generador de alertas y es responsable de evaluar las reglas de alerta, mientras que Alertmanager es un receptor de alertas y se encarga de agrupar, inhibir, silenciar y enviar notificaciones sobre alertas activadas y resueltas.

Grafana Alerting se basa en el modelo Prometheus de diseño de sistemas de alerta. Cuenta con un generador de alertas interno responsable de programar y evaluar las reglas de alerta, así como un receptor de alertas interno responsable de agrupar, inhibir, silenciar y enviar notificaciones. Grafana no usa Prometheus como generador de alertas porque Grafana Alerting necesita funcionar con muchas otras fuentes de datos además de Prometheus. Sin embargo, utiliza Alertmanager como receptor de alertas.

Las alertas se envían al receptor de alertas, donde se enrutan, agrupan, inhiben, silencian y notifican. En Grafana Alerting, el receptor de alertas predeterminado es el Alertmanager integrado en Grafana y se denomina Grafana Alertmanager. Sin embargo, también puedes usar otros gestores de alertas, que se denominan gestores de alertas externos.

Conceptos básicos

A continuación, se proporciona una descripción general de las diferentes partes de las alertas de Grafana.

Reglas de alerta

Una regla de alerta es un conjunto de criterios que determinan cuándo debe activarse una alerta. Consta de una o más consultas y expresiones, una condición que debe cumplirse, un intervalo que determina la frecuencia con la que se evalúa la regla de alerta y un período durante el cual se debe cumplir la condición para que se active una alerta.

Las reglas de alerta se evalúan a lo largo de su intervalo y cada regla de alerta puede tener cero, una o cualquier número de alertas activadas a la vez. El estado de la regla de alerta viene determinado por su nivel máximo de severe alerta, que puede ser Normal, Pendiente o Activado. Por ejemplo, si al menos una de las alertas de una regla de alerta se está activando, la regla de alerta también se está activando. El estado de una regla de alerta viene determinado por el estado de su evaluación más reciente. Estos pueden ser OK, Error y NoData.

Una característica muy importante de las reglas de alerta es que admiten anotaciones y etiquetas personalizadas. Estas permiten configurar las alertas con metadatos adicionales, como resúmenes y descripciones, y añadir etiquetas adicionales para dirigir las alertas a políticas de notificación específicas.

Alertas

Las alertas se identifican de forma exclusiva mediante conjuntos de pares clave/valor denominados etiquetas. Cada clave es un nombre de etiqueta y cada valor es un valor de etiqueta. Por ejemplo, una alerta puede tener las etiquetas foo=bar y otra puede tenerlasfoo=baz. Una alerta puede tener muchas etiquetas, por ejemplofoo=bar,bar=baz, pero no puede tener la misma etiqueta dos veces, por ejemplofoo=bar,foo=baz. Dos alertas tampoco pueden tener las mismas etiquetas y, si dos alertas tienen las mismas etiquetas, por ejemplofoo=bar,bar=baz, se descartará una de las alertas. foo=bar,bar=baz Las alertas se resuelven cuando la condición de la regla de alerta deja de cumplirse o se elimina la regla de alerta.

En las alertas gestionadas de Grafana, las alertas pueden estar en estado Normal, Pendiente, Alerta, Sin datos o Error. En las alertas gestionadas por fuentes de datos, como Mimir y Loki, las alertas pueden estar en estado normal, pendiente y alerta, pero no en estado de error. NoData

Puntos de contacto

Los puntos de contacto determinan dónde se envían las notificaciones. Por ejemplo, puedes tener un punto de contacto que envíe notificaciones a una dirección de correo electrónico, a Slack, a un sistema de gestión de incidentes (IRM) como OnCall Grafana o Pagerduty, o a un webhook.

Las notificaciones que se envían desde los puntos de contacto se pueden personalizar mediante plantillas de notificaciones. Puede usar plantillas de notificaciones para cambiar el título, el mensaje y la estructura de la notificación. Las plantillas de notificación no son específicas de las integraciones individuales o los puntos de contacto.

Políticas de notificación

Las políticas de notificación agrupan las alertas y, a continuación, las dirigen a los puntos de contacto. Determinan cuándo se envían las notificaciones y con qué frecuencia deben repetirse.

Las alertas se ajustan a las políticas de notificación mediante comparadores de etiquetas. Se trata de expresiones legibles por humanos que indican si las etiquetas de la alerta coinciden exactamente, no coinciden exactamente, contienen o no contienen el texto esperado. Por ejemplo, el comparador hace foo=bar coincidir las alertas con la etiqueta, foo=bar mientras que el comparador hace foo=~[a-zA-Z]+ coincidir las alertas con cualquier etiqueta llamada foo cuyo valor coincida con la expresión regular. [a-zA-Z]+

De forma predeterminada, una alerta solo puede coincidir con una política de notificaciones. Sin embargo, con continue esta función, las alertas se pueden configurar para que coincidan con cualquier número de políticas de notificación al mismo tiempo. Para obtener más información sobre las políticas de notificación, consulte Políticas de notificación.

Silencios y tiempos de silencio

Los silencios y los tiempos de silencio te permiten pausar las notificaciones de alertas específicas o incluso de políticas de notificación completas. Utilice el silencio para pausar las notificaciones de forma puntual, por ejemplo, mientras trabaja en la solución de una alerta, y utilice los tiempos de silencio para pausar las notificaciones a intervalos regulares, por ejemplo, durante los períodos de mantenimiento programados con regularidad.