Información general
Este tema de documentación está diseñado para los espacios de trabajo de Grafana que admiten la versión 10.x de Grafana.
Para los espacios de trabajo de Grafana que admiten la versión 9.x de Grafana, consulte Uso de la versión 9 de Grafana.
Para los espacios de trabajo de Grafana que admiten la versión 8.x de Grafana, consulte Uso de la versión 8 de Grafana.
Tanto si acaba de empezar como si es un usuario más experimentado de Grafana Alerting, obtenga más información sobre los aspectos básicos y las características disponibles que ayudan a crear, administrar y responder a las alertas, y a mejorar la capacidad de su equipo para resolver los problemas rápidamente.
Principios
En los sistemas de alertas basados en Prometheus, dispone de un generador que crea alertas y un receptor que las recibe. Por ejemplo, Prometheus es un generador de alertas y es responsable de evaluar las reglas de alertas, mientras que Alertmanager es un receptor de alertas y se encarga de agrupar, inhibir, silenciar y enviar notificaciones sobre alertas activadas y resueltas.
Grafana Alerting se basa en el modelo de Prometheus de diseño de sistemas de alertas. Cuenta con un generador de alertas interno responsable de programar y evaluar las reglas de alertas, así como un receptor de alertas interno responsable de agrupar, inhibir, silenciar y enviar notificaciones. Grafana no utiliza Prometheus como generador de alertas porque Grafana Alerting debe funcionar con muchos otros orígenes de datos además de Prometheus. Sin embargo, utiliza Alertmanager como receptor de alertas.
Las alertas se envían al receptor de alertas, donde se enrutan, agrupan, inhiben, silencian y notifican. En Grafana Alerting, el receptor de alertas predeterminado es el administrador de alertas incrustado en Grafana y se denomina Grafana Alertmanager. Sin embargo, también puede utilizar otros administradores de alertas, que se denominan Alertmanagers externos.
Aspectos fundamentales
A continuación, se proporciona información general de las distintas partes de Grafana Alerting.
Reglas de alertas
Una regla de alertas es un conjunto de criterios que determinan cuándo debe activarse una alerta. Consta de una o más consultas y expresiones, una condición que debe cumplirse, un intervalo que determina la frecuencia con la que se evalúa la regla de alerta y un periodo durante el que se debe cumplir la condición para que se active una alerta.
Las reglas de alertas se evalúan a lo largo de su intervalo y cada regla de alerta puede tener cero, una o cualquier número de alertas activadas a la vez. El estado de la regla de alerta viene determinado por su alerta de mayor nivel severe
, que puede ser Normal, Pendiente o Activación. Por ejemplo, si al menos una de las alertas de una regla de alertas está en activación, la regla de alertas también está en activación. El estado de una regla de alerta viene determinado por el estado de su evaluación más reciente. Pueden ser OK, Error y NoData.
Una característica muy importante de las reglas de alertas es que admiten anotaciones y etiquetas personalizadas. Estas permiten configurar las alertas con metadatos adicionales, como resúmenes y descripciones, y agregar etiquetas adicionales para dirigir las alertas a políticas de notificación específicas.
Alertas
Las alertas se identifican de forma exclusiva mediante conjuntos de pares clave/valor denominados etiquetas. Cada clave es un nombre de etiqueta y cada valor es un valor de etiqueta. Por ejemplo, una alerta podría tener las etiquetas foo=bar
y otra podría tener las etiquetas foo=baz
. Una alerta puede tener muchas etiquetas, como foo=bar,bar=baz
, pero no puede tener la misma etiqueta dos veces, como foo=bar,foo=baz
. Dos alertas tampoco pueden tener las mismas etiquetas y, si dos alertas tienen las mismas etiquetas, por ejemplo foo=bar,bar=baz
y foo=bar,bar=baz
, se descartará una de las alertas. Las alertas se resuelven cuando la condición de la regla de alerta deja de cumplirse o se elimina la regla de alerta.
En las alertas administradas por Grafana, las alertas pueden tener el estado Normal, Pendiente, Alerta, Sin datos o Error. En las alertas administradas por orígenes de datos, como Mimir y Loki, las alertas pueden tener el estado Normal, Pendiente y Alerta, pero no Sin datos o Error.
Puntos de contacto
Los puntos de contacto determinan dónde se envían las notificaciones. Por ejemplo, puede tener un punto de contacto que envíe notificaciones a una dirección de correo electrónico, a Slack, a un sistema de administración de incidentes (IRM) como Grafana OnCall o PagerDuty, o a un webhook.
Las notificaciones que se envían desde los puntos de contacto se pueden personalizar mediante plantillas de notificaciones. Puede utilizar las plantillas de notificaciones para cambiar el título, el mensaje y la estructura de la notificación. Las plantillas de notificaciones no son específicas de las integraciones individuales o los puntos de contacto.
Políticas de notificaciones
Las políticas de notificaciones agrupan las alertas y, a continuación, las dirigen a los puntos de contacto. Determinan cuándo se envían las notificaciones y con qué frecuencia deben repetirse.
Las alertas se ajustan a las políticas de notificación mediante criterios de coincidencia de etiquetas. Se trata de expresiones legibles por personas que indican si las etiquetas de la alerta coinciden de manera exacta, no coinciden de manera exacta, contienen o no contienen el texto esperado. Por ejemplo, el criterio de coincidencia foo=bar
hace coincidir las alertas con la etiqueta foo=bar
, mientras que el criterio de coincidencia foo=~[a-zA-Z]+
hace coincidir las alertas con cualquier etiqueta llamada foo cuyo valor coincida con la expresión regular [a-zA-Z]+
.
De manera predeterminada, una alerta solo puede coincidir con una política de notificaciones. Sin embargo, con la característica continue
, las alertas se pueden configurar para que coincidan con cualquier número de políticas de notificaciones al mismo tiempo. Para obtener más información acerca de las políticas de notificaciones, consulte Políticas de notificaciones.
Silencios y temporizadores de silencio
Los silencios y los temporizadores de silencio le permiten pausar las notificaciones de alertas específicas o incluso de políticas de notificaciones completas. Utilice el silencio para pausar las notificaciones de forma puntual, por ejemplo, mientras trabaja en la solución de una alerta, y utilice los temporizadores de silencio para pausar las notificaciones a intervalos periódicos, por ejemplo, durante los periodos de mantenimiento programados de manera periódica.