Evaluación de la regla de alerta - Amazon Managed Grafana

Evaluación de la regla de alerta

Este tema de documentación está diseñado para los espacios de trabajo de Grafana que admiten la versión 10.x de Grafana.

Para los espacios de trabajo de Grafana que admiten la versión 9.x de Grafana, consulte Uso de la versión 9 de Grafana.

Para los espacios de trabajo de Grafana que admiten la versión 8.x de Grafana, consulte Uso de la versión 8 de Grafana.

Utilice la evaluación de las reglas de alertas para determinar con qué frecuencia debe evaluarse una regla de alertas y con qué rapidez debe cambiar su estado.

Para ello, debe asegurarse de que la regla de alertas se encuentra en el grupo de evaluación correcto y establecer un periodo de tiempo pendiente que se adapte mejor a su caso de uso.

Grupo de evaluación

Cada regla de alerta forma parte de un grupo de evaluación. Cada grupo de evaluación contiene un intervalo de evaluación que determina la frecuencia con la que se comprueba la regla de alerta.

Las reglas de alerta administradas por un origen de datos del mismo grupo se evalúan una tras otra, mientras que las reglas de alerta de diferentes grupos se pueden evaluar simultáneamente. Esta característica resulta especialmente útil cuando se quiere garantizar que las reglas de registro se evalúen antes que cualquier regla de alerta.

Las reglas de alerta administradas por Grafana se evalúan al mismo tiempo, independientemente del grupo. El intervalo de evaluación predeterminado se establece en 10 segundos, lo que significa que las reglas de alerta administradas por Grafana se evalúan cada 10 segundos hasta la ventana de 10 segundos más cercana del reloj, por ejemplo, 10:00:00, 10:00:10, 10:00:20, etc. También puede configurar su propio intervalo de evaluación, si es necesario.

nota

Los grupos de evaluación y la agrupación de alertas en las políticas de notificación son dos cosas distintas. La agrupación en las políticas de notificación permite enviar varias alertas que comparten las mismas etiquetas en el mismo mensaje de tiempo.

Periodo pendiente

Al establecer un periodo pendiente, puede evitar alertas innecesarias por problemas temporales.

En el periodo pendiente, se selecciona el periodo en el que una regla de alerta puede infringir la condición hasta que se activa.

Ejemplo

Imagine que hay un intervalo de evaluación de la regla de alerta establecido cada 30 segundos y el periodo pendiente en 90 segundos.

La evaluación se hará de la siguiente manera:

[00:30] Primera evaluación: condición no cumplida.

[01:00] Segunda evaluación: condición infringida. El contador pendiente se inicia. La alerta comienza como pendiente.

[01:30] Tercera evaluación: condición infringida. Contador pendiente = 30 s. Estado pendiente.

[02:00] Cuarta evaluación: condición infringida. Contador pendiente = 60 s. Estado pendiente.

[02:30] Quinta evaluación: condición infringida. Contador pendiente = 90 s. La alerta comienza a activarse

Si la regla de alerta tiene una condición que debe infringirse durante un periodo determinado antes de actuar, su estado cambia de la siguiente manera:

  • Cuando se infringe la condición por primera vez, la regla pasa a un estado “pendiente”.

  • La regla permanece en el estado “pendiente” hasta que se haya infringido la condición durante el periodo requerido (periodo pendiente).

  • Una vez transcurrido el tiempo requerido, la regla pasa a un estado de “activación”.

  • Si la condición deja de infringirse durante el periodo pendiente, la regla vuelve a su estado normal.

nota

Si quiere omitir el estado pendiente, simplemente puede establecer el periodo pendiente en 0. De esta forma, se omite el periodo pendiente y la regla de alerta empezará a activarse en cuanto se infrinja la condición.

Cuando se activa una regla de alerta, se generan instancias de alerta que, a continuación, se envían al Alertmanager.