Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Creación de reglas de alerta administradas por Grafana
Este tema de documentación está diseñado para los espacios de trabajo de Grafana que admiten la versión 9.x de Grafana.
Para los espacios de trabajo de Grafana que admiten la versión 10.x de Grafana, consulte Uso de la versión 10 de Grafana.
Para los espacios de trabajo de Grafana que admiten la versión 8.x de Grafana, consulte Uso de la versión 8 de Grafana.
Grafana le permite crear reglas de alerta que consultan uno o más orígenes de datos, reducen o transforman los resultados y los comparan entre sí o con umbrales fijos. Cuando se ejecutan, Grafana envía notificaciones al punto de contacto.
Adición de una regla administrada por Grafana
-
En la consola de Grafana, en el menú de Grafana, seleccione el icono Alertas (campana) para abrir la página Alertas, en la que se muestran las alertas existentes.
-
Elija Nueva regla de alerta.
-
En el Paso 1, agregue el nombre, el tipo y la ubicación de almacenamiento de la regla, de la siguiente manera:
-
En Nombre de la regla, escriba un nombre descriptivo. Este nombre aparece en la lista de las reglas de alertas. También es la etiqueta
alertname
de cada instancia de alerta que se crea a partir de esta regla. -
En el menú desplegable Tipo de regla, seleccione Alerta administrada por Grafana.
-
En el menú desplegable Carpeta, seleccione la carpeta en la que quiere almacenar la regla. Si no selecciona ninguna carpeta, la regla se almacena en la carpeta
General
. Para crear una carpeta, seleccione el menú desplegable y escriba un nuevo nombre de carpeta.
-
-
En el Paso 2, agregue las consultas y expresiones que desee evaluar.
-
Mantenga el nombre predeterminado o coloque el cursor del ratón sobre el icono de edición y selecciónelo para cambiar el nombre.
-
En el caso de las consultas, seleccione un origen de datos del menú desplegable.
-
Agregue una o más consultas o expresiones.
-
Para cada expresión, seleccione Condición clásica para crear una regla de alerta única o elija entre las opciones Matemáticas, Reducir y Remuestrear para generar alertas independientes para cada serie. Para obtener más información sobre estas opciones, consulte Reglas unidimensionales y multidimensionales.
-
Elija Ejecutar consultas para comprobar que la consulta se completa correctamente.
-
-
En el Paso 3, agregue condiciones.
-
En el menú desplegable Condición, seleccione la consulta o expresión para iniciar la regla de alerta.
-
En Evaluar cada, especifique la frecuencia de la evaluación. Debe ser un múltiplo de 10 segundos. Por ejemplo,
1m
,30s
. -
En Evaluar durante, especifique el tiempo durante el cual la condición debe cumplirse antes de que se inicie una alerta.
nota
Cuando se infringe una condición, la alerta pasa al estado
Pending
. Si la condición permanece infringida durante el tiempo especificado, la alerta pasa al estadoFiring
. Si ya no se cumple, vuelve al estadoNormal
. -
En Configurar la gestión de errores y ausencia de datos, configure el comportamiento de las alertas en ausencia de datos. Siga las directrices de Gestión de casos de error o ausencia de datos.
-
Elija Vista previa de alertas para comprobar el resultado de la ejecución de la consulta en este momento. La vista previa excluye las condiciones de gestión de errores y ausencia de datos.
-
-
En el Paso 4, agregue metadatos adicionales asociados a la regla.
-
Agregue una descripción y un resumen para personalizar los mensajes de alerta. Utilice las directrices de Etiquetas y anotaciones.
-
Agregue la URL, el panel, el panel y la alerta IDs de Runbook.
-
Agregue etiquetas personalizadas.
-
-
Seleccione Guardar para guardar la regla o Guardar y salir para guardar la regla y volver a la página Alertas.
Después de crear la regla, puede crear una notificación para ella. Para obtener más información sobre las notificaciones, consulte Administración de notificaciones de alerta.
Reglas unidimensionales y multidimensionales
En el caso de las reglas de alerta administradas por Grafana, puede crear una regla con una condición clásica o puede crear una regla multidimensional.
Regla unidimensional única (condición clásica)
Utilice una expresión de condición clásica para crear una regla que inicie una alerta única cuando se cumpla su condición. En el caso de una consulta que devuelve varias series, Grafana no hace un seguimiento del estado de alerta de cada serie. Como resultado, Grafana envía una sola alerta incluso cuando se cumplen las condiciones de alerta para varias series.
Para obtener más información sobre cómo dar formato a las expresiones, consulte Expressions
Regla multidimensional
Para generar una instancia de alerta independiente para cada serie devuelta en la consulta, cree una regla multidimensional.
nota
Cada instancia de alerta generada por una regla multidimensional se tiene en cuenta para la cuota total de alertas. Las reglas no se evalúan cuando alcanza su cuota de alertas. Para obtener más información sobre las cuotas de reglas multidimensionales, consulte Errores de cuota alcanzada.
Para crear varias instancias a partir de una sola regla, utilice las expresiones Math
, Reduce
o Resample
para crear una regla multidimensional. Por ejemplo, puede hacer lo siguiente:
-
Agregue una expresión
Reduce
para cada consulta a fin de agregar los valores del intervalo de tiempo seleccionado en un solo valor. (No es necesario para las reglas que utilizan datos numéricos). -
Agregue una expresión
Math
con la condición de la regla. Esto no es necesario si una consulta o una expresión de reducción ya devuelven 0 si la regla no debe iniciar una alerta o un número positivo si debe iniciar una alerta.Presentamos algunos ejemplos:
-
$B > 70
si debe iniciar una alerta en caso de que el valor de la consulta o expresión B sea superior a 70. -
$B < $C * 100
en caso de que deba iniciar una alerta si el valor de B es menor que el valor de C multiplicado por 100. Si las consultas que se comparan tienen varias series en sus resultados, las series de consultas diferentes coinciden si tienen las mismas etiquetas o si una es un subconjunto de la otra.
-
nota
Grafana no admite consultas de alertas con variables de plantilla. Hay más información disponible en la página de la comunidad Template variables are not supported in alert queries while setting up Alert
Consideraciones sobre el rendimiento de las reglas multidimensionales
Cada instancia de alerta se tiene en cuenta para la cuota de alertas. Las reglas multidimensionales que crean más instancias de las que se pueden incluir en la cuota de alertas no se evalúan y devuelven un error de cuota. Para obtener más información, consulte Errores de cuota alcanzada.
Las alertas multidimensionales pueden tener un gran impacto en el rendimiento de su espacio de trabajo de Grafana, así como en el rendimiento de sus orígenes de datos, ya que Grafana las consulta para evaluar sus reglas de alerta. Las siguientes consideraciones pueden resultarle útiles a la hora de optimizar el rendimiento de su sistema de supervisión.
-
Frecuencia de evaluación de las reglas: la propiedad Evaluar cada de una regla de alerta controla la frecuencia de la evaluación de las reglas. Le recomendamos que utilice la frecuencia de evaluación más baja aceptable.
-
Cardinalidad del conjunto de resultados: el número de instancias de alerta que se crean con una regla afecta a su rendimiento. Supongamos que está supervisando los errores de respuesta de la API en todas las rutas de la API y en todas las máquinas virtuales de su flota. Este conjunto tiene una cardinalidad del número de rutas multiplicado por el número de. VMs Para reducir la cardinalidad del conjunto de resultados, por ejemplo, puede supervisar el total de errores por máquina virtual en lugar de por ruta por máquina virtual.
-
Complejidad de la consulta: las consultas que los orígenes de datos pueden procesar y responder rápidamente consumen menos recursos. Si bien esta consideración es menos importante que las demás consideraciones enumeradas anteriormente, si las ha reducido en la medida de lo posible, analizar el rendimiento de las consultas individuales podría marcar la diferencia. Debe ser consciente del impacto sobre el rendimiento que la evaluación de estas reglas tiene en sus orígenes de datos. La gran mayoría de las consultas gestionadas por las bases de datos de supervisión suelen ser consultas de alertas, por lo que se ven afectadas por los mismos factores de carga que afectan a la instancia de Grafana.
Errores de cuota alcanzada
Hay una cuota del número de instancias de alerta que puede tener en un único espacio de trabajo. Cuando alcance ese número, ya no podrá crear nuevas reglas de alerta en ese espacio de trabajo. Con las alertas multidimensionales, el número de instancias de alerta puede variar con el tiempo.
Es importante recordar lo siguiente al trabajar con instancias de alerta.
-
Si solo crea reglas unidimensionales, cada regla es una instancia de alerta única. Puede crear el mismo número de reglas en un único espacio de trabajo que su cuota de instancias de alerta, no más.
-
Las reglas multidimensionales crean varias instancias de alerta; sin embargo, el número no se conoce hasta que se evalúan. Por ejemplo, si creas una regla de alerta que rastrea el uso de la CPU de tus EC2 instancias de Amazon, puede que haya 50 EC2 instancias cuando la crees (y, por lo tanto, 50 instancias de alerta), pero si agregas 10 EC2 instancias más una semana después, la siguiente evaluación tendrá 60 instancias de alerta.
El número de instancias de alerta se evalúa al crear una alerta multidimensional y no se puede crear una que le haga superar inmediatamente la cuota de instancias de alerta. Como el número de instancias de alerta puede cambiar, la cuota se comprueba cada vez que se evalúan las reglas.
-
En el momento de la evaluación de las reglas, si una regla hace que supere su cuota de instancias de alerta, esa regla no se evaluará hasta que se actualice la regla de alerta para situar el recuento total de instancias de alerta por debajo de la cuota de servicio. Cuando esto ocurre, recibe una notificación de alerta en la que se le informa de que se ha alcanzado su cuota (la notificación utiliza la política de notificaciones de la regla que se está evaluando). La notificación incluye una anotación
Error
con el valorQuotaReachedError
. -
Una regla que provoca un error
QuotaReachedError
deja de evaluarse. La evaluación solo se reanuda cuando se efectúa una actualización y la evaluación posterior a la actualización no provoca por sí sola un errorQuotaReachedError
. Una regla que no se está evaluando muestra el error Cuota alcanzada en la consola de Grafana. -
Para reducir el número de instancias de alerta, puede eliminar las reglas de alerta o editar las alertas multidimensionales para tener menos instancias de alerta (por ejemplo, tener una alerta de errores por máquina virtual, en lugar de una alerta de error por API en una máquina virtual).
-
Para reanudar las evaluaciones, actualice la alerta y guárdela. Puede actualizarla para reducir el número de instancias de alerta o, si ha aplicado otros cambios para reducir el número de instancias de alerta, puede guardarla sin cambios. Si es posible, se reanudará. Si provoca otro error
QuotaReachedError
, no podrá guardarla. -
Cuando se guarda una alerta y se reanuda la evaluación sin superar la cuota de alertas, el error Cuota alcanzada puede seguir apareciendo en la consola de Grafana durante algún tiempo (hasta su intervalo de evaluación). Sin embargo, la evaluación de la regla de alerta comienza y las alertas se envían si se alcanza el umbral de la regla.
-
Para obtener más información sobre la cuota de alertas, así como sobre otras cuotas, consulte Cuotas de servicio de Amazon Managed Grafana.
Gestión de casos de error o ausencia de datos
Elija opciones para gestionar el comportamiento de las alertas en ausencia de datos o cuando haya errores.
En la siguiente tabla, se muestran las opciones para gestionar la ausencia de datos.
Opción Sin datos | Comportamiento |
---|---|
Sin datos |
Cree una alerta |
Alertas |
Defina el estado de la regla de alerta en |
OK (Correcto) |
Defina el estado de la regla de alerta en |
En la siguiente tabla, se muestran las opciones para gestionar los casos de error.
Opción de error o tiempo de espera | Comportamiento |
---|---|
Alertas |
Defina el estado de la regla de alerta en |
OK (Correcto) |
Defina el estado de la regla de alerta en |
Error |
Cree una alerta |