Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Alertas en la versión 10 de Grafana
Este tema de documentación está diseñado para los espacios de trabajo de Grafana que admiten la versión 10.x de Grafana.
Para los espacios de trabajo de Grafana que admiten la versión 9.x de Grafana, consulte Uso de la versión 9 de Grafana.
Para los espacios de trabajo de Grafana que admiten la versión 8.x de Grafana, consulte Uso de la versión 8 de Grafana.
Con la versión 10 de Grafana, Amazon Managed Grafana incluye acceso a un sistema de alertas actualizado, Grafana Alerting, que centraliza la información de las alertas en una única vista en la que se pueden hacer búsquedas. Grafana Alerting se presentó como una característica opcional en la versión 8 de Grafana, y GrafanaLabs ha anunciado la eliminación de las alertas antiguas en la versión 11.
nota
En esta documentación se cubre Grafana Alerting. Para obtener información sobre las alertas antiguas, consulte Alertas clásicas del panel.
Grafana Alerting le permite conocer los problemas en los sistemas, momentos después de que se producen.
Supervise los datos de las métricas entrantes o las entradas de registro y configure el sistema de alertas para detectar los eventos o las circunstancias específicos y, a continuación, enviar las notificaciones cuando se detecten.
De esta forma, se elimina la necesidad de hacer una supervisión manual y se ofrece una primera línea de defensa contra las interrupciones del sistema o los cambios que podrían convertirse en incidentes graves.
Con Grafana Alerting, crea consultas y expresiones a partir de múltiples orígenes de datos, sin importar dónde estén almacenados los datos, lo que le ofrece la flexibilidad de combinar los datos y las alertas en las métricas y los registros de manera nuevas y únicas. De este modo, podrá crear y administrar las alertas y tomar medidas al respecto desde una vista única y consolidada, y mejorar la capacidad de su equipo para identificar y resolver los problemas rápidamente.
Con las reglas de alerta de Mimir y Loki, puede ejecutar expresiones de alerta más cerca de los datos y a gran escala, todo ello administrado por la interfaz de usuario de Grafana que ya conoce.
nota
Si va a migrar desde una versión anterior de Grafana, en la que utilizaba la versión heredada de Grafana Alerting, puede que le resulte útil ver las diferencias entre las alertas heredadas y el nuevo Grafana Alerting.
Características y ventajas clave
Una página para todas las alertas
Una única página de Grafana Alerting consolida las alertas gestionadas por Grafana y las alertas que residen en su origen de datos compatible con Prometheus en un solo lugar.
Alertas multidimensionales
Las reglas de alertas pueden crear varias instancias de alerta individuales por regla de alerta, conocidas como alertas multidimensionales, lo que le ofrece la eficacia y la flexibilidad necesarias para obtener visibilidad sobre todo el sistema con una sola regla de alerta. Para ello, agregue etiquetas a la consulta para especificar qué componente se va a supervisar y genere varias instancias de alerta para una sola regla de alerta. Por ejemplo, si quiere supervisar cada servidor de un clúster, una alerta multidimensional avisará a cada CPU, mientras que una alerta estándar avisará a todo el servidor.
Alertas de ruta
Dirija cada instancia de alerta a un punto de contacto específico en función de las etiquetas que defina. Las políticas de notificaciones son el conjunto de reglas sobre dónde, cuándo y cómo se dirigen las alertas a los puntos de contacto.
Silenciar las alertas
Los silencios impiden que se creen las notificaciones y solo duran un periodo específico. Los silencios le permiten dejar de recibir notificaciones persistentes de una o varias reglas de alerta. También puede pausar parcialmente una alerta en función de ciertos criterios. Los silencios tienen su propia sección específica para una mejor organización y visibilidad, de modo que pueda analizar las reglas de alertas pausadas sin saturar la vista principal de alertas.
Temporizadores de silencio
Un temporizador de silencio es un intervalo de tiempo recurrente en el que no se generan ni envían nuevas notificaciones para una política. Úselos para evitar que las alertas se activen durante un periodo específico y recurrente, por ejemplo, un periodo de mantenimiento habitual.
Al igual que los silencios, los temporizadores de silencio no impiden que se evalúen las reglas de alerta ni impiden que las instancias de alerta se muestren en la interfaz de usuario. Solo impiden la creación de notificaciones.
Diseño de su sistema de alertas
Supervisar sistemas de TI complejos y comprender si todo funciona correctamente es una tarea difícil. Por lo tanto, establecer un sistema de administración de alertas eficaz es esencial para informarle cuando las cosas van mal antes de que empiecen a afectar a los resultados de su empresa.
Diseñar y definir una configuración de administración de alertas que funcione lleva tiempo.
Estos son algunos consejos sobre cómo crear una configuración de administración de alertas eficaz para su empresa:
¿Cuáles son las métricas clave de su empresa que quiere supervisar y sobre las que quiere emitir alertas?
-
Busque eventos que sea importante conocer y que no sean tan triviales o frecuentes como para que los destinatarios los ignoren.
-
Las alertas solo deben crearse para eventos importantes que requieran atención o intervención inmediata.
-
Considere la calidad por encima de la cantidad.
¿Qué tipo de alertas quiere utilizar?
-
Elija entre las alertas administradas por Grafana o las alertas administradas por Grafana Mimir o Loki, o ambas.
¿Cómo quiere organizar las alertas y las notificaciones?
-
Priorice la selectividad a la hora de configurar quién quiere que reciba las alertas. Considere la posibilidad de enviarlas a quien esté de guardia o a un canal de Slack específico.
-
Automatice en la medida de lo posible mediante la API de alertas o las alertas como código (Terraform).
¿Cómo puede reducir la fatiga de las alertas?
-
Evite alertas excesivas e innecesarias mediante el uso de silencios, temporizadores de silencio o pausas de la evaluación de las reglas de alerta.
-
Ajuste continuamente las reglas de alerta para comprobar su eficacia. Elimine las reglas de alerta para evitar la duplicación o las alertas ineficaces.
-
Piense detenidamente en los niveles de prioridad y gravedad.
-
Revise continuamente los umbrales y las reglas de evaluación.
Limitaciones de Grafana Alerting
-
Al agregar reglas de otros sistemas, el sistema de Grafana Alerting puede recuperar las reglas de todos los orígenes de datos disponibles de Amazon Managed Service para Prometheus, Prometheus, Loki y Alertmanager. Es posible que no pueda obtener las reglas de otros orígenes de datos compatibles.