As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Alertas no Grafana versão 10
Este tópico de documentação foi desenvolvido para espaços de trabalho do Grafana compatíveis com o Grafana versão 10.x.
Para espaços de trabalho do Grafana compatíveis com o Grafana versão 9.x, consulte Trabalhar no Grafana versão 9.
Para espaços de trabalho do Grafana compatíveis com o Grafana versão 8.x, consulte Trabalhar no Grafana versão 8.
Com o Grafana v10, o Amazon Managed Grafana inclui acesso a um sistema de alerta atualizado, o Grafana Alerting, que centraliza as informações de alertas em uma única visualização pesquisável. O alerta do Grafana foi introduzido como um recurso opcional no Grafana v8 e GrafanaLabs anunciou a remoção do alerta legado na versão 11.
nota
Esta documentação abrange o Grafana Alerting. Para obter informações sobre alertas legados, consulte Alertas clássicos do dashboard.
O Grafana Alerting permite que você descubra os problemas nos sistemas momentos após eles ocorrerem.
Monitore os dados de métricas de entrada ou entradas de logs e configure o sistema de alertas para observar eventos ou circunstâncias específicos e, em seguida, enviar notificações quando estes forem encontrados.
Dessa forma, você elimina a necessidade de monitoramento manual e fornece uma primeira linha de defesa contra interrupções ou alterações no sistema que podem virar incidentes graves.
Ao usar o Grafana Alerting, você cria consultas e expressões de várias fontes de dados, independentemente de onde os dados estejam armazenados, dando-lhe a flexibilidade de combinar os dados e alertar sobre as métricas e os logs de maneiras novas e exclusivas. Você então pode criar, gerenciar e agir de acordo com os alertas em uma visão única e consolidada e melhorar a capacidade da sua equipe de identificar e resolver problemas rapidamente.
Com as regras de alerta do Mimir e Loki, você pode executar expressões de alerta mais perto dos dados e em grande escala, tudo isso gerenciado pela interface de usuário do Grafana com a qual você já tem familiaridade.
nota
Se você estiver migrando de uma versão anterior do Grafana, em que usou o Grafana Alerting legado, talvez seja útil ver as diferenças entre os alertas legados e o novo Grafana Alerting.
Principais atributos e benefícios
Uma página para todos os alertas
Uma única página do Grafana Alerting consolida os alertas gerenciados pelo Grafana e os alertas que residem em sua fonte de dados compatível com o Prometheus em um único local.
Alertas multidimensionais
As regras de alerta podem criar várias instâncias de alerta individuais por regra de alerta, conhecidas como alertas multidimensionais, dando-lhe a capacidade e a flexibilidade de obter visibilidade de todo o sistema com apenas uma única regra de alerta. Você faz isso adicionando rótulos à consulta para especificar qual componente está sendo monitorado e gerar várias instâncias de alerta para uma única regra de alerta. Por exemplo, se você quiser monitorar cada servidor em um cluster, um alerta multidimensional alertará em cada CPU, enquanto um alerta padrão alertará sobre o servidor geral.
Rotear alertas
Roteie cada instância de alerta para um ponto de contato específico com base nos rótulos definidos por você. As políticas de notificação são o conjunto de regras para onde, quando e como os alertas são roteados para os pontos de contato.
Silenciar alertas
Os silêncios impedem que as notificações sejam criadas e duram apenas por uma janela de tempo especificada. Os silêncios permitem que você pare de receber notificações persistentes de uma ou mais regras de alerta. Você também pode pausar parcialmente um alerta com base em determinados critérios. Os silêncios têm sua própria seção dedicada para melhor organização e visibilidade, para que você possa verificar as regras de alerta pausadas sem desorganizar a visualização principal de alertas.
Tempos de desativação de áudio
O tempo de desativação de áudio é um intervalo de tempo recorrente em que nenhuma nova notificação de uma política é gerada ou enviada. Use-o para evitar que os alertas sejam disparados por um período específico e recorrente, por exemplo, um período de manutenção regular.
Assim como os silêncios, os tempos de desativação de áudio não impedem que as regras de alerta sejam avaliadas nem impedem que as instâncias de alerta sejam mostradas na interface do usuário. Eles apenas impedem que as notificações sejam criadas.
Projetar o sistema de alertas
Monitorar sistemas de TI complexos e saber se tudo está funcionando corretamente é uma tarefa difícil. Portanto, configurar um sistema eficaz de gerenciamento de alertas é essencial para informar a você quando as coisas estiverem dando errado antes que elas comecem a afetar os resultados do seu negócio.
Projetar e definir uma configuração de gerenciamento de alertas que funcione leva tempo.
Aqui estão algumas dicas sobre como criar uma configuração eficaz de gerenciamento de alertas para a sua empresa:
Quais são as principais métricas da sua empresa que você deseja monitorar e controlar com alertas?
-
Encontre eventos de que sejam importantes ter conhecimento e que não sejam tão triviais ou frequentes que os destinatários os ignorem.
-
Os alertas só devem ser criados para grandes eventos que exijam atenção ou intervenção imediatas.
-
Considere a qualidade em vez da quantidade.
Que tipo de alerta você deseja usar?
-
Escolha entre alertas gerenciados pelo Grafana ou alertas gerenciados pelo Grafana Mimir ou Loki, ou os dois.
Como você quer organizar os alertas e as notificações?
-
Seja seletivo sobre quem você configura para receber alertas. Considere enviá-los para quem estiver de plantão ou para um canal específico do Slack.
-
Automatize o máximo possível usando a API de alertas ou alertas como código (Terraform).
Como você pode reduzir a fadiga de alerta?
-
Evite alertas ruidosos e desnecessários usando silêncios, tempos de desativação de áudio ou pausando a avaliação das regras de alerta.
-
Ajuste continuamente as regras de alerta para avaliar a eficácia. Remova as regras de alerta para evitar alertas duplicados ou ineficazes.
-
Reflita cuidadosamente sobre os níveis de prioridade e severidade.
-
Revise continuamente os limites e as regras de avaliação.
Limitações do Grafana Alerting
-
Ao agregar regras de outros sistemas, o sistema de alertas do Grafana pode recuperar regras de todas as fontes de dados disponíveis: Amazon Managed Service for Prometheus, Prometheus, Loki e Alertmanager. Talvez não seja possível buscar regras de outras fontes de dados compatíveis.