Visão geral - Amazon Managed Grafana

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Visão geral

Este tópico de documentação foi desenvolvido para espaços de trabalho do Grafana que oferecem suporte à versão 10.x do Grafana.

Para espaços de trabalho do Grafana que suportam a versão 9.x do Grafana, consulte. Trabalhando na versão 9 do Grafana

Para espaços de trabalho do Grafana que suportam a versão 8.x do Grafana, consulte. Trabalhando na versão 8 da Grafana

Se você está apenas começando ou é um usuário mais experiente do Grafana Alerting, saiba mais sobre os fundamentos e os recursos disponíveis que ajudam você a criar, gerenciar e responder aos alertas; e melhore a capacidade da sua equipe de resolver problemas rapidamente.

Princípios

Nos sistemas de alerta baseados no Prometheus, você tem um gerador de alertas que cria alertas e um receptor de alertas que recebe alertas. Por exemplo, o Prometheus é um gerador de alertas e é responsável por avaliar as regras de alerta, enquanto o Alertmanager é um receptor de alertas e é responsável por agrupar, inibir, silenciar e enviar notificações sobre disparos e alertas resolvidos.

O Grafana Alerting é baseado no modelo Prometheus de projetar sistemas de alerta. Ele tem um gerador de alertas interno responsável por programar e avaliar as regras de alerta, bem como um receptor interno de alertas responsável por agrupar, inibir, silenciar e enviar notificações. O Grafana não usa o Prometheus como gerador de alertas porque o Grafana Alerting precisa funcionar com muitas outras fontes de dados além do Prometheus. No entanto, ele usa o Alertmanager como receptor de alertas.

Os alertas são enviados ao receptor de alertas, onde são roteados, agrupados, inibidos, silenciados e notificados. No Grafana Alerting, o receptor de alerta padrão é o Alertmanager incorporado ao Grafana e é conhecido como Grafana Alertmanager. No entanto, você também pode usar outros gerenciadores de alertas, chamados de gerenciadores de alertas externos.

Fundamentos

A seguir, é apresentada uma visão geral das diferentes partes do alerta da Grafana.

Regras de alerta

Uma regra de alerta é um conjunto de critérios que determinam quando um alerta deve ser disparado. Ele consiste em uma ou mais consultas e expressões, uma condição que precisa ser atendida, um intervalo que determina a frequência com que a regra de alerta é avaliada e um período durante o qual a condição deve ser atendida para que um alerta seja acionado.

As regras de alerta são avaliadas em seu intervalo, e cada regra de alerta pode ter zero, um ou qualquer número de alertas disparados por vez. O estado da regra de alerta é determinado pelo nível de severe alerta máximo, que pode ser Normal, Pendente ou Disparador. Por exemplo, se pelo menos um dos alertas de uma regra de alerta estiver sendo acionado, a regra de alerta também será acionada. A integridade de uma regra de alerta é determinada pelo status de sua avaliação mais recente. Eles podem ser OK, Erro NoData e.

Um recurso muito importante das regras de alerta é que elas oferecem suporte a anotações e rótulos personalizados. Isso permite que você instrumente alertas com metadados adicionais, como resumos e descrições, e adicione rótulos adicionais para direcionar alertas para políticas de notificação específicas.

Alertas

Os alertas são identificados exclusivamente por conjuntos de pares de chave/valor chamados de rótulos. Cada chave é um nome de rótulo e cada valor é um valor de rótulo. Por exemplo, um alerta pode ter os rótulos foo=bar e outro alerta pode ter os rótulosfoo=baz. Um alerta pode ter vários rótulos, comofoo=bar,bar=baz, mas não pode ter o mesmo rótulo duas vezes, comofoo=bar,foo=baz. Dois alertas também não podem ter os mesmos rótulos e, se dois alertas tiverem os mesmos rótulos, como “foo=bar,bar=baze”foo=bar,bar=baz, um dos alertas será descartado. Os alertas são resolvidos quando a condição na regra de alerta não é mais atendida ou a regra de alerta é excluída.

Nos Alertas Gerenciados da Grafana, os alertas podem estar nos estados Normal, Pendente, Alerta, Sem Dados ou Erro. Nos alertas gerenciados da fonte de dados, como Mimir e Loki, os alertas podem estar em Normal, Pendente e Alerta, mas não NoData em Erro.

Pontos de contato

Os pontos de contato determinam para onde as notificações são enviadas. Por exemplo, você pode ter um ponto de contato que envia notificações para um endereço de e-mail, para o Slack, para um sistema de gerenciamento de incidentes (IRM), como OnCall Grafana ou Pagerduty, ou para um webhook.

As notificações enviadas pelos pontos de contato podem ser personalizadas usando modelos de notificação. Você pode usar modelos de notificação para alterar o título, a mensagem e a estrutura da notificação. Os modelos de notificação não são específicos para integrações ou pontos de contato individuais.

Políticas de notificação

As políticas de notificação agrupam alertas e os encaminham para os pontos de contato. Eles determinam quando as notificações são enviadas e com que frequência as notificações devem ser repetidas.

Os alertas são combinados com as políticas de notificação usando marcadores. Essas são expressões legíveis por humanos que afirmam se os rótulos do alerta coincidem exatamente, não correspondem exatamente, contêm ou não contêm algum texto esperado. Por exemplo, o combinador foo=bar combina alertas com o rótulo, foo=bar enquanto o combinador foo=~[a-zA-Z]+ combina alertas com qualquer rótulo chamado foo com um valor que corresponde à expressão regular. [a-zA-Z]+

Por padrão, um alerta só pode corresponder a uma política de notificação. No entanto, com o continue recurso, os alertas podem ser feitos para corresponder a qualquer número de políticas de notificação ao mesmo tempo. Para obter mais informações sobre políticas de notificação, consulte Políticas de notificação.

Silêncios e horários de silenciamento

Os silêncios e os horários de silenciamento permitem que você pause as notificações de alertas específicos ou até mesmo de políticas de notificação completas. Use o silêncio para pausar as notificações de forma específica, por exemplo, enquanto trabalha na correção de um alerta; e use os horários de silêncio para pausar as notificações em intervalos regulares, como durante janelas de manutenção programadas regularmente.