Trabalhando com políticas de notificação - Amazon Managed Grafana

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Trabalhando com políticas de notificação

Este tópico de documentação foi desenvolvido para espaços de trabalho do Grafana que oferecem suporte ao Grafana versão 8.x.

Para espaços de trabalho do Grafana que suportam a versão 10.x do Grafana, consulte. Trabalhando na versão 10 do Grafana

Para espaços de trabalho do Grafana que suportam a versão 9.x do Grafana, consulte. Trabalhando na versão 9 do Grafana

As políticas de notificação determinam como os alertas são encaminhados para os pontos de contato. As políticas têm uma estrutura em árvore, na qual cada política pode ter uma ou mais políticas secundárias. Cada política, exceto a política raiz, também pode corresponder a rótulos de alerta específicos. Cada alerta é avaliado pela política raiz e depois por cada política secundária. Se você habilitar a Continue matching subsequent sibling nodes opção para uma política específica, a avaliação continuará mesmo após uma ou mais correspondências. As configurações de uma política principal e as informações do ponto de contato controlam o comportamento de um alerta que não corresponde a nenhuma das políticas secundárias. Uma política raiz controla qualquer alerta que não corresponda a uma política específica.

nota

Você pode criar e editar políticas de notificação para alertas gerenciados pela Grafana. As políticas de notificação para alertas do Alertmanager são somente para leitura.

Notificações de agrupamento

O agrupamento categoriza as notificações de alerta de natureza semelhante em um único funil. Isso permite que você controle as notificações de alerta durante interrupções maiores, quando muitas partes de um sistema falham ao mesmo tempo, fazendo com que um grande número de alertas seja iniciado simultaneamente.

Exemplo de agrupamento

Suponha que você tenha 100 serviços conectados a um banco de dados em ambientes diferentes. Esses serviços são diferenciados pelo rótuloenv=environmentname. Existe uma regra de alerta para monitorar se seus serviços podem acessar o banco de dados. A regra de alerta cria alertas chamadosalertname=DatabaseUnreachable.

Se ocorrer uma partição de rede, em que metade dos seus serviços não consiga mais acessar o banco de dados, 50 alertas diferentes serão iniciados. Para essa situação, você deseja receber uma notificação de uma única página (em vez de 50) com uma lista dos ambientes afetados.

Você pode configurar o agrupamento para ser group_by: [alertname] (sem usar o env rótulo, que é diferente para cada serviço). Com essa configuração em vigor, o Grafana envia uma única notificação compacta que contém todos os ambientes afetados por essa regra de alerta.

Grupos especiais

Grafana tem dois grupos especiais. O grupo padrão group_by: null agrupa todos os alertas em um único grupo. Você também pode usar um rótulo especial chamado ... para agrupar alertas por todos os rótulos, desativando efetivamente o agrupamento e enviando cada alerta para seu próprio grupo.

Trabalhar com notificações

Os procedimentos a seguir mostram como criar e gerenciar políticas de notificação.

Para editar a política de notificação raiz
  1. No console do Grafana, no menu Grafana, escolha o ícone de Alerta (sino) para abrir a página de Alertas.

  2. Escolha políticas de notificação.

  3. No menu suspenso Alertmanager, selecione o Alertmanager que você deseja editar.

  4. Na seção Política raiz, escolha o ícone Editar (caneta).

  5. Em Ponto de contato padrão, atualize o ponto de contato para o qual as notificações devem ser enviadas para as regras quando as regras de alerta não corresponderem a nenhuma política específica.

  6. Em Agrupar por, escolha os rótulos (ou grupos especiais) pelos quais agrupar os alertas.

  7. Em Opções de temporização, selecione uma das opções a seguir.

    • Espera em grupo — Tempo de espera para armazenar alertas do mesmo grupo antes de enviar uma notificação inicial. O padrão é 30 segundos.

    • Intervalo de grupo — Intervalo mínimo de tempo entre duas notificações para um grupo. O padrão é 5 minutos.

    • Intervalo de repetição — Intervalo mínimo de tempo antes de reenviar uma notificação, caso nenhum novo alerta tenha sido adicionado ao grupo. O padrão é 4 horas.

  8. Escolha Salvar para salvar as alterações.

Para adicionar uma nova política específica de alto nível
  1. No console do Grafana, no menu Grafana, escolha o ícone de Alerta (sino) para abrir a página de Alertas.

  2. Escolha políticas de notificação.

  3. No menu suspenso Alertmanager, selecione o Alertmanager que você deseja editar.

  4. Na seção Roteamento específico, escolha Nova política específica.

  5. Na seção Rótulos correspondentes, adicione um ou mais rótulos de alerta correspondentes. Mais informações sobre a correspondência de etiquetas estão mais adiante neste tópico.

  6. No Ponto de contato, adicione o ponto de contato para enviar notificações se o alerta corresponder a essa política específica. As políticas aninhadas substituem esse ponto de contato.

  7. Opcionalmente, selecione Substituir agrupamento para especificar um agrupamento diferente da política raiz.

  8. Opcionalmente, selecione Substituir horários gerais para substituir as opções de tempo na política de notificação de grupo.

  9. Para salvar suas alterações, selecione Salvar política.

Para adicionar uma política aninhada
  1. Expanda a política específica na qual você deseja criar uma política aninhada.

  2. Escolha Adicionar política aninhada e, em seguida, adicione os detalhes (como ao adicionar uma política específica de nível superior).

  3. Para salvar suas alterações, selecione Salvar política.

Para editar uma política específica
  1. Na página Alertas, escolha Políticas de notificação para abrir a página que lista as políticas existentes.

  2. Selecione a política que você deseja editar e, em seguida, escolha o ícone Editar (caneta).

  3. Faça qualquer alteração (como ao adicionar uma política específica de nível superior).

  4. Escolha Salvar política.

Como funciona a correspondência de etiquetas

Uma política corresponde a um alerta se os rótulos do alerta corresponderem a todos os rótulos correspondentes especificados na política.

  • Rótulo — O nome do rótulo correspondente. Ele deve corresponder exatamente ao nome do rótulo do alerta.

  • Operador — O operador usado para comparar o valor do rótulo com o valor do rótulo correspondente. Os operadores disponíveis são:

    • =Selecione rótulos cujo valor corresponda exatamente à string fornecida.

    • !=Selecione rótulos cujo valor não corresponda à string fornecida.

    • =~Selecione rótulos cujo valor corresponda ao valor interpretado pelo regex da string fornecida (a string fornecida é interpretada como uma expressão regular).

    • !=Selecione rótulos que não correspondam à expressão regular fornecida.

  • Valor — O valor ao qual corresponder ao valor do rótulo. Ela pode corresponder como uma string ou como uma expressão regular, dependendo do operador escolhido.

Horários de silenciar

O tempo de silêncio é um intervalo de tempo recorrente em que nenhuma nova notificação de uma política é gerada ou enviada. Use-os para evitar que os alertas sejam acionados por um período específico e recorrente, por exemplo, um período de manutenção regular.

Assim como os silêncios, os tempos de silenciamento não impedem que as regras de alerta sejam avaliadas, nem impedem que as instâncias de alerta sejam mostradas na interface do usuário. Eles apenas impedem a criação de notificações.

Você pode configurar os tempos de mudo gerenciados pelo Grafana, bem como os horários de mudo para uma fonte de dados externa do Alertmanager.

Tempos de silêncio em comparação com silêncios

A tabela a seguir destaca as diferenças entre os tempos de mudo e os silêncios.

Tempo de silenciamento Silêncio

Usa definições de intervalo de tempo que podem ocorrer novamente

Tem um horário fixo de início e término

É criado e depois adicionado às políticas de notificação

Usa rótulos para comparar com um alerta para determinar se deve silenciar ou não

Para criar uma temporização de mudo
  1. No console do Grafana, no menu Grafana, escolha o ícone de Alerta (sino) para abrir a página de Alertas.

  2. Escolha políticas de notificação.

  3. No menu suspenso Alertmanager, selecione o Alertmanager que você deseja editar.

  4. Na seção Silenciar temporizações, escolha o botão Adicionar temporização de mudo.

  5. Escolha o intervalo de tempo ao qual você deseja aplicar o tempo de silenciamento.

  6. Escolha Enviar para criar o tempo de silenciamento.

Para adicionar um tempo de silêncio a uma política de notificação
  1. Selecione a política de notificação à qual você gostaria de adicionar o tempo de silenciamento e escolha o botão Editar.

  2. No menu suspenso Mute Timings, selecione os horários de mudo que você gostaria de adicionar à política.

    Escolha o botão Salvar política.

Intervalos de tempo

Um intervalo de tempo é uma definição para um intervalo de tempo. Se um alerta for iniciado durante esse intervalo, ele será suprimido. Os intervalos são suportados usando : (por exemplo,monday:thursday). Um tempo de silêncio pode conter vários intervalos de tempo. Um intervalo de tempo consiste em vários campos (detalhes na lista a seguir), todos os quais devem coincidir para suprimir os alertas. Por exemplo, se você especificar os dias da semana monday:friday e o intervalo de horário das 8h às 9h, os alertas serão suprimidos das 8h às 9h, de segunda a sexta-feira, mas não, por exemplo, das 8h às 9h no sábado.

  • Intervalo de tempo — A hora do dia para suprimir as notificações. Consiste em dois subcampos, Hora de início e Hora de término. Um exemplo de horário é14:30. A hora está em notação de 24 horas, em UTC.

  • Dias da semana — Os dias da semana. Pode ser um único dia, como um intervalomonday, comomonday:friday, ou uma lista de dias separada por vírgula, como. monday, tuesday, wednesday

  • Meses — Os meses a serem selecionados. Você pode especificar meses com designações numéricas ou com o nome completo do mês, por exemplo, 1 ou january ambos especificam janeiro. Você pode especificar um único mês, um intervalo de meses ou uma lista de meses separada por vírgula.

  • Dias do mês — As datas dentro de um mês. Os valores podem variar de 1 -31. Valores negativos especificam os dias do mês na ordem inversa, então -1 representa o último dia do mês. Os dias do mês podem ser especificados como um único dia, um intervalo de dias ou uma lista de dias separada por vírgula.