Use CloudWatch métricas para monitorar os recursos do Amazon Managed Service for Prometheus - Amazon Managed Service para Prometheus

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Use CloudWatch métricas para monitorar os recursos do Amazon Managed Service for Prometheus

O Amazon Managed Service para Prometheus vende métricas de uso para. CloudWatch Essas métricas fornecem visibilidade sobre a utilização do seu workspace. As métricas vendidas podem ser encontradas nos AWS/Prometheus namespaces AWS/Usage e em. CloudWatch Essas métricas estão disponíveis CloudWatch gratuitamente. Para obter mais informações sobre métricas de uso, consulte métricas CloudWatch de uso.

CloudWatch nome da métrica Nome do recurso CloudWatch namespace Descrição

ResourceCount

IngestionRate

AWS/Usage

Taxa de ingestão da amostra

Unidades: contagem por segundo

Estatísticas válidas: média, mínimo, máximo, soma

ResourceCount

ActiveSeries

AWS/Usage

Número de séries ativas por workspace

Unidade: contagem

Estatísticas válidas: média, mínimo, máximo, soma

ResourceCount

ActiveAlerts

AWS/Usage

Número de alertas ativos por workspace

Unidade: contagem

Estatísticas válidas: média, mínimo, máximo, soma

ResourceCount

SizeOfAlerts

AWS/Usage

Tamanho total de todos os alertas no espaço de trabalho, em bytes

Unidades: bytes

Estatísticas válidas: média, mínimo, máximo, soma

ResourceCount

SuppressedAlerts

AWS/Usage

Número de alertas em estado suprimido por espaço de trabalho. Um alerta pode ser suprimido por um silêncio ou uma inibição.

Unidade: contagem

Estatísticas válidas: média, mínimo, máximo, soma

ResourceCount

UnprocessedAlerts

AWS/Usage

Número de alertas em estado não processado por espaço de trabalho. Um alerta fica em estado não processado depois de recebido AlertManager, mas aguarda a próxima avaliação do grupo de agregação.

Unidade: contagem

Estatísticas válidas: média, mínimo, máximo, soma

ResourceCount

AllAlerts

AWS/Usage

Número de alertas em qualquer estado por espaço de trabalho.

Unidade: contagem

Estatísticas válidas: média, mínimo, máximo, soma

AlertManagerAlertsReceived

-

AWS/Prometheus

Total de alertas bem-sucedidos recebidos pelo gerenciador de alertas

Unidade: contagem

Estatísticas válidas: média, mínimo, máximo, soma

AlertManagerNotificationsFailed

-

AWS/Prometheus

Número de entregas de alertas com falha

Unidade: contagem

Estatísticas válidas: média, mínimo, máximo, soma

AlertManagerNotificationsThrottled

-

AWS/Prometheus

Número de alertas com controle de utilização

Unidade: contagem

Estatísticas válidas: média, mínimo, máximo, soma

DiscardedSamples*

-

AWS/Prometheus

Número de amostras descartadas por motivo

Unidade: contagem

Estatísticas válidas: média, mínimo, máximo, soma

RuleEvaluations

-

AWS/Prometheus

Número total de avaliações de regras

Unidade: contagem

Estatísticas válidas: média, mínimo, máximo, soma

RuleEvaluationFailures

-

AWS/Prometheus

Número de falhas na avaliação de regras no intervalo

Unidade: contagem

Estatísticas válidas: média, mínimo, máximo, soma

RuleGroupIterationsMissed

-

AWS/Prometheus

Número de iterações de grupos de regras perdidas no intervalo.

Unidade: contagem

Estatísticas válidas: média, mínimo, máximo, soma

*Alguns dos motivos que fazem com que as amostras sejam descartadas são os seguintes.

Motivo

Significado

greater_than_max_sample_age

Descartar amostras com mais de uma hora.

new-value-for-timestamp

As amostras duplicadas são enviadas com um registro de data e hora diferente do registrado anteriormente.

per_metric_series_limit

O usuário atingiu o limite ativo da série por métrica.

per_user_series_limit

O usuário atingiu o limite total do número de séries ativas.

rate_limited

Taxa de ingestão limitada.

sample-out-of-order

As amostras são enviadas fora de ordem e não podem ser processadas.

label_value_too_long

O valor do rótulo é maior do que o limite permitido de caracteres.

max_label_names_per_series

O usuário atingiu os nomes dos rótulos por métrica.

missing_metric_name

O nome da métrica não é fornecido.

metric_name_invalid

Nome de métrica inválido fornecido.

label_invalid

Etiqueta inválida fornecida.

duplicate_label_names

Nomes de etiquetas duplicados fornecidos.

nota

Uma métrica inexistente ou ausente é o mesmo que o valor dessa métrica ser 0.

nota

RuleGroupIterationsMissed, RuleEvaluations e RuleEvaluationFailures têm a dimensão RuleGroup da seguinte estrutura:

RuleGroupNamespace;RuleGroup

Definindo um CloudWatch alarme nas métricas vendidas do Prometheus

Você pode monitorar o uso dos recursos do Prometheus usando alarmes. CloudWatch

Para definir um alarme para o número de ActiveSeriesem Prometheus
  1. Escolha a guia Métricas representadas graficamente e role para baixo até o ActiveSeriesrótulo.

    Na visualização de Métricas gráficas, somente as métricas que estão sendo ingeridas no momento aparecerão.

  2. Escolha o ícone de notificação na coluna Ações.

  3. Em Especificar métrica e condições, insira a condição limite no campo Valor das condições e escolha Avançar.

  4. Em Configurar ações, selecione um tópico existente do SNS ou crie um novo tópico do SNS para o qual enviar a notificação.

  5. Em Adicionar nome e descrição, adicione o nome do alarme e uma descrição opcional.

  6. Selecione Criar alarme.