Use CloudWatch métricas para monitorar os recursos do Amazon Managed Service for Prometheus

O Amazon Managed Service para Prometheus vende métricas de uso para. CloudWatch Essas métricas fornecem visibilidade sobre a utilização do seu workspace. As métricas vendidas podem ser encontradas nos AWS/Prometheus namespaces AWS/Usage e em. CloudWatch Essas métricas estão disponíveis CloudWatch gratuitamente. Para obter mais informações sobre métricas de uso, consulte métricas CloudWatch de uso.

CloudWatch nome da métrica	Nome do recurso	CloudWatch namespace	Descrição
ResourceCount	IngestionRate	`AWS/Usage`	Taxa de ingestão da amostra Unidades: contagem por segundo Estatísticas válidas: média, mínimo, máximo, soma
ResourceCount	ActiveSeries	`AWS/Usage`	Número de séries ativas por workspace Unidade: contagem Estatísticas válidas: média, mínimo, máximo, soma
ResourceCount	ActiveAlerts	`AWS/Usage`	Número de alertas ativos por workspace Unidade: contagem Estatísticas válidas: média, mínimo, máximo, soma
ResourceCount	SizeOfAlerts	`AWS/Usage`	Tamanho total de todos os alertas no espaço de trabalho, em bytes Unidades: bytes Estatísticas válidas: média, mínimo, máximo, soma
ResourceCount	SuppressedAlerts	`AWS/Usage`	Número de alertas em estado suprimido por espaço de trabalho. Um alerta pode ser suprimido por um silêncio ou uma inibição. Unidade: contagem Estatísticas válidas: média, mínimo, máximo, soma
ResourceCount	UnprocessedAlerts	`AWS/Usage`	Número de alertas em estado não processado por espaço de trabalho. Um alerta fica em estado não processado depois de recebido AlertManager, mas aguarda a próxima avaliação do grupo de agregação. Unidade: contagem Estatísticas válidas: média, mínimo, máximo, soma
ResourceCount	AllAlerts	`AWS/Usage`	Número de alertas em qualquer estado por espaço de trabalho. Unidade: contagem Estatísticas válidas: média, mínimo, máximo, soma
AlertManagerAlertsReceived	-	`AWS/Prometheus`	Total de alertas bem-sucedidos recebidos pelo gerenciador de alertas Unidade: contagem Estatísticas válidas: média, mínimo, máximo, soma
AlertManagerNotificationsFailed	-	`AWS/Prometheus`	Número de entregas de alertas com falha Unidade: contagem Estatísticas válidas: média, mínimo, máximo, soma
AlertManagerNotificationsThrottled	-	`AWS/Prometheus`	Número de alertas com controle de utilização Unidade: contagem Estatísticas válidas: média, mínimo, máximo, soma
DiscardedSamples^*	-	`AWS/Prometheus`	Número de amostras descartadas por motivo Unidade: contagem Estatísticas válidas: média, mínimo, máximo, soma
RuleEvaluations	-	`AWS/Prometheus`	Número total de avaliações de regras Unidade: contagem Estatísticas válidas: média, mínimo, máximo, soma
RuleEvaluationFailures	-	`AWS/Prometheus`	Número de falhas na avaliação de regras no intervalo Unidade: contagem Estatísticas válidas: média, mínimo, máximo, soma
RuleGroupIterationsMissed	-	`AWS/Prometheus`	Número de iterações de grupos de regras perdidas no intervalo. Unidade: contagem Estatísticas válidas: média, mínimo, máximo, soma

^*Alguns dos motivos que fazem com que as amostras sejam descartadas são os seguintes.

Motivo	Significado
greater_than_max_sample_age	Descartar amostras com mais de uma hora.
new-value-for-timestamp	As amostras duplicadas são enviadas com um registro de data e hora diferente do registrado anteriormente.
per_metric_series_limit	O usuário atingiu o limite ativo da série por métrica.
per_user_series_limit	O usuário atingiu o limite total do número de séries ativas.
rate_limited	Taxa de ingestão limitada.
sample-out-of-order	As amostras são enviadas fora de ordem e não podem ser processadas.
label_value_too_long	O valor do rótulo é maior do que o limite permitido de caracteres.
max_label_names_per_series	O usuário atingiu os nomes dos rótulos por métrica.
missing_metric_name	O nome da métrica não é fornecido.
metric_name_invalid	Nome de métrica inválido fornecido.
label_invalid	Etiqueta inválida fornecida.
duplicate_label_names	Nomes de etiquetas duplicados fornecidos.

nota

Uma métrica inexistente ou ausente é o mesmo que o valor dessa métrica ser 0.

nota

RuleGroupIterationsMissed, RuleEvaluations e RuleEvaluationFailures têm a dimensão RuleGroup da seguinte estrutura:

RuleGroupNamespace;RuleGroup

Definindo um CloudWatch alarme nas métricas vendidas do Prometheus

Você pode monitorar o uso dos recursos do Prometheus usando alarmes. CloudWatch

Para definir um alarme para o número de ActiveSeriesem Prometheus

Escolha a guia Métricas representadas graficamente e role para baixo até o ActiveSeriesrótulo.

Na visualização de Métricas gráficas, somente as métricas que estão sendo ingeridas no momento aparecerão.
Escolha o ícone de notificação na coluna Ações.
Em Especificar métrica e condições, insira a condição limite no campo Valor das condições e escolha Avançar.
Em Configurar ações, selecione um tópico existente do SNS ou crie um novo tópico do SNS para o qual enviar a notificação.
Em Adicionar nome e descrição, adicione o nome do alarme e uma descrição opcional.
Selecione Criar alarme.

Atenção O Javascript está desativado ou não está disponível no seu navegador.

Para usar a documentação da AWS, o Javascript deve estar ativado. Consulte as páginas de Ajuda do navegador para obter instruções.

Convenções do documento

Monitorando espaços de trabalho

CloudWatch Registros