Usa i CloudWatch parametri per monitorare le risorse di Amazon Managed Service for Prometheus - Amazon Managed Service per Prometheus

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Usa i CloudWatch parametri per monitorare le risorse di Amazon Managed Service for Prometheus

Amazon Managed Service for Prometheus fornisce metriche di utilizzo a. CloudWatch Questi parametri forniscono visibilità sull'utilizzo dell'area di lavoro. Le metriche fornite sono disponibili nei namespace e in. AWS/Usage AWS/Prometheus CloudWatch Queste metriche sono disponibili gratuitamente. CloudWatch Per ulteriori informazioni sulle metriche di utilizzo, consulta Metriche di CloudWatch utilizzo.

CloudWatch nome della metrica Nome risorsa CloudWatch spazio dei nomi Descrizione

ResourceCount

IngestionRate

AWS/Usage

Frequenza di acquisizione del campione

Unità: conta al secondo

Statistiche valide: Average (Media), Minimum (Minimo), Maximum (Massimo), Sum (Somma)

ResourceCount

ActiveSeries

AWS/Usage

Numero di serie attive per area di lavoro

Unità: conteggio

Statistiche valide: Average (Media), Minimum (Minimo), Maximum (Massimo), Sum (Somma)

ResourceCount

ActiveAlerts

AWS/Usage

Numero di avvisi attivi per area di lavoro

Unità: conteggio

Statistiche valide: Average (Media), Minimum (Minimo), Maximum (Massimo), Sum (Somma)

ResourceCount

SizeOfAlerts

AWS/Usage

Dimensione totale di tutti gli avvisi nell'area di lavoro, in byte

Unità: byte

Statistiche valide: Average (Media), Minimum (Minimo), Maximum (Massimo), Sum (Somma)

ResourceCount

SuppressedAlerts

AWS/Usage

Numero di avvisi in stato soppresso per area di lavoro. Un avviso può essere soppresso mediante un silenzio o un'inibizione.

Unità: conteggio

Statistiche valide: Average (Media), Minimum (Minimo), Maximum (Massimo), Sum (Somma)

ResourceCount

UnprocessedAlerts

AWS/Usage

Numero di avvisi in stato non elaborato per area di lavoro. Un avviso è in stato non elaborato una volta ricevuto da AlertManager, ma è in attesa della successiva valutazione del gruppo di aggregazione.

Unità: conteggio

Statistiche valide: Average (Media), Minimum (Minimo), Maximum (Massimo), Sum (Somma)

ResourceCount

AllAlerts

AWS/Usage

Numero di avvisi in qualsiasi stato per area di lavoro.

Unità: conteggio

Statistiche valide: Average (Media), Minimum (Minimo), Maximum (Massimo), Sum (Somma)

AlertManagerAlertsReceived

-

AWS/Prometheus

Totale degli avvisi ricevuti con successo dal gestore degli avvisi

Unità: conteggio

Statistiche valide: Average (Media), Minimum (Minimo), Maximum (Massimo), Sum (Somma)

AlertManagerNotificationsFailed

-

AWS/Prometheus

Numero di consegne di avvisi non andate a buon fine

Unità: conteggio

Statistiche valide: Average (Media), Minimum (Minimo), Maximum (Massimo), Sum (Somma)

AlertManagerNotificationsThrottled

-

AWS/Prometheus

Numero di avvisi limitati

Unità: conteggio

Statistiche valide: Average (Media), Minimum (Minimo), Maximum (Massimo), Sum (Somma)

DiscardedSamples*

-

AWS/Prometheus

Numero di campioni scartati per motivo

Unità: conteggio

Statistiche valide: Average (Media), Minimum (Minimo), Maximum (Massimo), Sum (Somma)

RuleEvaluations

-

AWS/Prometheus

Numero totale di valutazioni delle regole

Unità: conteggio

Statistiche valide: Average (Media), Minimum (Minimo), Maximum (Massimo), Sum (Somma)

RuleEvaluationFailures

-

AWS/Prometheus

Numero di errori di valutazione delle regole nell'intervallo

Unità: conteggio

Statistiche valide: Average (Media), Minimum (Minimo), Maximum (Massimo), Sum (Somma)

RuleGroupIterationsMissed

-

AWS/Prometheus

Numero di iterazioni del gruppo di regole mancate nell'intervallo.

Unità: conteggio

Statistiche valide: Average (Media), Minimum (Minimo), Maximum (Massimo), Sum (Somma)

* Alcuni dei motivi che causano l'eliminazione dei campioni sono i seguenti.

Motivo

Significato

greater_than_max_sample_age

Eliminare campioni più vecchi di un'ora.

new-value-for-timestamp

I campioni duplicati vengono inviati con un timestamp diverso da quello registrato in precedenza.

per_metric_series_limit

L'utente ha raggiunto il limite delle serie attive per metrica.

per_user_series_limit

L'utente ha raggiunto il limite totale di serie attive.

rate_limited

Tasso di ingestione limitato.

sample-out-of-order

I campioni vengono inviati fuori servizio e non possono essere elaborati.

label_value_too_long

Il valore dell'etichetta è superiore al limite di caratteri consentito.

max_label_names_per_series

L'utente ha raggiunto i nomi delle etichette per metrica.

missing_metric_name

Il nome della metrica non è fornito.

metric_name_invalid

Nome metrico fornito non valido.

label_invalid

Etichetta fornita non valida.

duplicate_label_names

Sono stati forniti nomi di etichetta duplicati.

Nota

Un parametro non esistente o mancante è uguale al valore di quella metrica pari a 0.

Nota

RuleGroupIterationsMissed, RuleEvaluations e RuleEvaluationFailures hanno la RuleGroup dimensione della seguente struttura:

RuleGroupNamespace;RuleGroup

Impostazione di un CloudWatch allarme su Prometheus vended metrics

È possibile monitorare l'utilizzo delle risorse di Prometheus utilizzando gli allarmi. CloudWatch

Per impostare un allarme sul numero di ActiveSeriesPrometheus
  1. Scegli la scheda Metriche grafiche e scorri verso il basso fino all'etichetta. ActiveSeries

    Nella vista Parametri grafici, verranno visualizzati solo i parametri attualmente in fase di importazione.

  2. Scegli l'icona di notifica nella colonna Azioni.

  3. In Specificare parametri e condizioni, inserisci la condizione di soglia nel campo Valore condizioni e scegli Avanti.

  4. In Configura azioni, seleziona un argomento SNS esistente o crea un nuovo argomento SNS a cui inviare la notifica.

  5. In Aggiungi nome e descrizione, aggiungi il nome dell'allarme e una descrizione facoltativa.

  6. Scegli Crea allarme.