Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Usa i CloudWatch parametri per monitorare le risorse di Amazon Managed Service for Prometheus
Amazon Managed Service for Prometheus fornisce metriche di utilizzo a. CloudWatch Questi parametri forniscono visibilità sull'utilizzo dell'area di lavoro. Le metriche fornite sono disponibili nei namespace e in. AWS/Usage
AWS/Prometheus
CloudWatch Queste metriche sono disponibili gratuitamente. CloudWatch Per ulteriori informazioni sulle metriche di utilizzo, consulta Metriche di CloudWatch utilizzo.
CloudWatch nome della metrica | Nome risorsa | CloudWatch spazio dei nomi | Descrizione |
---|---|---|---|
ResourceCount |
IngestionRate |
|
Frequenza di acquisizione del campione Unità: conta al secondo Statistiche valide: Average (Media), Minimum (Minimo), Maximum (Massimo), Sum (Somma) |
ResourceCount |
ActiveSeries |
|
Numero di serie attive per area di lavoro Unità: conteggio Statistiche valide: Average (Media), Minimum (Minimo), Maximum (Massimo), Sum (Somma) |
ResourceCount |
ActiveAlerts |
|
Numero di avvisi attivi per area di lavoro Unità: conteggio Statistiche valide: Average (Media), Minimum (Minimo), Maximum (Massimo), Sum (Somma) |
ResourceCount |
SizeOfAlerts |
|
Dimensione totale di tutti gli avvisi nell'area di lavoro, in byte Unità: byte Statistiche valide: Average (Media), Minimum (Minimo), Maximum (Massimo), Sum (Somma) |
ResourceCount |
SuppressedAlerts |
|
Numero di avvisi in stato soppresso per area di lavoro. Un avviso può essere soppresso mediante un silenzio o un'inibizione. Unità: conteggio Statistiche valide: Average (Media), Minimum (Minimo), Maximum (Massimo), Sum (Somma) |
ResourceCount |
UnprocessedAlerts |
|
Numero di avvisi in stato non elaborato per area di lavoro. Un avviso è in stato non elaborato una volta ricevuto da AlertManager, ma è in attesa della successiva valutazione del gruppo di aggregazione. Unità: conteggio Statistiche valide: Average (Media), Minimum (Minimo), Maximum (Massimo), Sum (Somma) |
ResourceCount |
AllAlerts |
|
Numero di avvisi in qualsiasi stato per area di lavoro. Unità: conteggio Statistiche valide: Average (Media), Minimum (Minimo), Maximum (Massimo), Sum (Somma) |
AlertManagerAlertsReceived |
- |
|
Totale degli avvisi ricevuti con successo dal gestore degli avvisi Unità: conteggio Statistiche valide: Average (Media), Minimum (Minimo), Maximum (Massimo), Sum (Somma) |
AlertManagerNotificationsFailed |
- |
|
Numero di consegne di avvisi non andate a buon fine Unità: conteggio Statistiche valide: Average (Media), Minimum (Minimo), Maximum (Massimo), Sum (Somma) |
AlertManagerNotificationsThrottled |
- |
|
Numero di avvisi limitati Unità: conteggio Statistiche valide: Average (Media), Minimum (Minimo), Maximum (Massimo), Sum (Somma) |
DiscardedSamples* |
- |
|
Numero di campioni scartati per motivo Unità: conteggio Statistiche valide: Average (Media), Minimum (Minimo), Maximum (Massimo), Sum (Somma) |
RuleEvaluations |
- |
|
Numero totale di valutazioni delle regole Unità: conteggio Statistiche valide: Average (Media), Minimum (Minimo), Maximum (Massimo), Sum (Somma) |
RuleEvaluationFailures |
- |
|
Numero di errori di valutazione delle regole nell'intervallo Unità: conteggio Statistiche valide: Average (Media), Minimum (Minimo), Maximum (Massimo), Sum (Somma) |
RuleGroupIterationsMissed |
- |
|
Numero di iterazioni del gruppo di regole mancate nell'intervallo. Unità: conteggio Statistiche valide: Average (Media), Minimum (Minimo), Maximum (Massimo), Sum (Somma) |
* Alcuni dei motivi che causano l'eliminazione dei campioni sono i seguenti.
Motivo |
Significato |
---|---|
greater_than_max_sample_age |
Eliminare campioni più vecchi di un'ora. |
new-value-for-timestamp |
I campioni duplicati vengono inviati con un timestamp diverso da quello registrato in precedenza. |
per_metric_series_limit |
L'utente ha raggiunto il limite delle serie attive per metrica. |
per_user_series_limit |
L'utente ha raggiunto il limite totale di serie attive. |
rate_limited |
Tasso di ingestione limitato. |
sample-out-of-order |
I campioni vengono inviati fuori servizio e non possono essere elaborati. |
label_value_too_long |
Il valore dell'etichetta è superiore al limite di caratteri consentito. |
max_label_names_per_series |
L'utente ha raggiunto i nomi delle etichette per metrica. |
missing_metric_name |
Il nome della metrica non è fornito. |
metric_name_invalid |
Nome metrico fornito non valido. |
label_invalid |
Etichetta fornita non valida. |
duplicate_label_names |
Sono stati forniti nomi di etichetta duplicati. |
Nota
Un parametro non esistente o mancante è uguale al valore di quella metrica pari a 0.
Nota
RuleGroupIterationsMissed
, RuleEvaluations
e RuleEvaluationFailures
hanno la RuleGroup
dimensione della seguente struttura:
RuleGroupNamespace
;RuleGroup
Impostazione di un CloudWatch allarme su Prometheus vended metrics
È possibile monitorare l'utilizzo delle risorse di Prometheus utilizzando gli allarmi. CloudWatch
Per impostare un allarme sul numero di ActiveSeriesPrometheus
-
Scegli la scheda Metriche grafiche e scorri verso il basso fino all'etichetta. ActiveSeries
Nella vista Parametri grafici, verranno visualizzati solo i parametri attualmente in fase di importazione.
-
Scegli l'icona di notifica nella colonna Azioni.
-
In Specificare parametri e condizioni, inserisci la condizione di soglia nel campo Valore condizioni e scegli Avanti.
-
In Configura azioni, seleziona un argomento SNS esistente o crea un nuovo argomento SNS a cui inviare la notifica.
-
In Aggiungi nome e descrizione, aggiungi il nome dell'allarme e una descrizione facoltativa.
-
Scegli Crea allarme.