Nozioni fondamentali sugli avvisi - Grafana gestito da Amazon

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Nozioni fondamentali sugli avvisi

Questo argomento della documentazione è progettato per le aree di lavoro Grafana che supportano la versione 8.x di Grafana.

Per le aree di lavoro Grafana che supportano la versione 10.x di Grafana, vedere. Funzionamento nella versione 10 di Grafana

Per le aree di lavoro Grafana che supportano la versione 9.x di Grafana, vedere. Lavorare nella versione 9 di Grafana

Questa sezione fornisce informazioni sui concetti fondamentali degli avvisi Grafana.

Concetti relativi agli avvisi

La tabella seguente descrive i concetti chiave degli avvisi Grafana.

Concetto o funzionalità chiave Definizione

Fonti di dati per gli avvisi

Seleziona le fonti di dati da cui desideri interrogare e visualizzare metriche, log e tracce.

Pianificatore

Valuta le regole di avviso, il componente che esegue periodicamente interrogazioni sulle fonti di dati. È applicabile solo alle regole gestite da Grafana.

Gestore degli avvisi

Gestisce il routing e il raggruppamento delle istanze di avviso.

Regola di avviso

Una serie di criteri di valutazione per stabilire quando una regola di avviso deve essere attivata. Una regola di avviso è costituita da una o più interrogazioni ed espressioni, da una condizione, dalla frequenza di valutazione e dalla durata della soddisfazione della condizione. Una regola di avviso può generare più istanze di avviso.

Istanza di avviso

Un'istanza di avviso è un'istanza di una regola di avviso. Una regola di avviso monodimensionale ha un'istanza di avviso. Una regola di avviso multidimensionale ha una o più istanze di avviso. Una singola regola di avviso che corrisponde a più risultati, ad esempio CPU rispetto a 10 macchine virtuali, viene contata come istanze di avviso multiple (in questo caso 10). Questo numero può variare nel tempo. Ad esempio, una regola di avviso che monitora l'utilizzo della CPU per tutte le macchine virtuali di un sistema prevede più istanze di avviso man mano che vengono aggiunte macchine virtuali. Per ulteriori informazioni sulle quote di istanze di avviso, vedere. Errori relativi alla quota raggiunta

Gruppo di avvisi

Alertmanager raggruppa le istanze di avviso per impostazione predefinita utilizzando le etichette per la politica di notifica principale. Questo controlla la deduplicazione e i gruppi di istanze di avviso che vengono inviate ai punti di contatto.

Punto di contatto

Definisci in che modo i tuoi contatti vengono avvisati quando viene attivata una regola di avviso.

Modello di messaggio

Crea modelli personalizzati riutilizzabili e usali nei punti di contatto.

Politica di notifica

Set di regole per dove, quando e come gli avvisi vengono raggruppati e indirizzati ai punti di contatto.

Etichette e abbinatori di etichette

Le etichette identificano in modo univoco le regole di avviso. Collegano le regole di avviso alle politiche e ai silenzi di notifica, determinando quale politica deve gestirle e quali regole di avviso devono essere silenziate.

Silenzi

Blocca le notifiche provenienti da una o più istanze di avviso. La differenza tra un intervallo di silenzio e uno di silenziamento è che il silenzio dura per un periodo di tempo specificato, in cui il tempo di silenziamento avviene in base a una pianificazione ricorrente. Utilizza gli abbinatori di etichette per silenziare le istanze di avviso.

Tempi di silenziamento

Specificate un intervallo di tempo in cui non desiderate che vengano generate o inviate nuove notifiche. È possibile bloccare le notifiche di avviso per periodi di tempo ricorrenti, ad esempio durante un periodo di manutenzione. Deve essere collegato a una politica di notifica esistente.

Avvisa le fonti di dati

Gli avvisi gestiti di Grafana interrogano le seguenti fonti di dati di backend con avvisi abilitati.

  • Fonti di dati integrate o sviluppate e gestite da Grafana:Alertmanager,Graphite, Prometheus (incluso Amazon Managed Service for Prometheus),,,,,,,Loki,InfluxDB,Amazon OpenSearch Service, Google Cloud MonitoringAmazon CloudWatch, Azure Monitor e. MySQL PostgreSQL MSSQL OpenTSDB Oracle Azure Monitor

Avvisi su dati numerici

I dati numerici che non sono in un formato di serie temporale possono essere avvisati direttamente o passati a Server Side Expressions. Ciò consente una maggiore elaborazione e la conseguente efficienza all'interno dell'origine dati e può anche semplificare le regole di avviso. Quando si inviano avvisi su dati numerici anziché su dati di serie temporali, non è necessario ridurre ogni serie temporale etichettata a un unico numero. I numeri etichettati vengono invece restituiti a Grafana.

Dati tabulari

Questa funzionalità è supportata con sorgenti dati di backend che interrogano dati tabulari, incluse sorgenti dati SQL, come MySQL, Postgres, MSSQL e Oracle.

Una query con avvisi gestiti da Grafana o Server Side Expressions è considerata numerica con le seguenti fonti di dati:

  • Se l'Format ASopzione è impostata su Table nella query sull'origine dei dati.

  • Se la risposta della tabella restituita a Grafana dalla query include solo una colonna numerica (ad esempio, int, double o float) e facoltativamente colonne di stringa aggiuntive.

Se sono presenti colonne di stringhe, tali colonne diventano etichette. Il nome della colonna diventa il nome dell'etichetta e il valore di ogni riga diventa il valore dell'etichetta corrispondente. Se vengono restituite più righe, ogni riga deve essere identificata in modo univoco dalle relative etichette.

Esempio

Se hai una tabella MySQL chiamata Diskspace, come segue.

Orario Host Disk PercentFree

2021-7 giugno

web 1

/ecc

3

2021-giugno-7

web 2

/var

4

2021-7 giugno

web 3

/var

8

È possibile interrogare il filtraggio dei dati in tempo, ma senza restituire la serie temporale a Grafana. Ad esempio, un avviso che verrebbe avviato per host, disco quando c'è meno del 5% di spazio libero potrebbe avere l'aspetto seguente.

SELECT Host, Disk, CASE WHEN PercentFree < 5.0 THEN PercentFree ELSE 0 END FROM ( SELECT Host, Disk, Avg(PercentFree) FROM DiskSpace Group By Host, Disk Where __timeFilter(Time)

Questa query restituisce la seguente risposta della tabella a Grafana.

Host Disk PercentFree

web1

/ecc

3

web2

/var

4

web 3

/var

0

Quando questa query viene utilizzata come condizione in una regola di avviso, i casi in cui il valore è diverso da zero avvisano. Di conseguenza, vengono prodotte tre istanze di avviso, come illustrato nella tabella seguente.

Etichette Stato

{host=WEB1, disk=/etc}

Avviso

{host=Web2, disco=/var}

Avviso

{host=WEB3, disco=/var}

Normale

Gestore degli avvisi

Grafana include il supporto integrato per Prometheus Alertmanager. Alertmanager aiuta sia a raggruppare che a gestire le regole di avviso, aggiungendo un livello di orchestrazione oltre ai motori di avviso. Per impostazione predefinita, le notifiche per gli avvisi gestiti da Grafana vengono gestite dall'Alertmanager integrato che fa parte del core Grafana. Puoi configurare i punti di contatto, le politiche di notifica e i modelli di Alertmanager dall'interfaccia utente di avvisi Grafana selezionando l'opzione Grafana dal menu a discesa Alertmanager.

Gli avvisi Grafana supportano la configurazione esterna di Alertmanager (per ulteriori informazioni su Alertmanager come origine dati esterna, vedere). Connect a un'origine dati Alertmanager Quando aggiungi un Alertmanager esterno, il menu a discesa Alertmanager mostra un elenco di fonti di dati Alertmanager esterne disponibili. Seleziona un'origine dati per creare e gestire avvisi per sorgenti dati autonome Cortex o Loki.

Stato e integrità delle regole di avviso

Lo stato e lo stato di integrità delle regole di avviso consentono di comprendere diversi indicatori di stato chiave relativi agli avvisi. Esistono tre componenti chiave: stato di avviso, stato delle regole di avviso e integrità delle regole di avviso. Sebbene correlati, ogni componente trasmette informazioni leggermente diverse.

Stato della regola di avviso

  • Normale: nessuna delle serie temporali restituite dal motore di valutazione è in uno Firing stato Pending or.

  • In sospeso: almeno una delle serie temporali restituite dal motore di valutazione èPending.

  • Attivazione: almeno una delle serie temporali restituite dal motore di valutazione è. Firing

Stato di allerta

  • Normale: la condizione per la regola di avviso è falsa per ogni serie temporale restituita dal motore di valutazione.

  • Avviso: la condizione della regola di avviso è vera per almeno una serie temporale restituita dal motore di valutazione. La durata per la quale la condizione deve essere vera prima che venga avviato un avviso, se impostata, viene soddisfatta o è stata superata.

  • In sospeso: la condizione della regola di avviso è vera per almeno una serie temporale restituita dal motore di valutazione. La durata per la quale la condizione deve essere vera prima che venga avviato un avviso, se impostata, non è stata soddisfatta.

  • NoData— La regola di avviso non ha restituito una serie temporale, tutti i valori per le serie temporali sono nulli o tutti i valori per le serie temporali sono zero.

  • Errore: errore durante il tentativo di valutare una regola di avviso.

Integrità della regola di avviso

  • Ok: nessun errore durante la valutazione di una regola di avviso.

  • Errore: errore durante la valutazione di una regola di avviso.

  • NoData— Assenza di dati in almeno una serie temporale restituita durante la valutazione di una regola.