Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Grundlagen der Alarmierung
Dieses Dokumentationsthema wurde für Grafana-Workspaces entwickelt, die Grafana-Version 8.x unterstützen.
Informationen zu Grafana-Arbeitsbereichen, die Grafana-Version 10.x unterstützen, finden Sie unter. Arbeitet in Grafana-Version 10
Informationen zu Grafana-Arbeitsbereichen, die Grafana-Version 9.x unterstützen, finden Sie unter. Arbeitet in Grafana-Version 9
Dieser Abschnitt enthält Informationen zu den grundlegenden Konzepten der Grafana-Warnung.
Konzepte der Alarmierung
In der folgenden Tabelle werden die wichtigsten Konzepte der Grafana-Warnung beschrieben.
Schlüsselkonzept oder Merkmal | Definition |
---|---|
Datenquellen für Warnmeldungen |
Wählen Sie Datenquellen aus, aus denen Sie Metriken, Logs und Traces abfragen und visualisieren möchten. |
Scheduler |
Wertet Ihre Warnungsregeln aus. Dabei handelt es sich um die Komponente, die regelmäßig Abfragen von Datenquellen ausführt. Sie gilt nur für von Grafana verwaltete Regeln. |
Alert-Manager |
Verwaltet das Routing und die Gruppierung von Alert-Instanzen. |
Warnungsregel |
Eine Reihe von Bewertungskriterien für den Zeitpunkt, an dem eine Warnregel ausgelöst werden soll. Eine Warnungsregel besteht aus einer oder mehreren Abfragen und Ausdrücken, einer Bedingung, der Häufigkeit der Auswertung und der Dauer, über die die Bedingung erfüllt wird. Eine Warnungsregel kann mehrere Warnungsinstanzen erzeugen. |
Warnungsinstanz |
Eine Warnungsinstanz ist eine Instanz einer Warnungsregel. Eine eindimensionale Warnungsregel hat eine Warnungsinstanz. Eine mehrdimensionale Warnungsregel hat eine oder mehrere Warnungsinstanzen. Eine einzelne Warnungsregel, die mehreren Ergebnissen entspricht, z. B. CPU gegen 10 VMs, wird als mehrere (in diesem Fall 10) Warnungsinstanzen gezählt. Diese Zahl kann im Laufe der Zeit variieren. Beispielsweise verfügt eine Warnungsregel, die die CPU-Auslastung für alle VMs in einem System überwacht, über mehr Warnungsinstanzen, wenn virtuelle Maschinen hinzugefügt werden. Weitere Informationen über Kontingente für Warnungsinstanzen finden Sie unter. Fehler beim Erreichen des Kontingents |
Warnungsgruppe |
Der Alertmanager gruppiert Warnungsinstanzen standardmäßig anhand der Bezeichnungen für die Stammbenachrichtigungsrichtlinie. Dadurch werden die Deduplizierung und Gruppen von Warnungsinstanzen gesteuert, die an Kontaktstellen gesendet werden. |
Kontaktstelle |
Definieren Sie, wie Ihre Kontakte benachrichtigt werden, wenn eine Warnregel ausgelöst wird. |
Erstellung von Nachrichtenvorlagen |
Erstellen Sie wiederverwendbare benutzerdefinierte Vorlagen und verwenden Sie sie in Kontaktpunkten. |
Benachrichtigungsrichtlinie |
Regelwerk, das festlegt, wo, wann und wie die Benachrichtigungen gruppiert und an Kontaktstellen weitergeleitet werden. |
Labels und Label-Matcher |
Mit Labels lassen sich Warnregeln eindeutig identifizieren. Sie verknüpfen Warnregeln mit Benachrichtigungsrichtlinien und Stummschaltungen und legen fest, welche Richtlinie sie behandeln soll und welche Warnregeln zum Schweigen gebracht werden sollen. |
Schweigen |
Stoppt Benachrichtigungen von einer oder mehreren Warnungsinstanzen. Der Unterschied zwischen einer Stille und einer Stummschaltung besteht darin, dass eine Stille für ein bestimmtes Zeitfenster andauert, während die Stummschaltung nach einem wiederkehrenden Zeitplan erfolgt. Verwendet Label-Matcher, um Warnungsinstanzen zum Schweigen zu bringen. |
Timings stummschalten |
Geben Sie ein Zeitintervall an, in dem keine neuen Benachrichtigungen generiert oder gesendet werden sollen. Sie können Warnmeldungen für wiederkehrende Zeiträume einfrieren, z. B. während eines Wartungszeitraums. Muss mit einer bestehenden Benachrichtigungsrichtlinie verknüpft sein. |
Datenquellen warnen
Von Grafana verwaltete Benachrichtigungen fragen die folgenden Backend-Datenquellen ab, für die Benachrichtigungen aktiviert sind.
-
Integrierte oder von Grafana entwickelte und verwaltete Datenquellen:
Alertmanager
,Graphite
,Prometheus
(einschließlich Amazon Managed Service for Prometheus),,,,Loki
,InfluxDB
,Amazon OpenSearch Service
,Google Cloud Monitoring
,Amazon CloudWatch
,Azure Monitor
,MySQL
,,PostgreSQL
MSSQL
OpenTSDB
,Oracle
und.Azure Monitor
Warnmeldungen bei numerischen Daten
Numerische Daten, die nicht in einem Zeitreihenformat vorliegen, können direkt als Warnung angezeigt oder an serverseitige Ausdrücke übergeben werden. Dies ermöglicht eine bessere Verarbeitung und damit eine höhere Effizienz innerhalb der Datenquelle und kann auch die Warnungsregeln vereinfachen. Bei Warnmeldungen für numerische Daten anstelle von Zeitreihendaten ist es nicht erforderlich, jede beschriftete Zeitreihe auf eine einzelne Zahl zu reduzieren. Stattdessen werden beschriftete Zahlen stattdessen an Grafana zurückgegeben.
Tabellendaten
Diese Funktion wird mit Backend-Datenquellen unterstützt, die Tabellendaten abfragen, einschließlich SQL-Datenquellen wie MySQL, Postgres, MSSQL und Oracle.
Eine Abfrage mit von Grafana verwalteten Warnungen oder serverseitigen Ausdrücken wird bei diesen Datenquellen als numerisch betrachtet:
-
Wenn die
Format AS
OptionTable
in der Datenquellenabfrage auf eingestellt ist. -
Wenn die von der Abfrage an Grafana zurückgegebene Tabellenantwort nur eine numerische Spalte (z. B. int, double oder float) und optional zusätzliche Zeichenkettenspalten enthält.
Wenn Zeichenkettenspalten vorhanden sind, werden diese Spalten zu Beschriftungen. Der Name der Spalte wird zum Labelnamen, und der Wert für jede Zeile wird zum Wert der entsprechenden Bezeichnung. Wenn mehrere Zeilen zurückgegeben werden, sollte jede Zeile anhand ihrer Beschriftungen eindeutig identifiziert werden.
Beispiel
Wenn Sie eine MySQL-Tabelle namens Diskspace haben, wie folgt.
Zeit | Host | Festplatte | PercentFree |
---|---|---|---|
2021-Juni-7 |
Netz 1 |
/usw |
3 |
2021-Juni-7 |
Netz 2 |
/var |
4 |
2021-Juni-7 |
Netz 3 |
/var |
8 |
… |
… |
… |
… |
Sie können die Datenfilterung rechtzeitig abfragen, ohne jedoch die Zeitreihe an Grafana zurückzugeben. Eine Warnung, die pro Host und Festplatte ausgelöst wird, wenn weniger als 5% freier Speicherplatz zur Verfügung steht, könnte beispielsweise wie folgt aussehen.
SELECT Host, Disk, CASE WHEN PercentFree < 5.0 THEN PercentFree ELSE 0 END FROM ( SELECT Host, Disk, Avg(PercentFree) FROM DiskSpace Group By Host, Disk Where __timeFilter(Time)
Diese Abfrage gibt die folgende Tabellenantwort an Grafana zurück.
Host | Festplatte | PercentFree |
---|---|---|
web1 |
/usw |
3 |
web2 |
/var |
4 |
web3 |
/var |
0 |
Wenn diese Abfrage als Bedingung in einer Warnungsregel verwendet wird, sind die Fälle, in denen der Wert ungleich Null ist, eine Warnung. Als Ergebnis werden drei Warnungsinstanzen erzeugt, wie in der folgenden Tabelle dargestellt.
Labels | Status |
---|---|
{host=WEB1, disk=/etc} |
Warnfunktion |
{Host=Web2, Festplatte=/var} |
Warnfunktion |
{host=WEB3, Festplatte=/var} |
Normal |
Alert-Manager
Grafana bietet integrierte Unterstützung für Prometheus Alertmanager. Der Alertmanager hilft sowohl bei der Gruppierung als auch bei der Verwaltung von Warnungsregeln und fügt den Alert-Engines eine zusätzliche Orchestrierungsebene hinzu. Standardmäßig werden Benachrichtigungen für von Grafana verwaltete Benachrichtigungen vom eingebetteten Alertmanager verarbeitet, der Teil des Kerns von Grafana ist. Sie können die Kontaktpunkte, Benachrichtigungsrichtlinien und Vorlagen des Alertmanagers über die Grafana-Alerting-Benutzeroberfläche konfigurieren, indem Sie die Option Grafana aus der Alertmanager-Dropdownliste auswählen.
Grafana-Alerting unterstützt die externe Alertmanager-Konfiguration (weitere Informationen zu Alertmanager als externe Datenquelle finden Sie unter). Stellen Sie eine Connect zu einer AlertManager-Datenquelle her Wenn Sie einen externen Alertmanager hinzufügen, zeigt das Alertmanager-Drop-down-Menü eine Liste der verfügbaren externen Alertmanager-Datenquellen an. Wählen Sie eine Datenquelle aus, um Benachrichtigungen für eigenständige Cortex- oder Loki-Datenquellen zu erstellen und zu verwalten.
Status und Zustand der Warnregeln
Der Status und der Zustand der Warnregeln helfen Ihnen dabei, mehrere wichtige Statusindikatoren Ihrer Benachrichtigungen zu verstehen. Es gibt drei Hauptkomponenten: den Warnstatus, den Status der Warnregeln und den Zustand der Warnregeln. Obwohl sie miteinander verwandt sind, vermittelt jede Komponente leicht unterschiedliche Informationen.
Status der Warnmeldungsregel
-
Normal — Keine der von der Evaluierungs-Engine zurückgegebenen Zeitreihen hat den
Firing
Status „Pending
Oder“. -
Ausstehend — Mindestens eine der von der Evaluierungs-Engine zurückgegebenen Zeitreihen ist
Pending
. -
Wird ausgelöst — Mindestens eine der von der Evaluierungs-Engine zurückgegebenen Zeitreihen ist
Firing
.
Alarmstatus
-
Normal — Die Bedingung für die Warnregel ist für jede Zeitreihe, die von der Evaluierungs-Engine zurückgegeben wird, falsch.
-
Warnung — Der Zustand der Warnregel ist für mindestens eine von der Evaluierungs-Engine zurückgegebene Zeitreihe wahr. Die Dauer, für die die Bedingung erfüllt sein muss, bevor eine Warnung ausgelöst wird, sofern sie gesetzt ist, erfüllt ist oder überschritten wurde.
-
Ausstehend — Die Bedingung der Warnregel ist für mindestens eine von der Evaluierungs-Engine zurückgegebene Zeitreihe wahr. Die Dauer, für die die Bedingung erfüllt sein muss, bevor eine Warnung ausgelöst wird, wurde, sofern sie gesetzt ist, nicht erfüllt.
-
NoData— Die Warnregel hat keine Zeitreihe zurückgegeben, alle Werte für die Zeitreihe sind Null oder alle Werte für die Zeitreihe sind Null.
-
Fehler — Fehler beim Versuch, eine Warnregel auszuwerten.
Integrität der Warnmeldungsregel
-
Ok — Bei der Auswertung einer Warnregel ist kein Fehler aufgetreten.
-
Fehler — Fehler bei der Auswertung einer Warnregel.
-
NoData— Das Fehlen von Daten in mindestens einer Zeitreihe, die während einer Regelauswertung zurückgegeben wurde.