Grafana-Alarmregeln erstellen und verwalten - Amazon Managed Grafana

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Grafana-Alarmregeln erstellen und verwalten

Dieses Dokumentationsthema wurde für Grafana-Workspaces entwickelt, die Grafana-Version 8.x unterstützen.

Informationen zu Grafana-Arbeitsbereichen, die Grafana-Version 10.x unterstützen, finden Sie unter. Arbeitet in Grafana-Version 10

Informationen zu Grafana-Arbeitsbereichen, die Grafana-Version 9.x unterstützen, finden Sie unter. Arbeitet in Grafana-Version 9

Eine Warnregel besteht aus einer Reihe von Bewertungskriterien, die bestimmen, ob eine Warnung ausgelöst wird. Die Regel besteht aus einer oder mehreren Abfragen und Ausdrücken, einer Bedingung, der Häufigkeit der Auswertung und optional der Dauer, über die die Bedingung erfüllt wird.

Während Abfragen und Ausdrücke den Datensatz auswählen, der ausgewertet werden soll, legt eine Bedingung den Schwellenwert fest, den eine Warnung erfüllen oder überschreiten muss, um eine Warnung auszulösen. Ein Intervall gibt an, wie oft eine Warnregel ausgewertet wird. Die Dauer gibt, sofern konfiguriert, an, wie lange eine Bedingung erfüllt sein muss. Die Regeln können auch das Warnverhalten bei fehlenden Daten definieren.

In den folgenden Abschnitten wird das Erstellen und Verwalten verschiedener Arten von Grafana-Warnregeln beschrieben.

Von Cortex oder Loki verwaltete Warnungsregeln erstellen

Mit Grafana können Sie Warnregeln für eine externe Cortex- oder Loki-Instanz erstellen.

Anmerkung

Cortex ist die Zeitreihendatenbank, die von Amazon Managed Service für Prometheus- und Prometheus-Datenquellen verwendet wird.

Voraussetzungen

  • Stellen Sie sicher, dass Sie Schreibberechtigungen für die Prometheus-Datenquelle haben. Andernfalls können Sie keine von Cortex verwalteten Warnregeln erstellen oder aktualisieren.

  • Aktivieren Sie für Cortex- und Loki-Datenquellen die Ruler-API, indem Sie ihre jeweiligen Dienste konfigurieren.

    • Loki — Der local Regelspeichertyp, Standard für die Loki-Datenquelle, unterstützt nur das Anzeigen von Regeln. Um Regeln zu bearbeiten, konfigurieren Sie einen der anderen Speichertypen.

    • Cortex — Verwenden Sie das /api/prom Legacy-Präfix, nicht/prometheus. Die Prometheus-Datenquelle unterstützt sowohl Cortex als auch Prometheus, und Grafana geht davon aus, dass sich sowohl die Query-API als auch die Ruler-API unter derselben URL befinden. Sie können keine separate URL für die Ruler-API angeben.

Anmerkung

Wenn Sie keine Warnungsregeln für eine bestimmte Loki- oder Prometheus-Datenquelle verwalten möchten, gehen Sie zu deren Einstellungen und deaktivieren Sie das Kontrollkästchen Benachrichtigungen über die Alerting UI verwalten.

Um eine von Cortex oder Loki verwaltete Warnregel hinzuzufügen
  1. Wählen Sie in Ihrer Grafana-Konsole im Grafana-Menü das Alerting (Glockensymbol), um die Alerting-Seite mit den vorhandenen Alerts zu öffnen.

  2. Wählen Sie Neue Warnungsregel.

  3. Fügen Sie in Schritt 1 den Namen, den Typ und den Speicherort der Regel wie folgt hinzu:

    • Fügen Sie im Feld Regelname einen beschreibenden Namen hinzu. Dieser Name wird in der Liste der Warnungsregeln angezeigt. Es ist auch die alertname Bezeichnung für jede Warnungsinstanz, die anhand dieser Regel erstellt wird.

    • Wählen Sie in der Dropdownliste Regeltyp die Option Cortex/Loki Managed Alert aus.

    • Wählen Sie in der Dropdownliste Datenquelle auswählen eine Prometheus- oder Loki-Datenquelle aus.

    • Wählen Sie aus der Dropdownliste Namespace einen vorhandenen Regel-Namespace aus. Andernfalls wählen Sie Neu hinzufügen und geben Sie einen Namen ein, um einen zu erstellen. Namespaces können eine oder mehrere Regelgruppen enthalten und haben nur einen organisatorischen Zweck. Weitere Informationen finden Sie unter Cortex- oder Loki-Regelgruppen und Namespaces.

    • Wählen Sie in der Dropdownliste Gruppe eine bestehende Gruppe im ausgewählten Namespace aus. Andernfalls wählen Sie Neu hinzufügen und geben Sie einen Namen ein, um einen zu erstellen. Neu erstellte Regeln werden an das Ende der Gruppe angehängt. Regeln innerhalb einer Gruppe werden sequenziell in regelmäßigen Intervallen mit derselben Evaluierungszeit ausgeführt.

  4. Fügen Sie in Schritt 2 die auszuwertende Abfrage hinzu.

    Der Wert kann ein PromQL- oder LogQL-Ausdruck sein. Die Regel löst eine Warnung aus, wenn das Auswertungsergebnis mindestens eine Reihe mit einem Wert größer als 0 enthält. Für jede Serie wird eine Warnung erstellt.

  5. Fügen Sie in Schritt 3 Bedingungen hinzu.

    Geben Sie im Textfeld Für der Bedingung die Dauer an, für die die Bedingung erfüllt sein muss, bevor die Warnung ausgelöst wird. Wenn Sie angeben5m, müssen die Bedingungen fünf Minuten lang erfüllt sein, bevor die Warnung ausgelöst wird.

    Anmerkung

    Wenn eine Bedingung erfüllt ist, geht die Warnung in den Pending Status über. Wenn die Bedingung für die angegebene Dauer aktiv bleibt, wechselt die Warnung in den Firing Status. Wenn sie nicht mehr erfüllt ist, kehrt sie in den Normal Status zurück.

  6. Fügen Sie in Schritt 4 zusätzliche Metadaten hinzu, die der Regel zugeordnet sind.

    • Fügen Sie eine Beschreibung und eine Zusammenfassung hinzu, um Warnmeldungen individuell anzupassen. Verwenden Sie die Richtlinien inAnmerkungen und Beschriftungen für Warnregeln.

    • Fügen Sie Runbook-URLs, Panels-, Dashboard- und Warnungs-IDs hinzu.

    • Fügen Sie benutzerdefinierte Labels hinzu.

  7. Wählen Sie „Warnmeldungen in der Vorschau anzeigen“, um die Regel auszuwerten und zu sehen, welche Warnmeldungen sie ausgeben würde. Es wird eine Liste von Warnmeldungen mit Status und Wert der einzelnen Warnungen angezeigt.

  8. Wählen Sie Speichern, um die Regel zu speichern, oder Speichern und beenden, um die Regel zu speichern und zur Warnseite zurückzukehren.

Von Cortex oder Loki verwaltete Aufzeichnungsregeln erstellen

Sie können Aufzeichnungsregeln für eine externe Cortex- oder Loki-Instanz erstellen und verwalten. Aufzeichnungsregeln berechnen häufig benötigte Ausdrücke oder rechenintensive Ausdrücke im Voraus und speichern das Ergebnis als neue Zeitreihe. Die Abfrage dieser neuen Zeitreihe ist schneller, insbesondere bei Dashboards, da bei jeder Aktualisierung der Dashboards derselbe Ausdruck abgefragt wird.

Voraussetzungen

Aktivieren Sie für Cortex- und Loki-Datenquellen die Ruler-API, indem Sie ihre jeweiligen Dienste konfigurieren.

  • Loki — Der local Regelspeichertyp, Standard für die Loki-Datenquelle, unterstützt nur das Anzeigen von Regeln. Um Regeln zu bearbeiten, konfigurieren Sie einen der anderen Speichertypen.

  • Cortex — Wenn Sie eine Grafana Prometheus-Datenquelle so konfigurieren, dass sie auf Cortex verweist, verwenden Sie das /api/prom Legacy-Präfix, nicht. /prometheus Die Prometheus-Datenquelle unterstützt sowohl Cortex als auch Prometheus, und Grafana geht davon aus, dass sich sowohl die Query-API als auch die Ruler-API unter derselben URL befinden. Sie können keine separate URL für die Ruler-API angeben.

Anmerkung

Wenn Sie keine Warnungsregeln für eine bestimmte Loki- oder Prometheus-Datenquelle verwalten möchten, gehen Sie zu deren Einstellungen und deaktivieren Sie das Kontrollkästchen Benachrichtigungen über die Alerting UI verwalten.

Um eine von Cortex oder Loki verwaltete Aufzeichnungsregel hinzuzufügen
  1. Wählen Sie in Ihrer Grafana-Konsole im Grafana-Menü das Alerting (Glockensymbol), um die Alerting-Seite mit den vorhandenen Alerts zu öffnen.

  2. Wählen Sie Neue Warnungsregel.

  3. Fügen Sie in Schritt 1 den Namen, den Typ und den Speicherort der Regel wie folgt hinzu.

    • Fügen Sie im Feld Regelname einen beschreibenden Namen hinzu. Dieser Name wird in der Liste der Warnungsregeln angezeigt. Es ist auch die alertname Bezeichnung für jede Warnungsinstanz, die anhand dieser Regel erstellt wird.

    • Wählen Sie in der Dropdownliste Regeltyp die Option Cortex/Loki Managed Alert aus.

    • Wählen Sie in der Dropdownliste Datenquelle auswählen eine Prometheus- oder Loki-Datenquelle aus.

    • Wählen Sie aus der Dropdownliste Namespace einen vorhandenen Regel-Namespace aus. Andernfalls wählen Sie Neu hinzufügen und geben Sie einen Namen ein, um einen zu erstellen. Namespaces können eine oder mehrere Regelgruppen enthalten und haben nur einen organisatorischen Zweck. Weitere Informationen finden Sie unter Cortex- oder Loki-Regelgruppen und Namespaces.

    • Wählen Sie in der Dropdownliste Gruppe eine bestehende Gruppe im ausgewählten Namespace aus. Andernfalls wählen Sie Neu hinzufügen und geben Sie einen Namen ein, um einen zu erstellen. Neu erstellte Regeln werden an das Ende der Gruppe angehängt. Regeln innerhalb einer Gruppe werden sequenziell in regelmäßigen Intervallen mit derselben Evaluierungszeit ausgeführt.

  4. Fügen Sie in Schritt 2 die auszuwertende Abfrage hinzu.

    Der Wert kann ein PromQL- oder LogQL-Ausdruck sein. Die Regel löst eine Warnung aus, wenn das Auswertungsergebnis mindestens eine Reihe mit einem Wert größer als 0 enthält. Für jede Serie wird eine Warnung erstellt.

  5. Fügen Sie in Schritt 3 zusätzliche Metadaten hinzu, die der Regel zugeordnet sind.

    • Fügen Sie eine Beschreibung und eine Zusammenfassung hinzu, um Warnmeldungen individuell anzupassen. Verwenden Sie die Richtlinien inAnmerkungen und Beschriftungen für Warnregeln.

    • Fügen Sie Runbook-URLs, Panels-, Dashboard- und Warnungs-IDs hinzu.

    • Fügen Sie benutzerdefinierte Labels hinzu.

  6. Wählen Sie Speichern, um die Regel zu speichern, oder Speichern und beenden, um die Regel zu speichern und zur Warnseite zurückzukehren.

Von Grafana verwaltete Alarmregeln erstellen

Grafana ermöglicht es Ihnen, Warnregeln zu erstellen, die eine oder mehrere Datenquellen abfragen, die Ergebnisse reduzieren oder transformieren und miteinander vergleichen oder Schwellenwerte festlegen. Wenn diese bearbeitet werden, sendet Grafana Benachrichtigungen an die Kontaktstelle.

Anmerkung

Das Erstellen von von Grafana-verwalteten Warnungsregeln während der Verwendung von Grafana-Benachrichtigungen führt dazu, dass mehrere Benachrichtigungen gesendet werden, wenn die Regel erfüllt ist. Einige Anbieter von Kontaktstellen verfügen möglicherweise über konfigurierbare Optionen zum Deduplizieren der Benachrichtigungen.

So fügen Sie eine verwaltete Grafana-Regel hinzu
  1. Wählen Sie in Ihrer Grafana-Konsole im Grafana-Menü das Alerting (Glockensymbol), um die Alerting-Seite mit den vorhandenen Alerts zu öffnen.

  2. Wählen Sie Neue Warnungsregel.

  3. Fügen Sie in Schritt 1 den Namen, den Typ und den Speicherort der Regel wie folgt hinzu:

    • Fügen Sie im Feld Regelname einen beschreibenden Namen hinzu. Dieser Name wird in der Liste der Warnungsregeln angezeigt. Es ist auch die alertname Bezeichnung für jede Warnungsinstanz, die anhand dieser Regel erstellt wird.

    • Wählen Sie in der Dropdownliste Regeltyp die Option Grafana Managed Alert aus.

    • Wählen Sie aus der Dropdownliste Ordner den Ordner aus, in dem Sie die Regel speichern möchten. Wenn Sie keinen Ordner auswählen, wird die Regel in dem General Ordner gespeichert. Um einen Ordner zu erstellen, wählen Sie das Drop-down-Menü aus und geben Sie einen neuen Ordnernamen ein.

  4. Fügen Sie in Schritt 2 die auszuwertenden Abfragen und Ausdrücke hinzu.

    • Behalten Sie den Standardnamen bei oder bewegen Sie den Mauszeiger darüber und wählen Sie das Bearbeitungssymbol, um den Namen zu ändern.

    • Wählen Sie für Abfragen eine Datenquelle aus der Dropdownliste aus.

    • Fügen Sie eine oder mehrere Abfragen oder Ausdrücke hinzu (Einzelheiten zu Ausdrücken finden Sie unter Ausdrücke in der Grafana-Dokumentation).

    • Wählen Sie für jeden Ausdruck entweder klassische Bedingung aus, um eine einzelne Warnungsregel zu erstellen, oder wählen Sie aus den Optionen Math, Reduce, Resample, um separate Alerts für jede Serie zu generieren. Einzelheiten zu diesen Optionen finden Sie unterEin- und mehrdimensionale Regeln.

    • Wählen Sie Abfragen ausführen, um zu überprüfen, ob die Abfrage erfolgreich ist.

  5. Fügen Sie in Schritt 3 Bedingungen hinzu.

    • Wählen Sie in der Dropdownliste Bedingung die Abfrage oder den Ausdruck aus, mit dem die Warnungsregel initiiert werden soll.

    • Geben Sie für Alle auswerten die Häufigkeit der Auswertung an. Muss ein Vielfaches von 10 Sekunden sein. Zum Beispiel 1m, 30s.

    • Geben Sie unter Evaluieren für die Dauer an, für die die Bedingung erfüllt sein muss, bevor eine Warnung ausgelöst wird.

      Anmerkung

      Wenn eine Bedingung verletzt wurde, geht die Warnung in den Pending Status über. Bleibt die Bedingung für die angegebene Dauer verletzt, wechselt die Warnung in den Firing Status. Wenn sie nicht mehr erfüllt ist, wird der Normal Status wiederhergestellt.

    • Konfigurieren Sie unter Keine Daten konfigurieren und Fehlerbehandlung das Warnverhalten bei fehlenden Daten. Beachten Sie die Richtlinien unter. Es werden keine Daten- oder Fehlerfälle behandelt

    • Wählen Sie „Warnmeldungen in der Vorschau“, um das Ergebnis der Ausführung der Abfrage in diesem Moment zu überprüfen. In der Vorschau sind keine Daten und keine Bedingungen für die Fehlerbehandlung enthalten.

  6. Fügen Sie in Schritt 4 zusätzliche Metadaten hinzu, die der Regel zugeordnet sind.

    • Fügen Sie eine Beschreibung und eine Zusammenfassung hinzu, um Warnmeldungen individuell anzupassen. Verwenden Sie die Richtlinien inAnmerkungen und Beschriftungen für Warnregeln.

    • Fügen Sie Runbook-URLs, Panels-, Dashboard- und Warnungs-IDs hinzu.

    • Fügen Sie benutzerdefinierte Labels hinzu.

  7. Wählen Sie Speichern, um die Regel zu speichern, oder Speichern und beenden, um die Regel zu speichern und zur Warnseite zurückzukehren.

Ein- und mehrdimensionale Regeln

Für von Grafana verwaltete Warnungsregeln können Sie eine Regel mit einer klassischen Bedingung oder eine mehrdimensionale Regel erstellen.

Eindimensionale Regel (klassische Bedingung)

Verwenden Sie einen klassischen Bedingungsausdruck, um eine Regel zu erstellen, die eine einzelne Warnung auslöst, wenn ihre Bedingung erfüllt ist. Bei einer Abfrage, die mehrere Serien zurückgibt, verfolgt Grafana nicht den Alarmstatus jeder Serie. Infolgedessen sendet Grafana nur eine einzige Warnung, selbst wenn die Alarmbedingungen für mehrere Serien erfüllt sind.

Weitere Informationen zum Formatieren von Ausdrücken finden Sie unter Ausdrücke in der Grafana-Dokumentation.

Mehrdimensionale Regel

Um für jede in der Abfrage zurückgegebene Serie eine separate Warnungsinstanz zu generieren, erstellen Sie eine multidimensionale Regel.

Anmerkung

Jede durch eine multidimensionale Regel generierte Warnungsinstanz wird auf Ihr Gesamtkontingent an Warnmeldungen angerechnet. Regeln werden nicht ausgewertet, wenn Sie Ihr Alert-Kontingent erreicht haben. Weitere Informationen zu Kontingenten für mehrdimensionale Regeln finden Sie unterFehler beim Erreichen des Kontingents.

Um mehrere Instanzen aus einer einzigen Regel zu erstellen, verwenden Sie, oder Resample Ausdrücke MathReduce, um eine multidimensionale Regel zu erstellen. Beispielsweise ist Folgendes möglich:

  • Fügen Sie für jede Abfrage einen Reduce Ausdruck hinzu, um Werte im ausgewählten Zeitraum zu einem einzigen Wert zusammenzufassen. (Nicht erforderlich für Regeln, die numerische Daten verwenden).

  • Fügen Sie einen Math Ausdruck mit der Bedingung für die Regel hinzu. Dies ist nicht erforderlich, wenn eine Abfrage oder ein Reduce-Ausdruck bereits 0 zurückgibt, wenn die Regel keine Warnung auslösen soll, oder eine positive Zahl, wenn sie eine Warnung auslösen soll.

    Hier einige Beispiele:

    • $B > 70ob eine Warnung ausgelöst werden soll, falls der Wert der B-Abfrage/des Ausdrucks größer als 70 ist.

    • $B < $C * 100falls es eine Warnung auslösen soll, wenn der Wert von B kleiner als der Wert von C multipliziert mit 100 ist. Wenn die Ergebnisse von Abfragen, die verglichen werden, mehrere Reihen enthalten, werden Reihen aus verschiedenen Abfragen abgeglichen, wenn sie dieselben Beschriftungen haben oder eine eine Teilmenge der anderen ist.

Anmerkung

Grafana unterstützt keine Warnabfragen mit Vorlagenvariablen. Weitere Informationen finden Sie auf der Community-Seite. Vorlagenvariablen werden bei der Einrichtung von Alert in Warnungsabfragen nicht unterstützt.

Überlegungen zur Leistung multidimensionaler Regeln

Jede Warnungsinstanz wird auf das Warnungskontingent angerechnet. Mehrdimensionale Regeln, die mehr Instanzen erstellen, als innerhalb des Warnungskontingents untergebracht werden können, werden nicht ausgewertet und geben einen Kontingentfehler zurück. Weitere Informationen finden Sie unter Fehler beim Erreichen des Kontingents.

Mehrdimensionale Benachrichtigungen können einen großen Einfluss auf die Leistung Ihres Grafana-Workspace sowie auf die Leistung Ihrer Datenquellen haben, da Grafana sie abfragt, um Ihre Warnungsregeln auszuwerten. Die folgenden Überlegungen können hilfreich sein, wenn Sie versuchen, die Leistung Ihres Überwachungssystems zu optimieren.

  • Häufigkeit der Regelauswertung — Die Eigenschaft „Alle auswerten“ einer Warnungsregel steuert die Häufigkeit der Regelauswertung. Wir empfehlen, die niedrigste akzeptable Evaluierungshäufigkeit zu verwenden.

  • Kardinalität der Ergebnismenge — Die Anzahl der Warnungsinstanzen, die Sie mit einer Regel erstellen, wirkt sich auf deren Leistung aus. Angenommen, Sie überwachen API-Antwortfehler für jeden API-Pfad auf jeder VM in Ihrer Flotte. Dieser Satz hat eine Kardinalität der Anzahl der Pfade multipliziert mit der Anzahl der VMs. Sie können die Kardinalität der Ergebnismenge reduzieren, indem Sie beispielsweise die Gesamtanzahl der Fehler pro VM statt pro Pfad pro VM überwachen.

  • Komplexität der Abfrage — Abfragen, die Datenquellen schnell verarbeiten und beantworten können, verbrauchen weniger Ressourcen. Diese Überlegung ist zwar weniger wichtig als die anderen oben aufgeführten Überlegungen, aber wenn Sie sie so weit wie möglich reduziert haben, könnte die Betrachtung der individuellen Abfrageleistung einen Unterschied machen. Sie sollten sich auch der Auswirkungen bewusst sein, die die Bewertung dieser Regeln auf die Leistung Ihrer Datenquellen hat. Warnabfragen machen häufig die überwiegende Mehrheit der Abfragen aus, die von Überwachungsdatenbanken verarbeitet werden. Daher wirken sich dieselben Auslastungsfaktoren, die sich auf die Grafana-Instanz auswirken, auch auf sie aus.

Fehler beim Erreichen des Kontingents

Es gibt ein Kontingent für die Anzahl der Warnungsinstanzen, die Sie in einem einzelnen Workspace haben können. Wenn Sie diese Anzahl erreichen, können Sie in diesem Workspace keine neuen Warnungsregeln mehr erstellen. Bei mehrdimensionalen Benachrichtigungen kann die Anzahl der Warnungsinstanzen im Laufe der Zeit variieren.

Bei der Arbeit mit Warnungsinstanzen sollten Sie Folgendes beachten.

  • Wenn Sie nur eindimensionale Regeln erstellen, ist jede Regel eine einzelne Warnungsinstanz. Sie können in einem einzigen Workspace die gleiche Anzahl von Regeln erstellen wie Ihr Kontingent für Warnungsinstanzen, und nicht mehr.

  • Mehrdimensionale Regeln erzeugen mehrere Warnungsinstanzen, deren Anzahl jedoch erst bekannt ist, wenn sie ausgewertet wurden. Wenn Sie beispielsweise eine Warnungsregel erstellen, die die CPU-Auslastung Ihrer Amazon EC2 EC2-Instances verfolgt, gibt es bei der Erstellung möglicherweise 50 EC2-Instances (und somit 50 Alert-Instances). Wenn Sie jedoch eine Woche später 10 weitere EC2-Instances hinzufügen, umfasst die nächste Auswertung 60 Alert-Instances.

    Die Anzahl der Alert-Instances wird ausgewertet, wenn Sie eine multidimensionale Warnung erstellen, und Sie können keine erstellen, bei der Sie sofort Ihr Alert-Instance-Kontingent überschreiten. Da sich die Anzahl der Warnungsinstanzen ändern kann, wird Ihr Kontingent bei jeder Auswertung Ihrer Regeln überprüft.

  • Wenn Sie bei der Regelauswertung aufgrund einer Regel Ihr Kontingent für Warnungsinstanzen überschreiten, wird diese Regel erst evaluiert, wenn die Warnungsregel aktualisiert wird, sodass die Gesamtzahl der Warnungsinstanzen unter das Dienstkontingent fällt. In diesem Fall erhalten Sie eine Warnmeldung, die Sie darüber informiert, dass Ihr Kontingent erreicht wurde (die Benachrichtigung verwendet die Benachrichtigungsrichtlinie für die auszuwertende Regel). Die Benachrichtigung enthält eine Error Anmerkung mit dem WertQuotaReachedError.

  • Eine Regel, die bewirkt, dass a QuotaReachedError nicht mehr ausgewertet wird. Die Auswertung wird nur dann wieder aufgenommen, wenn ein Update vorgenommen wird und die Auswertung nach dem Update selbst keine Ursache hatQuotaReachedError. Eine Regel, die nicht ausgewertet wird, zeigt in der Grafana-Konsole den Fehler Kontingent erreicht an.

  • Sie können die Anzahl der Warnungsinstanzen verringern, indem Sie Warnungsregeln entfernen oder indem Sie mehrdimensionale Warnungen bearbeiten, sodass weniger Warnungsinstanzen angezeigt werden (z. B. indem Sie eine Warnung bei Fehlern pro VM anstelle einer Warnung bei Fehlern pro API in einer VM haben).

  • Um die Evaluierungen fortzusetzen, aktualisieren Sie die Warnung und speichern Sie sie. Sie können es aktualisieren, um die Anzahl der Warnungsinstanzen zu verringern, oder wenn Sie andere Änderungen vorgenommen haben, um die Anzahl der Warnungsinstanzen zu verringern, können Sie es unverändert speichern. Wenn es wieder aufgenommen werden kann, ist es das auch. Wenn es ein anderes verursachtQuotaReachedError, können Sie es nicht speichern.

  • Wenn eine Warnung gespeichert wird und die Auswertung wieder aufgenommen wird, ohne das Warnungskontingent zu überschreiten, kann der Fehler Kontingent erreicht noch einige Zeit (bis zum Bewertungsintervall) in der Grafana-Konsole angezeigt werden. Die Auswertung der Warnungsregel wird jedoch gestartet und es werden Warnungen gesendet, wenn der Regelschwellenwert erreicht ist.

  • Einzelheiten zur Quote für Warnmeldungen sowie zu anderen Kontingenten finden Sie unter. Amazon Managed Grafana-Servicekontingente

Es werden keine Daten- oder Fehlerfälle behandelt

Wählen Sie Optionen für den Umgang mit Warnmeldungen, wenn keine Daten vorliegen oder Fehler auftreten.

Die Optionen für den Umgang mit fehlenden Daten sind in der folgenden Tabelle aufgeführt.

Option „Keine Daten“ Behavior

Keine Daten

Erstellen Sie eine Warnung DatasourceNoData mit dem Namen und der UID der Warnungsregel sowie der UID der Datenquelle, die keine Daten zurückgegeben hat, als Beschriftungen.

Warnfunktion

Legen Sie den Status der Warnungsregel auf fest. Alerting

OK

Stellen Sie den Status der Warnungsregel auf einNormal.

Die Optionen für die Behandlung von Fehlerfällen sind in der folgenden Tabelle aufgeführt.

Fehler- oder Timeout-Option Behavior

Warnfunktion

Stellen Sie den Status der Warnungsregel auf ein Alerting

OK

Setzen Sie den Status der Warnungsregel auf Normal

Fehler

Erstellen Sie eine Warnung DatasourceError mit dem Namen und der UID der Warnungsregel sowie der UID der Datenquelle, die keine Daten zurückgegeben hat, als Beschriftungen.

Anmerkungen und Beschriftungen für Warnregeln

Anmerkungen und Beschriftungen sind Schlüssel-Wert-Paare, die mit Warnmeldungen verknüpft sind, die aus der Warnungsregel, der Datenquellenantwort und dem Ergebnis der Auswertung von Warnmeldungsregeln stammen. Sie können direkt in Warnmeldungen oder in Vorlagen und Vorlagenfunktionen verwendet werden, um einen Benachrichtigungskontakt dynamisch zu erstellen.

Anmerkungen

Anmerkungen sind Schlüssel-Wert-Paare, die zusätzliche Informationen zu einer Warnung bereitstellen. Sie können die folgenden Anmerkungen verwenden:description,,, summaryrunbook_url, alertId und. dashboardUid panelId Diese werden in Regel- und Warnungsdetails auf der Benutzeroberfläche angezeigt und können in Nachrichtenvorlagen für Kontaktstellen verwendet werden.

Labels

Labels sind Schlüssel-Wert-Paare, die Informationen zu einer Warnung enthalten. Die für eine Warnung festgelegte Bezeichnung wird während des gesamten Evaluierungs- und Benachrichtigungsprozesses generiert und erweitert. Sie werden auf folgende Weise verwendet.

  • Der vollständige Satz von Bezeichnungen für eine Warnung identifiziert diese Warnung in Grafana Alerts eindeutig.

  • Der Alertmanager verwendet Labels, um Alerts für Stummmeldungen und Warnungsgruppen inBenachrichtigungsrichtlinien zuzuordnen.

  • In der Benutzeroberfläche für Warnmeldungen werden Beschriftungen für jede Warnungsinstanz angezeigt, die durch die Auswertung dieser Regel generiert wurde.

  • Kontaktpunkte können auf Labels zugreifen, um dynamisch Benachrichtigungen zu generieren, die spezifische Informationen zu der Warnung enthalten, die zu einer Benachrichtigung führt.

  • Einer Warnungsregel können Labels hinzugefügt werden. Diese manuell konfigurierten Labels können Vorlagenfunktionen verwenden und auf andere Labels verweisen. Beschriftungen, die hier zu einer Warnregel hinzugefügt wurden, haben im Falle einer Kollision zwischen Labels Vorrang.

Die folgenden Vorlagenvariablen sind verfügbar, wenn Anmerkungen und Beschriftungen erweitert werden.

Name Beschreibung

$labels

Die Beschriftungen aus der Abfrage oder Bedingung. Beispiel: {{ $labels.instance }} und {{ $labels.job }}. Dies ist nicht verfügbar, wenn die Regel eine klassische Bedingung verwendet.

$values

Die Werte aller Reduce-Ausdrücke und mathematischen Ausdrücke, die für diese Warnungsregel ausgewertet wurden. Zum Beispiel{{ $values.A }}, {{ $values.A.Labels }} und {{ $values.A.Value }} wo A ist der refID des Ausdrucks. Dies ist nicht verfügbar, wenn die Regel eine klassische Bedingung verwendet

$value

Die Wertzeichenfolge der Warnungsinstanz. z. B. [ var='A' labels={instance=foo} value=10 ].

Verwaltung von Warnungsregeln

Auf der Seite „Benachrichtigungen“ werden Warnregeln aufgeführt. Standardmäßig sind Regeln nach Datenquellentypen gruppiert. Der Grafana-Abschnitt listet Regeln auf, die von Grafana verwaltet werden, und der Abschnitt Cortex/Loki listet Regeln für Prometheus-kompatible Datenquellen auf. Sie können Warnregeln für Prometheus-kompatible Datenquellen anzeigen, sie jedoch nicht bearbeiten.

Warnregeln anzeigen

Mit Grafana-Benachrichtigungen können Sie alle Ihre Benachrichtigungen auf einer Seite anzeigen.

Um die Details der Benachrichtigungen anzuzeigen
  1. Wählen Sie in Ihrer Grafana-Konsole im Grafana-Menü das Alerting (Glockensymbol), um die Alerting-Seite zu öffnen. Standardmäßig werden Regeln in Gruppen nach Datenquellentyp angezeigt. Sie können jede Warnung auch anhand des aktuellen Status anzeigen (diese werden im folgenden Text ausführlicher beschrieben).

  2. In „Anzeigen als“ können Sie zwischen der Gruppen- und der Statusansicht wechseln, indem Sie die von Ihnen bevorzugte Option auswählen.

  3. Wählen Sie den Pfeil neben einer Zeile, um weitere Details zu dieser Zeile anzuzeigen. Zu den Details einer Regel gehören die Regelbezeichnungen, Anmerkungen, Datenquellen und Abfragen sowie eine Liste der Warnungsinstanzen, die sich aus der Regel ergeben.

Gruppenansicht

Die Gruppenansicht zeigt Grafana-Alarmregeln gruppiert nach Ordnern und Loki- oder Prometheus-Alarmregeln gruppiert nach +. namespace group Dies ist die Standardregellistenansicht, die für die Verwaltung von Regeln vorgesehen ist. Sie können jede Gruppe erweitern, um eine Liste der Regeln in dieser Gruppe anzuzeigen. Erweitern Sie eine Regel weiter, um ihre Details anzuzeigen. Sie können auch Aktionsschaltflächen und Warnmeldungen, die sich aus der Regel ergeben, erweitern, um deren Details anzuzeigen.

Ansicht „Status“

In der Statusansicht werden die Warnungsregeln nach Bundesland gruppiert angezeigt. Verwenden Sie diese Ansicht, um einen Überblick darüber zu erhalten, welche Regeln sich in welchem Status befinden. Jede Regel kann erweitert werden, um ihre Details anzuzeigen. Aktionsschaltflächen und alle durch diese Regel generierten Warnungen. Jede Warnung kann weiter erweitert werden, um ihre Details anzuzeigen.

Regeln für die Filterung von Warnmeldungen

Sie können die Warnregeln, die auf der Seite „Benachrichtigungen“ angezeigt werden, auf verschiedene Arten filtern.

  • Sie können filtern, um die Regeln anzuzeigen, die eine bestimmte Datenquelle abfragen, indem Sie Datenquellen auswählen und dann eine Datenquelle auswählen, nach der gefiltert werden soll.

  • Sie können nach Bezeichnungen filtern, indem Sie unter Nach Bezeichnung suchen die gewünschten Suchkriterien auswählen. Einige Beispielkriterien umfassenenvironment=production,region=~US|EU,severity!=warning.

  • Sie können filtern, um die Regeln in einem bestimmten Status anzuzeigen, indem Sie Benachrichtigungen nach Status filtern und dann den Status auswählen, den Sie anzeigen möchten.

Warnungsregeln bearbeiten oder löschen

Von Grafana verwaltete Alarmregeln können nur von Benutzern mit Bearbeitungsberechtigungen für den Ordner bearbeitet oder gelöscht werden, in dem die Regeln gespeichert sind. Warnregeln für eine externe Cortex- oder Loki-Instanz können von Benutzern mit Editor- oder Admin-Rollen bearbeitet oder gelöscht werden.

Um eine Regel zu bearbeiten oder zu löschen
  1. Erweitern Sie eine Regel, bis Sie die Regelsteuerelemente für Anzeigen, Bearbeiten und Löschen sehen können.

  2. Wählen Sie Bearbeiten, um die Seite „Regel erstellen“ zu öffnen. Nehmen Sie Aktualisierungen auf die gleiche Weise vor, wie Sie eine Regel erstellen. Einzelheiten finden Sie in den Anweisungen unter Von Grafana verwaltete Alarmregeln erstellen oderVon Cortex oder Loki verwaltete Warnungsregeln erstellen.

  3. Wählen Sie optional Löschen, um eine Regel zu löschen.

Cortex- oder Loki-Regelgruppen und Namespaces

Sie können Ihre Regeln organisieren. Regeln werden innerhalb von Regelgruppen erstellt, und Regelgruppen sind in Namespaces organisiert. Die Regeln innerhalb einer Regelgruppe werden nacheinander in regelmäßigen Abständen ausgeführt. Das Standardintervall ist eine Minute. Sie können Cortex- oder Loki-Namespaces und Regelgruppen umbenennen und die Bewertungsintervalle für Regelgruppen bearbeiten.

Um eine Regelgruppe oder einen Namespace zu bearbeiten
  1. Wählen Sie in Ihrer Grafana-Konsole im Grafana-Menü das Alerting (Glockensymbol), um die Alerting-Seite zu öffnen.

  2. Navigieren Sie zu einer Regel innerhalb der Regelgruppe oder des Namespace, die Sie bearbeiten möchten.

  3. Wählen Sie das Symbol Bearbeiten (Stift).

  4. Nehmen Sie Änderungen an der Regelgruppe oder dem Namespace vor.

    Anmerkung

    Bei Namespaces können Sie nur den Namen bearbeiten. Bei Regelgruppen ändern Sie den Namen oder das Bewertungsintervall für Regeln in der Gruppe. Sie können beispielsweise festlegen1m, dass die Regeln einmal pro Minute oder 30s einmal alle 30 Sekunden ausgewertet werden.

  5. Wählen Sie Save Changes.