使用通知原則 - Amazon Managed Grafana

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

使用通知原則

本文件主題是針對支援 Grafana 8.x 版的 Grafana 工作區所設計。

如需支援 Grafana 10.x 版的 Grafana 工作區,請參閱。在 Grafana 第 10 版工作

如需支援 Grafana 9.x 版的 Grafana 工作區,請參閱。在 Grafana 第 9 版中工作

通知原則決定如何將警示路由至聯絡點。策略具有樹狀結構,其中每個策略可以有一個或多個子策略。除了根策略之外,每個策略也可以比對特定的警示標籤。每個警示均由根策略評估,然後由每個子策略評估。如果您為特定原則啟用Continue matching subsequent sibling nodes此選項,即使在一或多個相符項目之後,評估仍會繼續進行。父策略的組態設定和聯絡點資訊會控制不符合任何子策略的警示行為。根策略會管理任何與特定策略不相符的警示。

注意

您可以為 Grafana 管理的警示建立和編輯通知原則。警示管理員警示的通知原則是唯讀的。

分組通知

群組會將類似性質的警示通知分類為單一漏斗。如此一來,當系統的許多部分同時發生故障時,可讓您在較大的中斷期間控制警示通知,從而同時啟動大量警示。

分組範例

假設您有 100 個服務連接到不同環境中的數據庫。這些服務由標籤env=environmentname區分開來。有警示規則可用來監視您的服務是否可以連線到資料庫。警示規則會建立名為的警示alertname=DatabaseUnreachable

如果發生網路磁碟分割,其中一半的服務無法再連線到資料庫,就會起始 50 個不同的警示。在這種情況下,您想要收到單頁通知 (而不是 50),其中包含受影響的環境清單。

您可以將分組配置為group_by: [alertname](不使用env標籤,這對每個服務不同)。設定此設定後,Grafana 會傳送單一精簡通知,其中包含此警示規則的所有受影響環境。

特殊群組

Grafana 有兩個特殊的團體。預設group_by: null群組會將所有警示群組成單一群組。您也可以使用名為的特殊標籤,依所有標籤將警示分組、有效停用群組,以及將每個警示傳送...至自己的群組。

使用通知

下列程序說明如何建立及管理通知原則。

編輯根通知原則
  1. 在 Grafana 主控台的 Grafana 選單中,選擇警示 (鈴鐺) 圖示以開啟示頁面。

  2. 選擇 [通知原則]。

  3. 警報管理員下拉式清單中,選取您要編輯的警示管理員。

  4. 在 [根原則] 區段中,選擇 [編輯] 圖示 (筆)。

  5. 在 [預設聯絡人] 中,更新當警示規則不符合任何特定原則時應傳送通知的聯絡點。

  6. 分組依據中,選擇要將警示分組依據的標籤 (或特殊群組)。

  7. 計時選項中,從下列選項中選取。

    • 群組等待 — 傳送初始通知之前等待緩衝同一群組警示的時間。預設為 30 秒。

    • 群組間隔 — 群組的兩個通知之間的最短時間間隔。預設值為 5 分鐘。

    • 重複間隔 — 如果沒有新的警示新增至群組,則重新傳送通知之前的最短時間間隔。預設值為 4 小時。

  8. 選擇儲存,以儲存變更。

若要新增頂層特定原則
  1. 在 Grafana 主控台的 Grafana 選單中,選擇警示 (鈴鐺) 圖示以開啟示頁面。

  2. 選擇 [通知原則]。

  3. 警報管理員下拉式清單中,選取您要編輯的警示管理員。

  4. 在 [特定路由] 區段中,選擇 [新增特定原則]。

  5. 在「比對標籤」區段中,新增一或多個相符的警示標籤。有關標籤比對的詳細資訊將在本主題稍後介紹。

  6. 在「聯絡人點」中,新增要在警示符合此特定原則時傳送通知的聯絡點。巢狀政策會覆寫此聯絡點。

  7. 選擇性地選取覆寫群組來指定與根原則不同的群組。

  8. 選擇性地選取覆寫一般計時,以覆寫群組通知原則中的計時選項。

  9. 選擇儲存政策以儲存變更。

若要新增巢狀政策
  1. 展開您要在其下建立巢狀政策的特定策略。

  2. 選擇「新增巢狀政策」,然後新增詳細資料(就像新增頂層特定原則時一樣)。

  3. 選擇儲存政策以儲存變更。

編輯特定策略
  1. 在「示」頁面中,選擇「通知政策」以開啟列出現有策略的頁面。

  2. 選取您要編輯的策略,然後選擇「編」圖示 (筆)。

  3. 進行任何變更 (如新增頂層特定原則時)。

  4. 選擇 儲存政策

標籤匹配的工作原理

如果警示的標籤符合原則上指定的所有相符標籤,則原則會符合警示。

  • 標籤 — 要比對的標籤名稱。它必須完全符合警示的標籤名稱。

  • 運算子 — 用來比較標籤值與相符標籤值的運算子。可用的運算子包括:

    • =選擇其值與提供的字符串完全匹配的標籤。

    • !=選擇其值與提供的字符串不匹配的標籤。

    • =~選擇其值與所提供字符串的 regex 解釋值匹配的標籤(提供的字符串被解釋為正則表達式。

    • !=選取與提供的規則運算式不相符的標示。

  • — 要與標籤值相符的值。它可以作為字符串或正則表達式進行匹配,具體取決於選擇的運算符。

靜音計時

靜音計時是指未產生或傳送策略的新通知時的週期性時間間隔。使用它們來防止警報觸發特定且重複發生的時間段,例如定期維護期間。

與靜音類似,靜音計時不會阻止評估警示規則,也不會阻止警示執行個體顯示在使用者介面中。它們只會防止建立通知。

您可以設定 Grafana 管理的靜音計時,以及外部警示管理員資料來源的靜音計時。

靜音時序與靜音相比

下表重點介紹靜音計時和靜音之間的差異。

靜音時間 沉默

使用可重複出現的時間間隔定義

具有固定的開始和結束時間

建立並新增至通知原則

使用標籤與警示進行比對,以判斷是否要靜音

建立靜音計時
  1. 在 Grafana 主控台的 Grafana 選單中,選擇警示 (鈴鐺) 圖示以開啟示頁面。

  2. 選擇 [通知原則]。

  3. 警報管理員下拉式清單中,選取您要編輯的警示管理員。

  4. 在「靜音計時」區段中,選擇「新增靜音計時」按鈕。

  5. 選擇您要套用靜音計時的時間間隔。

  6. 選擇「提交」以建立靜音計時。

將靜音計時新增至通知原則
  1. 選取您要新增靜音計時的通知政策,然後選擇 [編] 按鈕。

  2. 靜音計時下拉式清單中,選取您要新增至政策的靜音計時。

    選擇 [儲存原則] 按鈕。

時間間隔

時間間隔是一個時間範圍的定義。如果在此間隔期間啟動警示,則會隱藏警示。使用支援範圍 : (例如,monday:thursday)。靜音計時可以包含多個時間間隔。時間間隔包含多個欄位 (下列清單中的詳細資訊),所有欄位都必須相符才能隱藏警示。例如,如果您指定星期幾monday:friday和時間範圍為 8:00-9:00,則警示會從星期一到星期五的 8-9 隱藏,但不會抑制,例如,星期六的 8 到 9。

  • 時間範圍 — 抑制通知的一天中的時間。由兩個子字段組成:開始時間結束時間。一個例子時間是14:30。時間以 24 小時表示法表示,以 UTC 表示。

  • 一周中的幾天 — 一周中的幾天。可以是單一天,例如範圍monday,例如monday:friday,或以逗號分隔的天數清單,例如monday, tuesday, wednesday

  • — 要選取的月份。您可以使用數字指定來指定月份,或使用完整的月份名稱來指定月份,例如,1january兩者都指定一月。您可以指定單一月份、月份範圍或以逗號分隔的月份清單。

  • 月中的日期 — 一個月內的日期。值的範圍可以是 1-31。負值以相反的順序指定月份中的天數,因此-1表示該月的最後一天。可以將月份中的天數指定為單一天、天數範圍或以逗號分隔的日期清單。