探索警示 - Amazon Managed Grafana

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

探索警示

本文件主題是針對支援 Grafana 9.x 版的 Grafana 工作區所設計。

如需支援 Grafana 10.x 版的 Grafana 工作區,請參閱。在 Grafana 第 10 版工作

如需支援 Grafana 8.x 版的 Grafana 工作區,請參閱。在 Grafana 第 8 版中工作

無論您是要開始還是擴展 Grafana Alerting 的實施,都可以深入瞭解關鍵概念和可用功能,這些概念可協助您建立、管理和對警示採取行動,並提升團隊快速解決問題的能力。

首先,讓我們來看看 Grafana 警報提供的不同警報規則類型。

警示規則類型

格拉法亞管理規則

Grafana 管理的規則是最具彈性的警示規則類型。它們允許您創建警報,以對來自我們任何支持的數據源的數據採取行動。除了支援多個資料來源之外,您還可以新增運算式以轉換資料並設定警示條件。這是唯一允許在單一規則定義中從多個資料來源發出警示的規則類型。

密米尔和洛基规则

若要建立密米爾或洛基警示,您必須擁有相容的 Prometheus 或 Loki 資料來源。您可以通過測試數據源並觀察標尺 API 是否支持通過 Grafana 來檢查數據源是否支持規則創建。

錄製規則

錄製規則僅適用於相容的 Prometheus 或 Loki 資料來源。記錄規則可讓您預先計算經常需要或計算上昂貴的運算式,並將其結果儲存為新的時間序列集。如果您想要針對彙總資料執行警示,或者您的儀表板重複查詢運算成本較高的運算式,則此選項非常有用。

關鍵概念和功能

下表包含重要概念、功能及其定義的清單,旨在協助您充分利用 Grafana 警示。

關鍵概念或功能 定義

警示的資料來源

選取要查詢的資料來源,並從中視覺化指標、記錄和追蹤。

警示的佈建

管理您的警示資源,並使用檔案佈建或 Terraform 將其佈建到您的 Grafana 系統。

警報管理器

管理警示執行個體的路由和分組。

警示規則

應觸發警示規則的一組評估準則。警示規則包含一或多個查詢與運算式、條件、評估頻率以及符合條件的持續時間。警示規則可以產生多個警示例項。

警示實例

警示執行個體是警示規則的執行個體。單維警示規則有一個警示例項。多維警示規則具有一或多個警示執行個體。符合多個結果的單一警示規則 (例如 10 部虛擬機器的 CPU) 會計為多個 (在本例中為 10) 警示執行個體。這個數字可能會隨著時間而變化。例如,在新增虛擬機器時,監控系統中所有 VM 的 CPU 使用率的警示規則會有更多警示執行個體。如需警示執行個體配額的詳細資訊,請參閱。達到配額錯誤

警示群組

根據預設,Alertmanager 會使用根通知原則的標籤來分組警示執行個體。這可控制傳送至聯絡點的重複資料刪除和警示執行個體群組。

聯絡點

定義在警示規則觸發時通知連絡人的方式。

消息模板

創建可重用的自定義模板,並在聯繫點中使用它們。

通知政策

警示分組和路由到聯絡點的位置、時間和方式的一組規則。

標籤和標籤匹配器

標籤可唯一識別警示規則。它們會將警示規則連結至通知原則和靜音,決定應該處理哪些原則,以及應將哪些警示規則設為靜音。

沉默

停止來自一或多個警示執行個體的通知。靜音和靜音時間之間的區別在於,靜音僅持續指定的時間窗口,而靜音時間應按計劃重複出現。使用標籤匹配器靜音警報實例。

靜音計時

指定不要產生或傳送新通知的時間間隔。您也可以凍結週期性的警示通知,例如在維護期間。必須連結至現有的通知原則。