本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
创建 Grafana Mimir 或 Loki 管理的警报规则
本文档主题专为支持 Grafana 9.x 版本的 Grafana 工作区而设计。
对于支持 Grafana 10.x 版本的 Grafana 工作区,请参阅 使用 Grafana 版本 10。
对于支持 Grafana 8.x 版本的 Grafana 工作区,请参阅 使用 Grafana 版本 8。
使用 Grafana,您可以为外部 Grafana Mimir 或 Loki 实例创建警报规则。
注意
Grafana Mimir 可以连接到 Amazon Managed Service for Prometheus 和 Prometheus 数据来源。
先决条件
-
验证您是否拥有 Prometheus 数据来源的写入权限。如果没有,您将无法创建或更新 Cortex 管理的警报规则。
-
对于 Grafana Mimir 和 Loki 数据来源,通过配置其各自的服务启用 ruler API。
-
Loki:
local
规则存储类型是 Loki 数据来源的默认设置,仅支持查看规则。要编辑规则,请配置其他存储类型之一。 -
Grafana Mimir:使用旧前缀
/api/prom
,而不是/prometheus
。Prometheus 数据来源同时支持 Grafana Mimir 和 Prometheus,并且 Grafana 预期 Query API 和 Ruler API 使用相同的 URL。您不能为 Ruler API 提供单独的 URL。
-
注意
如果您不想管理特定 Loki 或 Prometheus 数据来源的警报规则,请转到其设置,并清除通过警报用户界面管理警报复选框。
添加 Grafana Mimir 或 Loki 管理的警报规则
-
在 Grafana 控制台的 Grafana 菜单中,选择警报(铃铛)图标,打开列出现有警报的警报页面。
-
选择创建警报规则。
-
在步骤 1 中,选择规则类型和详细信息,如下所示:
-
选择 Mimir 或 Loki 警报。
-
在规则名称中,添加描述性名称。此名称将显示在警报规则列表中。这也是根据此规则创建的每个警报实例的
alertname
标签。 -
从选择数据来源下拉列表中,选择 Prometheus 或 Loki 数据来源。
-
从命名空间下拉列表中,选择现有的规则命名空间。否则,选择新增,然后输入名称以新建。命名空间可以包含一个或多个规则组,并且只能用于组织目的。有关更多信息,请参阅 Cortex 或 Loki 规则组和命名空间。
-
从组下拉列表中,选择所选命名空间内的现有群组。否则,选择新增,然后输入名称以新建。新创建的规则会附加到该组的末尾。组内的规则以固定时间间隔按顺序运行,评估时间相同。
-
-
在步骤 2 中,添加要评估的查询。
该值可以是 PromQL 或 LogQL 表达式。如果评估结果中至少有一个序列的值大于 0,则规则会启动警报。会为每个序列创建一个警报。
-
在步骤 3 中,指定警报评估间隔。
在条件的时长文本框中,指定条件必须保持为 true 的持续时间,超过该时间后才会启动警报。如果您指定
5m
,则条件必须持续五分钟为 true,才会启动警报。注意
满足条件后,警报将进入
Pending
状态。如果条件在指定的持续时间保持为激活状态,警报将转入Firing
状态。如果不再保持此状态,则恢复到Normal
状态。 -
在步骤 4 中,添加与规则相关联的其他元数据。
-
添加描述和摘要以自定义警报消息。使用 标签和注释 中的指南。
-
添加运行手册 URL、面板、控制面板和警报 ID。
-
添加自定义标签。
-
-
选择预览警报,以评估规则,并查看会产生哪些警报。这将显示警报列表,其中包含每个警报的状态和值。
-
选择保存以保存规则,或者选择保存并退出,以保存规则并返回警报页面。
在创建规则后,您便可以为规则创建通知。有关通知的更多信息,请参阅 管理警报通知。