创建 Grafana Mimir 或 Loki 管理的警报规则 - Amazon Managed Grafana

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

创建 Grafana Mimir 或 Loki 管理的警报规则

本文档主题专为支持 Grafana 9.x 版本的 Grafana 工作区而设计。

对于支持 Grafana 10.x 版本的 Grafana 工作区,请参阅 使用 Grafana 版本 10

对于支持 Grafana 8.x 版本的 Grafana 工作区,请参阅 使用 Grafana 版本 8

使用 Grafana,您可以为外部 Grafana Mimir 或 Loki 实例创建警报规则。

注意

Grafana Mimir 可以连接到 Amazon Managed Service for Prometheus 和 Prometheus 数据来源。

先决条件

  • 验证您是否拥有 Prometheus 数据来源的写入权限。如果没有,您将无法创建或更新 Cortex 管理的警报规则。

  • 对于 Grafana Mimir 和 Loki 数据来源,通过配置其各自的服务启用 ruler API。

    • Lokilocal 规则存储类型是 Loki 数据来源的默认设置,仅支持查看规则。要编辑规则,请配置其他存储类型之一。

    • Grafana Mimir:使用旧前缀 /api/prom,而不是 /prometheus。Prometheus 数据来源同时支持 Grafana Mimir 和 Prometheus,并且 Grafana 预期 Query API 和 Ruler API 使用相同的 URL。您不能为 Ruler API 提供单独的 URL。

注意

如果您不想管理特定 Loki 或 Prometheus 数据来源的警报规则,请转到其设置,并清除通过警报用户界面管理警报复选框。

添加 Grafana Mimir 或 Loki 管理的警报规则
  1. 在 Grafana 控制台的 Grafana 菜单中,选择警报(铃铛)图标,打开列出现有警报的警报页面。

  2. 选择创建警报规则

  3. 步骤 1 中,选择规则类型和详细信息,如下所示:

    • 选择 Mimir 或 Loki 警报

    • 规则名称中,添加描述性名称。此名称将显示在警报规则列表中。这也是根据此规则创建的每个警报实例的 alertname 标签。

    • 选择数据来源下拉列表中,选择 Prometheus 或 Loki 数据来源。

    • 命名空间下拉列表中,选择现有的规则命名空间。否则,选择新增,然后输入名称以新建。命名空间可以包含一个或多个规则组,并且只能用于组织目的。有关更多信息,请参阅 Cortex 或 Loki 规则组和命名空间

    • 下拉列表中,选择所选命名空间内的现有群组。否则,选择新增,然后输入名称以新建。新创建的规则会附加到该组的末尾。组内的规则以固定时间间隔按顺序运行,评估时间相同。

  4. 步骤 2 中,添加要评估的查询。

    该值可以是 PromQL 或 LogQL 表达式。如果评估结果中至少有一个序列的值大于 0,则规则会启动警报。会为每个序列创建一个警报。

  5. 步骤 3 中,指定警报评估间隔。

    在条件的时长文本框中,指定条件必须保持为 true 的持续时间,超过该时间后才会启动警报。如果您指定 5m,则条件必须持续五分钟为 true,才会启动警报。

    注意

    满足条件后,警报将进入 Pending 状态。如果条件在指定的持续时间保持为激活状态,警报将转入 Firing 状态。如果不再保持此状态,则恢复到 Normal 状态。

  6. 步骤 4 中,添加与规则相关联的其他元数据。

    • 添加描述和摘要以自定义警报消息。使用 标签和注释 中的指南。

    • 添加运行手册 URL、面板、控制面板和警报 ID。

    • 添加自定义标签。

  7. 选择预览警报,以评估规则,并查看会产生哪些警报。这将显示警报列表,其中包含每个警报的状态和值。

  8. 选择保存以保存规则,或者选择保存并退出,以保存规则并返回警报页面。

在创建规则后,您便可以为规则创建通知。有关通知的更多信息,请参阅 管理警报通知