配置数据源托管警报规则 - Amazon Managed Grafana

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

配置数据源托管警报规则

本文档主题专为支持 Grafana 版本 10.x 的 Grafana 工作空间而设计。

有关支持 Grafana 9.x 版本的 Grafana 工作空间,请参阅。在 Grafana 版本 9 中工作

有关支持 Grafana 8.x 版本的 Grafana 工作空间,请参阅。在 Grafana 版本 8 中工作

为启用了标尺 API 的外部 Grafana Mimir 或 Loki 实例创建警报规则;这些规则称为数据源托管警报规则。

注意

具有编辑或管理员角色的用户可以编辑或删除外部 Grafana Mimir 或 Loki 实例的警报规则。

如果您删除了在 UI 中创建的警报资源,则无法再对其进行检索。要备份您的配置并恢复已删除的警报资源,请使用 Terraform 或警报 API 创建您的警报资源。

先决条件

注意

如果您不想管理特定 Loki 或 Prometheus 数据源的警报规则,请进入其设置并清除 “通过警报 UI 管理警报” 复选框。

在以下步骤中,我们将指导您完成创建数据源托管警报规则的过程。

要创建数据源管理的警报规则,请使用工作区内警报创建流程并按照以下步骤为您提供帮助。

设置警报规则名称
  1. 选择警报和 IRM-> 警报规则-> + 新警报规则

  2. 输入名称以标识您的警报规则。

    此名称显示在警报规则列表中。它也是根据此规则创建的每个警报实例的alertname标签。

定义查询以获取要测量的数据,以及触发警报规则之前需要满足的条件。

定义查询和条件
  1. 默认情况下,所有警报规则均由 Grafana 管理。要切换到数据源管理的警报规则,请选择切换到数据源管理的警报规则。

  2. 从下拉列表中选择一个数据源。

    您也可以选择 “打开高级数据源选择器” 以查看更多选项,包括添加数据源(仅限管理员)。

  3. 输入 PromQL 或 LogQL 查询。

  4. 选择 “预览警报”。

使用警报规则评估来确定评估警报规则的频率以及应以多快的速度更改其状态。

设置警报评估行为
  1. 选择命名空间或选择 + 新建命名空间

  2. 选择评估组或选择 + 新建评估组

    如果要创建新的评估组,请为该组指定间隔。

    同一组中的所有规则均在相同的时间间隔内按顺序进行评估。

  3. 输入待定时段。

    待处理期是指警报规则在触发之前可能违反条件的时期。

    满足条件后,警报就会进入Pending状态。如果条件在指定的持续时间内保持活动状态,则警报将转换为Firing状态,否则将恢复到该Normal状态。

在警报规则中添加标签,以设置应使用哪种通知策略来处理您的触发警报实例。

所有警报规则和实例,无论其标签如何,都与默认通知策略相匹配。如果没有嵌套策略,或者没有嵌套策略与警报规则或警报实例中的标签相匹配,则默认的通知策略是匹配的策略。

配置 通知
  • 如果您想更改通知的发送方式,请添加标签。

    通过从下拉列表中选择现有的键值对来添加自定义标签,或者通过输入新的键或值来添加新标签。

添加注释以在警报通知中提供有关警报的更多背景信息。

注释会添加元数据,以便在警报通知中提供有关警报的更多信息。例如,添加Summary注释以告诉您哪个值导致警报触发,或者警报发生在哪个服务器上。

添加注释
  1. [可选] 添加摘要。

    简短总结了发生的事情和原因。

  2. [可选] 添加描述。

    警报规则的作用描述。

  3. [可选] 添加运行手册网址。

    存放警报运行手册的网页

  4. [可选] 添加自定义注释

  5. [可选] 添加仪表板和面板链接。

    将警报链接到仪表板中的面板。

  6. 选择保存规则