警报规则评估 - Amazon Managed Grafana

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

警报规则评估

本文档主题专为支持 Grafana 版本 10.x 的 Grafana 工作空间而设计。

有关支持 Grafana 9.x 版本的 Grafana 工作空间,请参阅。在 Grafana 版本 9 中工作

有关支持 Grafana 8.x 版本的 Grafana 工作空间,请参阅。在 Grafana 版本 8 中工作

使用警报规则评估来确定评估警报规则的频率以及应以多快的速度更改其状态。

为此,您需要确保您的警报规则位于正确的评估组中,并设置最适合您的用例的待处理时间。

评估小组

每条警报规则都是评估组的一部分。每个评估组都包含一个评估间隔,用于确定检查警报规则的频率。

对同一组内的@@ 数据源管理的警报规则依次进行评估,而不同组中的警报规则可以同时进行评估。当您要确保在任何警报规则之前评估录制规则时,此功能特别有用。

无论警报规则组如何,都会同时评估 Grafana 管理的警报规则。默认评估间隔设置为 10 秒,这意味着 Grafana 管理的警报规则每 10 秒评估一次,直到时钟上最接近的 10 秒窗口,例如 10:00:00、10:00:10、10:00:10、10:00:10、10:00:20 等。如果需要,您也可以配置自己的评估间隔。

注意

通知策略中的评估组和警报分组是两回事。在通知策略中分组允许在同一时间消息中发送多个共享相同标签的警报。

待定时期

通过设置待处理期,可以避免出现不必要的临时问题警报。

在待定时段中,您可以选择警报规则在触发之前可能违反条件的时段。

示例

想象一下,您的警报规则评估间隔设置为每 30 秒一次,待处理时间设置为 90 秒。

评估将按以下方式进行:

[00:30] 首次评估-未满足条件。

[01:00] 第二次评估——条件被违反。待定计数器启动。 警报开始待定。

[01:30] 第三次评估——条件违规。待处理计数器 = 30 秒。待处理状态。

[02:00] 第四次评估——条件违规。待处理计数器 = 60 秒待处理状态。

[02:30] 第五次评估——条件被违反。待处理计数器 = 90。警报开始触发

如果警报规则的状态需要在一定时间内处于违规状态才能采取行动,则其状态将发生如下变化:

  • 首次违反条件时,规则将进入 “待定” 状态。

  • 该规则将一直处于 “待定” 状态,直到条件在所需的时间(待处理期)内被打破。

  • 所需时间过后,规则将进入 “触发” 状态。

  • 如果在待处理期间该条件不再被打破,则该规则将恢复到正常状态。

注意

如果要跳过待处理状态,只需将待处理周期设置为 0 即可。这实际上跳过了待处理期,一旦违反条件,您的警报规则就会立即开始触发。

当警报规则触发时,会生成警报实例,然后将其发送到警报管理器。