抑制复合警报操作 - Amazon CloudWatch

抑制复合警报操作

复合警报允许您在多个警报中获得运行状况的聚合视图,因此存在一些预计会触发这些警报的常见情况。例如,在应用程序的维护时段或调查正在发生的事件时。在这种情况下,您可能需要抑制复合警报的操作,以防止不必要的通知或创建新的事件工单

通过复合告警操作抑制,您可以将告警定义为抑制器告警。抑制器告警可防止复合告警采取行动。例如,您可以指定表示支持资源状态的抑制器告警。如果支持资源关闭,则抑制器告警会阻止复合告警发送通知。复合告警操作抑制功能可帮助您降低警报噪音,从而减少管理告警的时间,将更多的时间集中在操作上。

您可以在配置复合告警时指定抑制器告警。任何告警都可以用作抑制器告警。当抑制器告警的状态从 OK 变为 ALARM 时,其复合告警停止执行操作。当抑制器告警的状态从 ALARM 变为 OK 时,其复合告警恢复执行操作。

WaitPeriodExtensionPeriod

指定抑制器告警时,需要设置参数 WaitPeriodExtensionPeriod。这些参数可防止复合告警在抑制器告警改变状态时意外执行操作。使用 WaitPeriod 补偿当抑制器告警从 OK 变为 ALARM 时发生的任何延迟。例如,如果抑制器告警在 60 秒内从 OK 变为 ALARM,则将 WaitPeriod 设置为 60 秒。

WaitPeriod 内的操作抑制

在图像中,复合告警在 t2 时从 OK 变为 ALARMWaitPeriod 在 t2 时开始并在 t8 时结束。这使抑制器告警有时间在 t4 时从状态 OK 变为 ALARM,然后在 WaitPeriod 在 t8 时到期时抑制复合告警的操作。

使用 ExtensionPeriod 补偿当抑制器告警变为 OK 后复合告警变为 OK 时发生的任何延迟。例如,如果复合告警在抑制器告警变为 OK 的 60 秒内变为 OK,则将 ExtensionPeriod 设置为 60 秒。

ExtensionPeriod 内的操作抑制

在图像中,抑制器告警在 t2 时从 ALARM 变为 OKExtensionPeriod 在 t2 时开始并在 t8 时结束。这使得复合告警有时间从 ALARM 变为 OK,然后 ExtensionPeriod 在 t8 时到期。

复合告警在 WaitPeriodExtensionPeriod 变为活动状态时不执行操作。当 ExtensionPeriodWaitPeriod 变为非活动状态时,复合告警基于其当前状态执行操作。我们建议您将每个参数的值设置为 60 秒,因为 CloudWatch 每分钟评估一次指标告警。您可以将参数设置为任意整数(以秒为单位)。

以下示例更详细地描述了 WaitPeriodExtensionPeriod 如何防止复合告警意外执行操作。

注意

在以下示例中,WaitPeriod 配置为 2 个时间单位,ExtensionPeriod 配置为 3 个时间单位。

示例

示例 1:操作在 WaitPeriod 后未被抑制

操作抑制的第一个示例

在图像中,复合告警在 t2 时状态从 OK 变为 ALARMWaitPeriod 在 t2 时开始并在 t4 时结束,因此它可以阻止复合告警执行操作。WaitPeriod 在 t4 时到期后,复合告警会执行操作,因为抑制器告警仍处于 OK 状态。

示例 2:操作在 WaitPeriod 到期前被告警抑制

操作抑制的第二个示例

在图像中,复合告警在 t2 时状态从 OK 变为 ALARMWaitPeriod 在 t2 时开始并在 t4 时结束。这使抑制器告警有时间在 t3 时从状态 OK 变为 ALARM。因为抑制器告警的状态在 t3 时从 OK 变为 ALARM,从 t2 开始的 WaitPeriod 将被丢弃,抑制器告警现在会阻止复合告警执行操作。

示例 3:操作被 WaitPeriod 抑制时的状态转换

操作抑制的第三个示例

在图像中,复合告警在 t2 时状态从 OK 变为 ALARMWaitPeriod 在 t2 时开始并在 t4 时结束。这使抑制器告警有时间改变状态。复合告警在 t3 时变回 OK,所以在 t2 时开始的 WaitPeriod 被丢弃。新的 WaitPeriod 在 t3 时开始并在 t5 时结束。新的 WaitPeriod 在 t5 时到期后,复合告警将执行操作。

Example 4: State transition when actions are suppressed by alarm(示例 4:操作被告警抑制时的状态转换)

操作抑制的第四个示例

在图像中,复合告警在 t2 时状态从 OK 变为 ALARM。抑制器告警已经处于 ALARM 状态。抑制器告警可防止复合告警执行操作。

示例 5:操作在 ExtensionPeriod 后未被抑制

操作抑制的第五个示例

在图像中,复合告警在 t2 时状态从 OK 变为 ALARMWaitPeriod 在 t2 时开始并在 t4 时结束。这使抑制器告警有时间在 t3 时从状态 OK 变为 ALARM,然后在 t6 前抑制复合告警的操作。因为抑制器告警的状态在 t3 时从 OK 变为 ALARM,从 t2 开始的 WaitPeriod 将被丢弃。在 t6 时,抑制器告警变为 OKExtensionPeriod 在 t6 时开始并在 t9 时结束。ExtensionPeriod 到期后,复合告警将执行操作。

示例 6:操作被 ExtensionPeriod 抑制时的状态转换

操作抑制的第六个示例

在图像中,复合告警在 t2 时状态从 OK 变为 ALARMWaitPeriod 在 t2 时开始并在 t4 时结束。这使抑制器告警有时间在 t3 时从状态 OK 变为 ALARM,然后在 t6 前抑制复合告警的操作。因为抑制器告警的状态在 t3 时从 OK 变为 ALARM,从 t2 开始的 WaitPeriod 将被丢弃。在 t6 时,抑制器告警变回 OKExtensionPeriod 在 t6 时开始并在 t9 时结束。当复合告警在 t7 时变回 OK 时,ExtensionPeriod 被丢弃,并且新的 WaitPeriod 在 t7 时开始并在 t9 时结束。

提示

如果您更换操作抑制器告警,则任何活动的 WaitPeriodExtensionPeriod 将被丢弃。