警报通知 - Amazon Managed Grafana

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

警报通知

本文档主题讨论了 Grafana 中的传统警报。未来版本的 Amazon Managed Grafana 将不支持此功能。您可以迁移到 Grafana Alerting 以使用最新的警报功能。有关更多信息,请参阅下列主题之一。

对于支持 Grafana 10.x 版本的 Grafana 工作区,请参阅 Grafana 10 版本中的警报

对于支持 Grafana 9.x 版本的 Grafana 工作区,请参阅 Grafana 9 版本中的警报

对于支持 Grafana 8.x 版本的 Grafana 工作区,请参阅 Grafana Alerting

当警报状态发生变化时,它会发出通知。每条警报规则可以有多个通知。要向警报规则添加通知,必须先添加和配置 notification 渠道。

这是在“通知渠道”页面上完成的。

添加通知渠道

  1. 在侧栏中,将鼠标悬停在警报(铃铛)图标上,然后选择通知渠道

  2. 选择 Add channel(添加通道)。

  3. 填写字段或选择以下各节中所述的选项。

新通知渠道字段

默认(对所有警报发送)

  • 名称:输入此渠道的名称。当用户向警报规则添加通知时,将显示该字段。

  • 类型:选择渠道类型。有关更多信息,请参阅 支持的通知程序列表

  • 默认(对所有警报发送):选择此选项后,将在此渠道上发送所有警报规则的通知。

  • 禁用解决消息:选择此选项后,将禁用警报状态恢复到 false 时发送的解决消息 [OK]。

  • 发送提醒:选择此选项后,将为警报发送其他通知(提醒)。您可以使用秒数(s)、分钟数(m)或小时数(h)来指定发送提醒的频率;例如:30s3m5m1h

重要

在对规则进行评估后会发送警报提醒。因此,发送提醒的频率不能超过配置的警报规则评估间隔。

以下示例显示了针对触发警报发送提醒的频率和时间。

警报规则评估间隔 发送提醒的间隔为 发送提醒的间隔为(在最后一次警报通知之后)
30s 15s ~30 秒
1m 5m ~5 分钟
5m 15m ~15 分钟
6m 20m ~24 分钟
1h 15m ~1 小时
1h 2h ~2 小时

支持的通知程序列表

名称 Type 支持映像 支持警报规则标签
Amazon Simple Notification Service sns
OpsGenie opsgenie
PagerDuty pagerduty
Slack slack
VictorOps victorops

Amazon Simple Notification Service

如果您已启用服务托管的权限并将 Amazon SNS 作为工作区的通知渠道,则只需在创建通知渠道时提供 SNS 主题 ARN 即可。在名称字段中,提供您创建的 SNS 主题的名称。如果您使用服务托管的权限创建了工作区,则 SNS 主题名称必须以 grafana 为前缀,这样通知才能成功发布到该主题。如果您在创建工作区时选择了客户管理的权限,则 SNS 主题名称无需加前缀 grafana

主题字段中,复制并粘贴 SNS 主题的 ARN。在消息正文格式中,您可以选择 JSON 或文本选项。

可选 AWS SNS 设置字段中,选中在消息中包含所有标签复选框以查看消息正文中的所有 Grafana 标签。

如果您使用工作区的客户管理权限,则您提供的 IAM 角色应包括针对您的 SNS 主题的 SNS 发布权限。

Slack

要设置 Slack,您必须配置传入的 Slack Webhook URL。有关详细信息,请参阅使用传入 Webhook 发送消息

要在 Slack 消息中包含触发警报的屏幕截图,您必须在 Grafana 中配置外部图像目标或通过 Slack 应用程序配置自动程序集成。有关设置 Slack 自动程序集成的详细信息,请参阅按照 Slack 的指南设置自动程序集成。使用提供的以 "xoxb" 开头的令牌。

设置 描述
Url Slack 的传入 Webhook URL,或者最终是 chat.postMessage Slack API 端点。
用户名 设置自动程序消息的用户名。
收件人 使用它来覆盖 Slack 收件人。您必须提供渠道 Slack ID、用户 Slack ID、用户名引用(@<user>,全部为小写,没有空格)或渠道引用(#<channel>,全部为小写,没有空格)。如果您使用 chat.postMessage Slack API 端点,则这是必需的。
图标表情符号 提供一个表情符号作为自动程序消息的图标。例如,:smile:
图标 URL 提供图像的 URL 作为自动程序消息的图标。
提及用户 (可选)在 Grafana 发送的 Slack 通知中提及一个或多个用户。要通过用户对应的 Slack ID 查看用户的逗号分隔列表,请选择每个用户的 Slack 个人资料上的溢出按钮。
提及群组 (可选)在 Grafana 发送的 Slack 通知中提及一个或多个组。您可以通过组对应的 Slack ID(可从每个组的 Slack 个人资料 URL 中获取)来查看组的逗号分隔列表。
提及渠道 (可选)提及所有渠道成员或仅提及活跃的渠道成员。
令牌 如果提供,Amazon Managed Grafana 将通过 Slack file.upload API 操作上传生成的图像,而不是外部图像目标。如果您使用 chat.postMessage Slack API 端点,则这是必需的。

如果您将令牌用于 Slack 自动程序,则必须邀请该自动程序加入您要发送通知的渠道。然后将渠道添加到收件人字段。

PagerDuty

要设置 PagerDuty,请提供集成密钥。

设置 描述
集成密钥 PagerDuty 的集成密钥。
严重性 动态通知的级别;默认为 critical(1)。
自动解决事件 警报恢复正常后,在 PagerDuty 中解决事件。
详细消息 从 PD 摘要字段中移除警报消息,改为将其放到自定义详细信息中(2)。
注意

标签 SeverityClassGroupdedup_keyComponentPagerDuty 通用事件格式 – PD-CEF 中有特殊含义。如果警报面板定义了这些标签键,则它们将被转置到发送到 PagerDuty 的事件的根目录。这意味着它们将在 PagerDuty UI 和筛选工具中可用。在警报上设置的严重性标签的级别有效,它会覆盖通知渠道上设置的全局严重性。

注意

使用“详细消息”将更改 PagerDuty 事件中 custom_details 字段的结构。如果您依赖于 payload.custom_details 中的字段,这可能会破坏您的 PagerDuty 规则中的自定义事件规则。将使用 custom_details.myMetric 的所有现有规则移至 custom_details.queries.myMetric

注意

使用 dedup_key 标签将覆盖 Grafana 使用自定义密钥生成的 dedup_key

所有警报通知都包含指向 Grafana 工作区中触发的警报的链接。