使用 CloudWatch 监控运行状况检查
Route 53 运行状况检查与 CloudWatch 指标集成,以便于您执行以下操作:
-
验证是否已正确配置运行状况检查。
-
查看运行状况检查在指定时间段内的状态。
-
将 CloudWatch 配置为在运行状况检查的状态为不正常时发送 Amazon SNS 提示。请注意,可能会在运行状况检查失败的几分钟后才会收到关联的 SNS 通知。
有关更多信息,请参阅 Amazon Route 53 如何确定运行状况检查是否正常。
检查运行状况检查状态
注意
我们正在更新 Route 53 的运行状况检查控制台。在过渡期间,您可以继续使用旧控制台。
选择您正在使用的控制台的选项卡。
查看运行状况检查告警
注意
我们正在更新 Route 53 的运行状况检查控制台。在过渡期间,您可以继续使用旧控制台。
选择您正在使用的控制台的选项卡。
在 CloudWatch 控制台上查看运行状况检查指标
要使用 CloudWatch 控制台查看 Route 53 指标
-
登录 AWS Management Console 并打开 CloudWatch 控制台,网址为 https://console.aws.amazon.com/cloudwatch/
。 -
将当前区域更改为美国东部(弗吉尼亚北部)。如果您选择其它任何区域作为当前区域,Route 53 指标将不可用。
在导航窗格中,选择 Metrics (指标)。
在 All metrics (所有指标) 选项卡上,选择 Route 53。
选择 Health Check Metrics (运行状况检查指标)。
您还可以在 CloudWatch 控制台上设置 SNS 通知。有关更多信息,请参阅《CloudWatch 用户指南》中的创建建议告警。
使用 SNS 通知创建告警
注意
以下步骤仅适用于旧控制台。新控制台会将您引导至 CloudWatch 控制台创建告警。有关更多信息,请参阅《CloudWatch 用户指南》中的查找和创建建议告警。
在运行状况检查状态为运行不佳时接收 Amazon SNS 通知(旧控制台)
在 Route 53 控制台的导航窗格中,选择 Health Checks(运行状况检查)。
选择相应运行状况检查对应的行。
-
在底部窗格中,选择 Alarms (告警) 选项卡。
该表列出了已为此运行状况检查创建的告警。
选择 Create Alarm (创建告警)。
-
指定以下值:
- 告警名称
输入您希望 Route 53 在 Alarms(告警)选项卡上的 Name(名称)列中显示的名称。
- 告警说明
(可选)输入告警的描述。此值显示在 CloudWatch 控制台上。
- 发送通知
选择当此运行状况检查的状态触发告警时是否希望 Route 53 向您发送通知。
- 通知目标(仅当“发送目标”为“Yes”时)
如果您希望 CloudWatch 向现有 SNS 主题发送通知,请从列表中选择该主题。
如果您希望 CloudWatch 发送通知,但不是向现有 SNS 主题发送,请执行以下操作之一:
如果您希望 CloudWatch 发送电子邮件通知 — 选择 New SNS topic(新建 SNS 主题)并继续此过程。
如果您希望 CloudWatch 通过其它方法发送通知 — 打开新的浏览器选项卡,转到 Amazon SNS 控制台,然后创建新主题。然后,返回到 Route 53 控制台,从 Notification target(通知目标)列表中选择新主题的名称,并继续执行此过程。
- Topic name(仅在您选择创建新 Amazon SNS 主题时适用)
输入新 Amazon SNS 主题的名称。
- Recipient email addresses(仅在您选择创建新 Amazon SNS 主题时适用)
输入在运行状况检查触发告警时希望 Route 53 将 SNS 通知发送到的电子邮件地址。
- 告警目标
选择您希望 Route 53 为此运行状况检查评估的值:
Health check status(运行状况检查状态)— Route 53 运行状况检查程序报告运行状况检查为正常或不正常
报告端点运行正常的运行状况检查程序(%)—(仅监控端点的运行状况检查) 报告运行状况检查状态为正常的 Route 53 运行状况检查程序的百分比
Number of healthy child health checks(正常的子运行状况检查的数量)(仅限于已计算的运行状况检查)— 已计算的运行状况检查中将运行状况检查的状态报告为正常的子运行状况检查的数量
TCP connection time(TCP 连接时间)(仅限于 HTTP 和 TCP 运行状况检查)— Route 53 运行状况检查程序与端点建立 TCP 连接所用的时间(毫秒)
Time to complete SSL handshake(完成 SSL 握手的时间)—(仅限于 HTTPS 运行状况检查)Route 53 运行状况检查程序完成 SSL/TLS 握手所需的时间(毫秒)
Time to first type(第一个字节的时间)(仅限于 HTTP 和 HTTPS 运行状况检查)— Route 53 运行状况检查程序接收响应 HTTP 或 HTTPS 请求的第一个字节所用的时间(毫秒)
- 告警目标
对基于延迟的告警目标(TCP connection time、Time to complete SSL handshake、Time to first byte),选择您希望 CloudWatch 为特定区域还是所有区域 (Global) 中的 Route 53 运行状况检查程序计算延迟。
请注意,如果您选择一个区域,Route 53 每分钟仅测量两次延迟,样本数将比选择所有区域时小。因此,更有可能出现离群值。为防止出现虚假告警通知,建议您指定更多的连续时间段,只有这些时间段内的运行状况检查都失败,CloudWatch 才会向您发送通知。
- 满足条件
-
使用以下设置可确定 CloudWatch 应在何时触发告警。
告警目标 建议的条件 描述 Health check status
最小值 < 1
当端点运行状况不佳时,Route 53 运行状况检查程序将会报告。
报告端点正常的运行状态检查程序 (%)
平均值 < 预期百分比
仅监控端点的运行状况检查 — 当报告状态为正常的运行状况检查程序少于 18% 时,Route 53 将认为运行状况检查的状态为不正常。请勿选择此指标的 Sample Count(样本数),因为样本数的范围可能随 Route 53 添加更多运行状况检查区域而发生变化。平均值 将始终准确表示报告运行状况检查状态的检查程序的百分比。
Number of healthy child health checks
最小值 < 预期的正常子运行状况检查数
最小值 统计数据将返回最保守的值,并表示最糟糕的情况。
TCP connection time
平均值 > 所需时间 (毫秒)
平均值的值比其他统计数据更为一致。
Time to complete SSL handshake
平均值 > 所需时间 (毫秒)
平均值的值比其他统计数据更为一致。
Time to first byte
平均值 > 所需时间 (毫秒)
平均值的值比其他统计数据更为一致。
- 连续周期至少
y
分/小时/天x
一次 -
指定在多少个连续时间段内指定的值均满足标准,Route 53 才会发送通知。然后指定时间段的长度。
-
当您选择 Create(创建)时,Amazon SNS 会向您发送一封电子邮件,其中包含有关新 SNS 主题的信息。
-
在电子邮件中,选择 Confirm subscription(确认订阅)。您必须确认订阅,才能开始接收 CloudWatch 通知。