本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
Route 53 运行状况检查与 CloudWatch 指标集成,因此您可以执行以下操作:
-
验证是否已正确配置运行状况检查。
-
查看运行状况检查在指定时间段内的状态。
-
配置 CloudWatch 为在运行状况检查的状态为不健康时发送 Amazon SNS 警报。请注意,可能会在运行状况检查失败的几分钟后才会收到关联的 SNS 通知。
有关更多信息,请参阅 Amazon Route 53 如何确定运行状况检查是否正常。
检查运行状况检查状态
注意
我们正在更新 Route 53 的运行状况检查控制台。在过渡期间,您可以继续使用旧控制台。
选择您正在使用的控制台的选项卡。
查看运行状况检查的状态
登录 AWS Management Console 并打开 Route 53 控制台,网址为https://console.aws.amazon.com/route53/
。 -
在导航窗格中,选择运行状况检查。
选择要查看其指标的运行状况检查的链接 ID。
在底部窗格中,选择指标选项卡。
这两个图表以一分钟间隔显示了上一小时的状态:
- Health check status
-
该图表显示端点运行状况的 Route 53 评估。1 表示运行状况正常,0 表示运行状况不正常。
- 报告端点正常的运行状态检查程序 (%)
-
对于仅监控端点的运行状况检查,该图表显示了认为所选端点运行状况良好的 Route 53 运行状况检查程序的百分比。
当运行状况检查已禁用,此指标不可用。
- Number of healthy child health checks
-
仅适用于已计算的运行状况检查,该图表显示运行状况良好的子运行状况检查的数量。
-
要查看大图并指定不同的设置,请选择右上角的三个点,然后选择放大。您可以更改以下设置:
- Statistic
-
更改对数据 CloudWatch 执行的计算。
- 时间范围
-
显示不同时间段内的运行状况检查的状态,例如,隔夜或上周。
- Period
-
更改图表中的数据点之间的间隔。
请注意以下几点:
-
如果您刚刚创建运行状况检查,可能需要等待几分钟时间,数据才会显示在图表上,运行状况检查指标才会显示在可用指标列表中。
-
该图表不会自动自行刷新。要更新显示,请选择刷新 (
) 图标。
查看运行状况检查告警
注意
我们正在更新 Route 53 的运行状况检查控制台。在过渡期间,您可以继续使用旧控制台。
选择您正在使用的控制台的选项卡。
查看 CloudWatch Amazon Route 53 的警报状态和编辑警报
-
在 Route 53 控制台的导航窗格中,选择运行状况检查。
-
选择要查看其告警的运行状况检查的链接 ID。
-
在详细信息页面的底部,选择告警选项卡。
告警列表中包含已为所选运行状况检查创建的所有 Route 53 告警。
State (状态) 列显示每个告警的当前状态:
- 确定
-
CloudWatch 已从 Route 53 运行状况检查中积累了足够的统计数据,足以确定终端节点未达到警报阈值。
- INSUFFICIENT DATA
-
CloudWatch 积累的统计数据不足以确定终端节点是否达到警报阈值。这是新告警的初始状态。如果 CloudWatch 指标不可用,或者您删除运行状况检查而不删除关联警报,则警报状态也会更改为 “数据不足”。
- 告警
-
CloudWatch 已从 Route 53 运行状况检查中积累了足够的统计数据,足以确定终端节点是否达到警报阈值并向指定的电子邮件地址发送通知。
-
要在 CloudWatch 控制台中查看警报,该控制台提供了有关警报的更多详细信息(例如,警报更新和状态变化的历史记录),请选择警报的链接名称。您也可以在 CloudWatch 控制台上编辑警报。
-
要在 CloudWatch 控制台上创建新 CloudWatch 警报,请选择创建 CloudWatch 警报。有关更多信息,请参阅CloudWatch 用户指南中的查找和创建推荐警报。
在 CloudWatch 控制台上查看运行状况检查指标
在 CloudWatch 控制台上查看 Route 53 指标
-
登录 AWS Management Console 并打开 CloudWatch 控制台,网址为https://console.aws.amazon.com/cloudwatch/
。 -
将当前区域更改为美国东部(弗吉尼亚北部)。如果您选择其它任何区域作为当前区域,Route 53 指标将不可用。
在导航窗格中,选择 Metrics (指标)。
在 All metrics (所有指标) 选项卡上,选择 Route 53。
选择 Health Check Metrics (运行状况检查指标)。
您也可以在 CloudWatch 控制台上设置 SNS 通知。有关更多信息,请参阅CloudWatch 用户指南中的创建推荐警报。
使用 SNS 通知创建告警
注意
以下步骤仅适用于旧控制台。新的控制台将引导您进入 CloudWatch 控制台以创建警报。有关更多信息,请参阅CloudWatch 用户指南中的查找和创建推荐警报。
在运行状况检查状态为运行不佳时接收 Amazon SNS 通知(旧控制台)
在 Route 53 控制台的导航窗格中,选择 Health Checks(运行状况检查)。
选择相应运行状况检查对应的行。
-
在底部窗格中,选择 Alarms (告警) 选项卡。
该表列出了已为此运行状况检查创建的告警。
选择 Create Alarm (创建告警)。
-
指定以下值:
- 告警名称
输入您希望 Route 53 在 Alarms(告警)选项卡上的 Name(名称)列中显示的名称。
- 告警说明
(可选)输入告警的描述。此值显示在 CloudWatch 控制台中。
- 发送通知
选择当此运行状况检查的状态触发告警时是否希望 Route 53 向您发送通知。
- 通知目标(仅当“发送目标”为“Yes”时)
如果您想 CloudWatch 向现有 SNS 主题发送通知,请从列表中选择该主题。
如果您想发送通知 CloudWatch ,但不想向现有 SNS 主题发送通知,请执行以下操作之一:
如果您 CloudWatch 想发送电子邮件通知,请选择 “新建 SNS 主题”,然后继续此过程。
如果您 CloudWatch 想通过其他方法发送通知,请打开新的浏览器选项卡,前往 Amazon SNS 控制台,然后创建新主题。然后,返回到 Route 53 控制台,从 Notification target(通知目标)列表中选择新主题的名称,并继续执行此过程。
- Topic name(仅在您选择创建新 Amazon SNS 主题时适用)
输入新 Amazon SNS 主题的名称。
- Recipient email addresses(仅在您选择创建新 Amazon SNS 主题时适用)
输入在运行状况检查触发告警时希望 Route 53 将 SNS 通知发送到的电子邮件地址。
- 告警目标
选择您希望 Route 53 为此运行状况检查评估的值:
Health check status(运行状况检查状态)— Route 53 运行状况检查程序报告运行状况检查为正常或不正常
报告端点运行正常的运行状况检查程序(%)—(仅监控端点的运行状况检查) 报告运行状况检查状态为正常的 Route 53 运行状况检查程序的百分比
Number of healthy child health checks(正常的子运行状况检查的数量)(仅限于已计算的运行状况检查)— 已计算的运行状况检查中将运行状况检查的状态报告为正常的子运行状况检查的数量
TCP connection time(TCP 连接时间)(仅限于 HTTP 和 TCP 运行状况检查)— Route 53 运行状况检查程序与端点建立 TCP 连接所用的时间(毫秒)
Time to complete SSL handshake(完成 SSL 握手的时间)—(仅限于 HTTPS 运行状况检查)Route 53 运行状况检查程序完成 SSL/TLS 握手所需的时间(毫秒)
Time to first type(第一个字节的时间)(仅限于 HTTP 和 HTTPS 运行状况检查)— Route 53 运行状况检查程序接收响应 HTTP 或 HTTPS 请求的第一个字节所用的时间(毫秒)
- 告警目标
对于基于延迟(TCP 连接时间、完成 SSL 握手的时间、第一个字节的时间)的警报目标,请选择是CloudWatch 要计算特定区域中 Route 53 运行状况检查器的延迟,还是要计算所有区域(全球)的延迟。
请注意,如果您选择一个区域,Route 53 每分钟仅测量两次延迟,样本数将比选择所有区域时小。因此,更有可能出现离群值。为防止出现虚假警报通知,建议您指定更多的连续时间段,只有这些时间段内的运行状况检查都失败, CloudWatch 才会向您发送通知。
- 满足条件
-
使用以下设置来确定何时 CloudWatch 应触发警报。
告警目标 建议的条件 描述 Health check status
最小值 < 1
当端点运行状况不佳时,Route 53 运行状况检查程序将会报告。
报告端点正常的运行状态检查程序 (%)
平均值 < 预期百分比
仅监控端点的运行状况检查 — 当报告状态为正常的运行状况检查程序少于 18% 时,Route 53 将认为运行状况检查的状态为不正常。请勿选择此指标的 Sample Count(样本数),因为样本数的范围可能随 Route 53 添加更多运行状况检查区域而发生变化。平均值 将始终准确表示报告运行状况检查状态的检查程序的百分比。
Number of healthy child health checks
最小值 < 预期的正常子运行状况检查数
最小值 统计数据将返回最保守的值,并表示最糟糕的情况。
TCP connection time
平均值 > 所需时间 (毫秒)
平均值的值比其他统计数据更为一致。
Time to complete SSL handshake
平均值 > 所需时间 (毫秒)
平均值的值比其他统计数据更为一致。
Time to first byte
平均值 > 所需时间 (毫秒)
平均值的值比其他统计数据更为一致。
- 至少
x
连续一段时间y
minutes/hours/day -
指定在多少个连续时间段内指定的值均满足标准,Route 53 才会发送通知。然后指定时间段的长度。
-
当您选择 Create(创建)时,Amazon SNS 会向您发送一封电子邮件,其中包含有关新 SNS 主题的信息。
-
在电子邮件中,选择 Confirm subscription(确认订阅)。您必须确认订阅才能开始接收 CloudWatch 通知。