

本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。

# 使用亚马逊监控 Route 53 VPC 解析器终端节点 CloudWatch
<a name="monitoring-resolver-with-cloudwatch"></a>

您可以使用 Amazon CloudWatch 来监控由 Route 53 VPC 解析器终端节点转发的 DNS 查询数量。Amazon CloudWatch 收集原始数据并将其处理为可读的近乎实时的指标。这些统计数据会保存两周，以便您访问历史信息并更好地了解资源的运行情况。默认情况下，Resolver 端点的指标数据每隔五分钟自动发送 CloudWatch一次。五分钟间隔也是可以发送指标数据的最小间隔。

有关 VPC 解析器的更多信息，请参阅[什么是 Route 53 VPC 解析器？](resolver.md)。有关的更多信息 CloudWatch，请参阅 [Amazon 是什么 CloudWatch？](https://docs.aws.amazon.com/AmazonCloudWatch/latest/DeveloperGuide/WhatIsCloudWatch.html) 在《*亚马逊 CloudWatch 用户指南》*中。

## Route 53 VPC 解析器的指标和维度
<a name="metrics-dimensions-resolver"></a>

当您配置 VPC Resolver 以将 DNS 查询转发到您的网络，反之亦然时，VPC 解析器开始每五分钟发送一次[指标](https://docs.aws.amazon.com/Route53/latest/DeveloperGuide/monitoring-resolver-with-cloudwatch.html#cloudwatch-metrics-resolver)和[维度](https://docs.aws.amazon.com/Route53/latest/DeveloperGuide/monitoring-resolver-with-cloudwatch.html#cloudwatch-dimensions-resolver)， CloudWatch 大约与转发的查询数量相同。您可以使用以下过程在 CloudWatch 控制台中查看指标或使用 AWS Command Line Interface (AWS CLI) 查看这些指标。

**使用控制台查看 VPC 解析器 CloudWatch 指标**

1. 打开 CloudWatch 控制台，网址为[https://console.aws.amazon.com/cloudwatch/](https://console.aws.amazon.com/cloudwatch/)。

1. 在导航栏上，选择您在其中创建了端点的区域。

1. 在导航窗格中，选择**指标**。

1. 在**全部指标**选项卡上，选择 **Route 53 Resolver (Route 53 解析程序)**。

1. 选择 **By Endpoint (按端点)** 以查看指定端点的查询计数。然后，选择您想要查看其查询数的端点。

   选择 “**跨所有终端节点**” 可查看当前 AWS 账户创建的所有入站终端节点或所有出站终端节点的查询计数。然后选择**InboundQueryVolume**或**OutboundQueryVolume**以查看所需的计数。

**要查看指标，请使用 AWS CLI**
+ 在命令提示符处输入下面的命令：

  ```
  1. aws cloudwatch list-metrics --namespace "AWS/Route53Resolver"
  ```

**Topics**
+ [

### CloudWatch Route 53 VPC 解析器的基本指标
](#cloudwatch-metrics-resolver)
+ [

### CloudWatch Route 53 VPC 解析器的详细指标
](#cloudwatch-detailed-metrics-resolver)
+ [

### Route 53 VPC 解析器指标的维度
](#cloudwatch-dimensions-resolver)

### CloudWatch Route 53 VPC 解析器的基本指标
<a name="cloudwatch-metrics-resolver"></a>

`AWS/Route53Resolver`命名空间包括免费的 Route 53 VPC 解析器终端节点和 IP 地址的基本指标。

**Topics**
+ [

#### Route 53 VPC 解析器终端节点的指标
](#cloudwatch-metrics-resolver-endpoint)
+ [

#### Route 53 VPC 解析器 IP 地址的指标
](#cloudwatch-metrics-resolver-ip-address)

#### Route 53 VPC 解析器终端节点的指标
<a name="cloudwatch-metrics-resolver-endpoint"></a>

`AWS/Route53Resolver`命名空间包括 Route 53 VPC 解析器终端节点的以下指标。

**EndpointHealthyENICount**  
 处于 `OPERATIONAL` 状态的弹性网络接口数。这表示此端点（由 `EndpointId` 指定）的 Amazon VPC 网络接口配置正确，并能够在您的网络和 Resolver 之间传递入站和出站 DNS 查询。  
有效统计数据：最小值、最大值、平均值  
单位：计数

**EndpointUnhealthyENICount**  
 处于 `AUTO_RECOVERING` 状态的弹性网络接口数。  
这意味着解析程序正在尝试恢复一个或多个与端点关联的 Amazon VPC 网络接口（由 `EndpointId` 指定）。在恢复过程中，端点会工作但容量受限，并且在完全恢复之前无法处理 DNS 查询。  
有效统计数据：最小值、最大值、平均值  
单位：计数

**InboundQueryVolume**  
对于入站终端节点，指 VPCs 通过指定的终端节点从您的网络转发到您的网络的 DNS 查询数量`EndpointId`。  
有效统计数据：Sum  
单位：计数

**OutboundQueryVolume**  
对于出站终端节点，指通过指定的终端节点从您转发 VPCs 到您的网络的 DNS 查询数量`EndpointId`。  
有效统计数据：Sum  
单位：计数

**OutboundQueryAggregateVolume**  
对于出站终端节点，指从 Amazon 转发 VPCs 到您的网络的 DNS 查询总数，包括以下内容：  
+ 通过由指定的终端节点从您的网络转发 VPCs 到您的网络的 DNS 查询数量`EndpointId`。
+ 当当前账户与其他账户共享 Resolver 规则时 VPCs ，由其他账户创建的查询将通过`EndpointId`指定的终端节点转发到您的网络。
有效统计数据：Sum  
单位：计数

**ResolverEndpointCapacityStatus**  
Resolver 端点的容量状态。该指标表示当前的容量利用率状态，其中：0 = 正常（正常运行容量），1 = 警告（至少有一个弹性网络接口的容量利用率超过 50%），2 = 严重（至少有一个弹性网络接口的容量利用率超过 75%）。  
容量状态由多个因素决定，包括查询量、查询延迟、DNS 协议、DNS 数据包大小和连接跟踪状态。  
有效统计数据：Maximum  
单位：无

**VPC 解析器终端节点容量管理的最佳实践**  
为解决容量问题，我们通常建议您增加 Resolver 端点的弹性网络接口数量。但是，以下是针对特定端点类型的重要注意事项：

对于**入站端点**，流量负载平衡取决于客户。因此，容量警告或严重提醒可能表示存在一个“热点”，其中一部分弹性网络接口的利用率不成比例。
+ 要确定潜在的负载平衡问题，请分别检查每个 elastic network interface 的[InboundQueryVolume](#cloudwatch-metrics-resolver-ip-address)指标。

对于**出站端点**，流量将在弹性网络接口之间自动平衡。容量问题可能是由于目标名称服务器出现问题，也可能是由于高延迟的超时查询使 Resolver 网络接口不堪重负。
+ 在这些情况下，仅仅增加弹性网络接口数量可能没有效果，此时我们建议修复目标名称服务器。

#### Route 53 VPC 解析器 IP 地址的指标
<a name="cloudwatch-metrics-resolver-ip-address"></a>

`AWS/Route53Resolver` 命名空间包括与 Resolver 入站或出站端点关联的每个 IP 地址的以下指标。（当您指定终端节点时，VPC 解析器会创建一个 Amazon VPC [弹性网络接口](https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/using-eni.html)。）

**InboundQueryVolume**  
对于入站端点的每个 IP 地址，从您的网络转发到指定 IP 地址的 DNS 查询数。每个 IP 地址都由 IP 地址 ID 标识。您可以使用 Route 53 控制台获取此值。在适用端点的页面上，在“IP 地址”部分中参阅 **IP address ID (IP 地址 ID)** 列。您也可以使用[ListResolverEndpointIpAddresses](https://docs.aws.amazon.com/Route53/latest/APIReference/API_route53resolver_ListResolverEndpointIpAddresses.html)以编程方式获取值。  
有效统计数据：Sum  
单位：计数

**OutboundQueryAggregateVolume**  
对于您的出站终端节点的每个 IP 地址，即从 Amazon 转发 VPCs 到您的网络的 DNS 查询总数，包括以下内容：  
+ 使用指定 IP 地址从您的网络转发 VPCs 到您的网络的 DNS 查询数量。
+ 当当前账户与其他账户共享 Resolver 规则时 VPCs ，来自这些规则的查询由其他账户创建，然后使用指定的 IP 地址转发到您的网络。
每个 IP 地址都由 IP 地址 ID 标识。您可以使用 Route 53 控制台获取此值。在适用端点的页面上，在“IP 地址”部分中参阅 **IP address ID (IP 地址 ID)** 列。您也可以使用[ListResolverEndpointIpAddresses](https://docs.aws.amazon.com/Route53/latest/APIReference/API_route53resolver_ListResolverEndpointIpAddresses.html)以编程方式获取值。  
有效统计数据：Sum  
单位：计数

### CloudWatch Route 53 VPC 解析器的详细指标
<a name="cloudwatch-detailed-metrics-resolver"></a>

Route 53 VPC Resolver 提供 RNI 增强版和目标名称服务器指标作为终端节点的选择加入功能。这些指标每隔 1 分钟发送 CloudWatch 一次。

**注意**  
默认情况下，详细指标未启用，但可以在终端节点级别启用。在使用 RniEnhancedMetricsEnabled 和 TargetNameServerMetricsEnabled 标志创建或更新端点时，可以通过编程方式启用这些指标。有关更多信息，请参阅[CreateResolverEndpoint](https://docs.aws.amazon.com/Route53/latest/APIReference/API_route53resolver_CreateResolverEndpoint.html)和[UpdateResolverEndpoint](https://docs.aws.amazon.com/Route53/latest/APIReference/API_route53resolver_UpdateResolverEndpoint.html)。
使用 Route 53 Resolver 终端节点详细指标需支付标准 CloudWatch 定价和费用。有关更多信息，请参阅 [Amazon CloudWatch 定价](https://aws.amazon.com/cloudwatch/pricing/)。

**Topics**
+ [

#### RNI 增强指标
](#cloudwatch-detailed-metrics-resolver-endpoints-ip-addresses)
+ [

#### 目标名称服务器指标
](#cloudwatch-detailed-metrics-resolver-endpoints-target-nameservers)

#### RNI 增强指标
<a name="cloudwatch-detailed-metrics-resolver-endpoints-ip-addresses"></a>

Route 53 Resolver 向亚马逊发布了 RNI 增强指标， CloudWatch 用于监控解析器终端节点和解析器 IP 地址的性能和运行状况。`AWS/Route53Resolver`命名空间包括以下 Route 53 Resolver 入站和出站终端节点的 RNI 增强指标`EndpointId`，`RniId`维度：

**P90 ResponseTime**  
与解析器终端节点 (`RniId`) 关联的解析器 IP () 收到的 DNS 查询的响应延迟百分位数 () `EndpointId`  
有效统计数据：Maximum  
单位：微秒

**ServFailQueries**  
发送到与解析器终端节点关联的解析器 IP (`RniId`) 的 DNS 查询的 SERVFAIL 响应数 () `EndpointId`  
有效统计数据：Sum  
单位：计数

**NxDomainQueries**  
发送到与解析器终端节点关联的解析器 IP (`RniId`) 的 DNS 查询的 NXDOMAIN 响应数量 () `EndpointId`  
有效统计数据：Sum  
单位：计数

**RefusedQueries**  
发送到与解析器终端节点关联的解析器 IP (`RniId`) 的 DNS 查询的拒绝响应数 () `EndpointId`  
有效统计数据：Sum  
单位：计数

**FormErrorQueries**  
发送到与解析器终端节点关联的解析器 IP (`RniId`) 的 DNS 查询的 FORMERR 响应数 () `EndpointId`  
有效统计数据：Sum  
单位：计数

**TimeoutQueries**  
发送到与解析器终端节点关联的解析器 IP (`RniId`) 的 DNS 查询的超时次数 () `EndpointId`  
有效统计数据：Sum  
单位：计数

#### 目标名称服务器指标
<a name="cloudwatch-detailed-metrics-resolver-endpoints-target-nameservers"></a>

Route 53 Resolver 向 Amazon 发布目标名称服务器指标， CloudWatch 用于监控与解析器终端节点关联的目标名称服务器的性能和可用性。`AWS/Route53Resolver`命名空间包含 Route 53 Resolver 出站终端节点的以下详细指标`EndpointID`，`TargetNameServerIP`维度：

**P90 ResponseTime**  
通过解析器端点发送的 DNS 查询的目标域名服务器 IP (`TargetNameServerIP`) 的响应延迟 () 的第 90 个百分位数 () `EndpointID`  
有效统计数据：Maximum  
单位：微秒

**RequestQueries**  
通过解析器端点 () 发送到目标名称服务器 IP (`TargetNameServerIP`) 的 DNS 查询数。`EndpointID`  
有效统计数据：Sum  
单位：计数

**TimeoutQueries**  
通过解析器端点 (`EndpointID`) 发送的、在目标名称服务器 IP (`TargetNameServerIP`) 处超时的 DNS 查询数。  
有效统计数据：Sum  
单位：计数

**注意**  
在某些情况下，可能会在 VPC 解析器指标 (ResolverEndpointCapacityStatus) 和 RNI 增强型指标中观察到差距。当您的网络接口连续进行定期维护或更新时，可能会出现这些差距。将网络接口返回服务后，我们的服务至少需要 1 分钟才能收集运营数据并发布这些指标。这些差距并不表示您的 VPC 解析器终端节点出现故障。如果您要为这些指标配置 CloudWatch 警报，我们建议您采取以下措施：  
将警报设置为 “将丢失的数据视为忽略”，或者
将报警阈值的评估期配置为超过五分钟。
这些设置将有助于减少正常维护活动期间的错误警报。

### Route 53 VPC 解析器指标的维度
<a name="cloudwatch-dimensions-resolver"></a>

入站和出站终端节点的 Route 53 VPC 解析器指标使用`AWS/Route53Resolver`命名空间并提供以下维度的指标：
+ `EndpointId`：如果您为`EndpointId`维度指定值，则 CloudWatch 返回指定终端节点的 DNS 查询次数。如果您未指定`EndpointId`，则 CloudWatch 返回当前 AWS 账户为所有终端节点创建的 DNS 查询次数。
+ `RniId``OutboundQueryAggregateVolume`和`InboundQueryVolume`指标支持维度。
+ `EndpointId`、、、`P90ResponseTime``ServFailQueries``NxDomainQueries``RefusedQueries``FormErrorQueries`、和与解析器端点关联`TimeoutQueries`的解析器 IP 地址支持`RniId`维度。
+ `EndpointID``P90ResponseTime``RequestQueries`、和与解析器端点关联`TimeoutQueries`的目标名称服务器支持`TargetNameServerIP`维度。