

本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。

# 使用 Amazon CloudWatch 监控
<a name="monitoring-cloudwatch"></a>

Amazon CloudWatch 监控 FSx for Windows File Server 文件系统的原始数据，并将数据处理为可读且近乎实时的指标。这些统计数据会保存 15 个月，从而使您能够访问历史信息，以帮助您了解工作流程或文件系统的执行情况。

FSx for Windows File Server 发布以下领域的 CloudWatch 指标：
+ 网络 I/O 指标衡量访问文件系统的客户端和文件服务器之间的活动。
+ 文件服务器指标衡量网络吞吐量利用率、文件服务器 CPU 和内存，以及文件服务器磁盘吞吐量和 IOPS 利用率。
+ 磁盘 I/O 指标衡量文件服务器和存储卷之间的活动。
+ 存储卷指标衡量 HDD 存储卷的磁盘吞吐量利用率和 SSD 存储卷的 IOPS 利用率。
+ 存储容量指标衡量存储使用量，包括重复数据删除带来的存储节省。

下图说明了 FSx for Windows File Server 文件系统、其组件和指标领域。

![\[FSx for Windows File Server 在 CloudWatch 中报告监控网络 I/O、文件服务器性能和存储卷性能的指标。\]](http://docs.aws.amazon.com/zh_cn/fsx/latest/WindowsGuide/images/metrics-overview-FSxW.png)


默认情况下，适用于 Windows File Server 的 Amazon FSx 会以 1 分钟为间隔将指标数据发送到 CloudWatch，但以下项以 5 分钟为间隔发出：
+ `FileServerDiskThroughputBalance`
+ `FileServerDiskIopsBalance`

有关 CloudWatch 的更多信息，请参阅《Amazon CloudWatch 用户指南》**中的[什么是 Amazon CloudWatch？](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/WhatIsCloudWatch.html)。

对于单可用区文件系统，在文件系统维护或基础设施组件更换期间，可能不会发布指标；对于多可用区文件系统，在主文件服务器和辅助文件服务器之间进行失效转移和失效自动恢复期间，可能不会发布指标。

一些 Amazon FSx CloudWatch 指标以原始*字节*的形式进行报告。字节数不会舍入到十进制或二进制单位倍数。

**Topics**
+ [CloudWatch 指标和维度](#fsx-windows-metrics)
+ [使用文件系统指标](#how_to_use_metrics)
+ [性能警告和建议](#performance-insights-FSxW)
+ [访问文件系统指标](accessingmetrics.md)
+ [创建 CloudWatch 警报](creating_alarms.md)

## CloudWatch 指标和维度
<a name="fsx-windows-metrics"></a>

FSx for Windows File Server 将所有文件系统的以下指标发布到 Amazon CloudWatch 的 `AWS/FSx` 命名空间中：
+ `DataReadBytes`
+ `DataWriteBytes`
+ `DataReadOperations`
+ `DataWriteOperations`
+ `MetadataOperations`
+ `FreeStorageCapacity`

FSx for Windows File Server 将吞吐能力至少配置为 32 MBps 的文件系统的以下部分所述指标发布到 Amazon CloudWatch 的 `AWS/FSx` 命名空间中。

### 网络 I/O 指标
<a name="fsx-networkio-metrics"></a>

`AWS/FSx` 命名空间包括以下网络 I/O 指标。


| 指标 | 描述 | 
| --- | --- | 
| DataReadBytes |  访问文件系统的客户端的读取操作字节数。 单位：字节 有效统计数据：`Sum`  | 
| DataWriteBytes |  访问文件系统的客户端的写入操作字节数。 单位：字节 有效统计数据：`Sum`  | 
| DataReadOperations |  访问文件系统的客户端的读取操作数。 单位：计数 有效统计数据：`Sum`  | 
| DataWriteOperations |  访问文件系统的客户端的写入操作数。 单位：计数 有效统计数据：`Sum`  | 
| MetadataOperations |  访问文件系统的客户端的元数据操作数。 单位：计数 有效统计数据：`Sum`  | 
| ClientConnections | 客户端与文件服务器之间的活动连接数。 单位：计数 | 

### 文件服务器指标
<a name="fsx-file-server-metrics"></a>

`AWS/FSx` 命名空间包括以下文件服务器指标。


| 指标 | 描述 | 
| --- | --- | 
| NetworkThroughputUtilization | 访问文件系统的客户端的网络吞吐量，表示为预调配限制的百分比。 单位：百分比 | 
| CPUUtilization | 文件服务器 CPU 资源的利用率百分比。 单位：百分比 | 
| MemoryUtilization | 文件服务器内存资源的利用率百分比。 单位：百分比 | 
| FileServerDiskThroughputUtilization | 文件服务器与其存储卷之间的磁盘吞吐量，表示为由吞吐能力决定的预调配限制的百分比。 单位：百分比 | 
| FileServerDiskThroughputBalance | 文件服务器与其存储卷之间磁盘吞吐量的可用突增点数百分比。适用于预调配的吞吐能力不高于 256Mbps 的文件系统。 单位：百分比 | 
| FileServerDiskIopsUtilization | 文件服务器与存储卷之间的磁盘 IOPS，表示为由吞吐能力决定的预调配限制的百分比。 单位：百分比 | 
| FileServerDiskIopsBalance | 文件服务器与其存储卷之间磁盘 IOPS 的可用突增点数百分比。适用于预调配的吞吐能力不高于 256Mbps 的文件系统。 单位：百分比 | 

### 磁盘 I/O 指标
<a name="fsx-diskio-metrics"></a>

`AWS/FSx` 命名空间包括以下磁盘 I/O 指标。


| 指标 | 描述 | 
| --- | --- | 
| DiskReadBytes | 访问存储卷的读取操作字节数。 单位：字节 有效统计数据：Sum  | 
| DiskWriteBytes | 访问存储卷的写入操作字节数。 单位：字节 有效统计数据：Sum  | 
| DiskReadOperations |  访问存储卷的文件服务器的读取操作数。 单位：计数 有效统计数据：`Sum`  | 
| DiskWriteOperations |  访问存储卷的文件服务器的写入操作数。 单位：计数 有效统计数据：`Sum`  | 

### FSx for Windows 存储卷指标
<a name="fsx-storage-volume-metrics"></a>

`AWS/FSx` 命名空间包括以下存储卷指标。


| 指标 | 描述 | 
| --- | --- | 
| DiskThroughputUtilization | （仅限 HDD）文件服务器与其存储卷之间的磁盘吞吐量，表示为由存储卷决定的预调配限制的百分比。 单位：百分比 | 
| DiskThroughputBalance | （仅限 HDD）存储卷磁盘吞吐量和磁盘 IOPS 的可用突增点数百分比。 单位：百分比 | 
| DiskIopsUtilization | （仅限 SSD）文件服务器与存储卷之间的磁盘 IOPS，表示为由存储卷决定的预调配 IOPS 的百分比。 单位：百分比 | 

### 存储容量指标
<a name="fsx-storage-capacity-metrics"></a>

`AWS/FSx` 命名空间包括以下存储容量指标。


| 指标 | 描述 | 
| --- | --- | 
| FreeStorageCapacity |  可用存储容量的大小。 单位：字节 有效统计数据：`Average`、`Minimum`  | 
| StorageCapacityUtilization | 已用物理存储容量，表示为总存储容量的百分比。 单位：百分比 | 
| DeduplicationSavedStorage | 启用了重复数据删除时节省的存储空间量。 单位：字节 | 

### FSx for Windows File Server 指标的命名空间和维度
<a name="fsx-dimensions"></a>

FSx for Windows File Server 指标使用 `FSx` 命名空间，并且为单个维度 `FileSystemId` 提供指标。可以使用 [describe-file-systems](https://docs.aws.amazon.com/cli/latest/reference/fsx/describe-file-systems.html) AWS CLI 命令或 [DescribeFileSystems](https://docs.aws.amazon.com/fsx/latest/APIReference/API_DescribeFileSystems.html) API 命令查找文件系统的 ID。文件系统 ID 采用 *fs-0123456789abcdef0* 形式。

## 使用文件系统指标
<a name="how_to_use_metrics"></a>

每个 Amazon FSx 文件系统都有两个主要的架构组件：
+ **文件服务器**，用于为访问文件系统的客户端提供数据。
+ **存储卷**，用于托管文件系统中的数据。

FSx for Windows File Server 在 CloudWatch 中报告指标，这些指标可跟踪文件系统的文件服务器和存储卷的性能和资源利用率。下图说明了 Amazon FSx 文件系统及其架构组件，以及可用于监控的性能和资源 CloudWatch 指标。针对一组指标显示的关键属性是文件系统属性，用于确定这些指标的容量。调整该属性会修改该组指标的文件系统性能。

![\[FSx for Windows File Server 在 CloudWatch 中报告监控网络 I/O、文件服务器性能和存储卷性能的指标。\]](http://docs.aws.amazon.com/zh_cn/fsx/latest/WindowsGuide/images/file-server-metrics-FSxW.png)


可以使用 Amazon FSx 控制台中的**监控和性能**面板查看下表中所述的 FSx for Windows File Server CloudWatch 指标。

[\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/zh_cn/fsx/latest/WindowsGuide/monitoring-cloudwatch.html)

**注意**  
1我们建议您将平均吞吐能力利用率保持在 50% 以下，以确保有足够的备用吞吐能力来应对工作负载的意外峰值以及任何后台 Windows 存储操作（例如存储同步、重复数据删除或影子复制）。  
2根据工作负载，HDD 存储卷可能会出现显著的性能差异。IOPS 或吞吐量突然激增可能导致磁盘性能下降。有关更多信息，请参阅 [HDD 突增性能](performance.md#hdd-burst-performance)。

## 性能警告和建议
<a name="performance-insights-FSxW"></a>

FSx for Windows 针对吞吐能力至少配置为 32Mbps 的文件系统提供了性能警告。每当 CloudWatch 指标中的某一个指标接近或超过多个连续数据点的预定阈值时，Amazon FSx 就会显示警告。这些警告会为您提供切实可行的建议，您可以使用这些建议来优化文件系统的性能。

可以在**监控和性能**控制面板的多个区域内访问警告。**监控和性能**面板的**摘要**部分中会显示所有活动或近期的 Amazon FSx 性能警告，以及为处于“警报”状态的文件系统配置的所有 CloudWatch 警报。仪表板中显示指标图表的部分也会显示警告。

您可以为任意 Amazon FSx 指标创建 CloudWatch 警报。有关更多信息，请参阅 [创建 CloudWatch 警报](creating_alarms.md)。

### 使用性能警告提高文件系统的性能
<a name="resolve-warnings"></a>

Amazon FSx 会为您提供切实可行的建议，您可以使用这些建议来优化文件系统的性能。这些建议介绍了如何解决潜在的性能瓶颈。如果您希望继续进行活动，或者该活动对文件系统的性能造成了影响，您可以采取建议的操作。根据触发警告的指标，您可以通过增加文件系统的吞吐能力或存储容量来解决警告，如下表所述。

[\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/zh_cn/fsx/latest/WindowsGuide/monitoring-cloudwatch.html)

**注意**  
某些文件系统事件可能会消耗磁盘 I/O 性能资源，并可能触发性能警告。例如：  
存储容量扩展的优化阶段会增加磁盘吞吐量，如 [增加存储容量并提升文件系统性能](managing-storage-configuration.md#storage-capacity-increase-and-performance) 中所述
对于多可用区文件系统，吞吐能力扩展、硬件更换或可用区中断等事件会导致自动失效转移和失效自动恢复事件。在此期间发生的任何数据更改都需要在主文件服务器和辅助文件服务器之间进行同步，Windows Server 运行的数据同步作业可能会消耗磁盘 I/O 资源。有关更多信息，请参阅 [管理吞吐能力](managing-throughput-capacity.md)。

有关文件系统性能的更多信息，请参阅 [FSx 用于 Windows 文件服务器的性能性能](performance.md)。

# 访问文件系统指标
<a name="accessingmetrics"></a>

您可以通过以下方式查看 CloudWatch 的 Amazon FSx 指标。
+ Amazon FSx 控制台
+ CloudWatch 控制台
+ CloudWatch CLI
+ CloudWatch API

以下过程介绍了如何使用这些不同的工具访问文件系统的指标。

**使用 Amazon FSx 控制台查看文件系统指标**

1. 通过以下网址打开 Amazon FSx 控制台：[https://console.aws.amazon.com/fsx/](https://console.aws.amazon.com/fsx/)。

1. 要显示**文件系统详细信息**页面，请在导航窗格中选择**文件系统**。

1. 选择要查看其指标的文件系统。

1. 要查看文件系统指标图表，请在第二个面板上选择**监控和性能**。  
![\[Amazon FSx 控制台中的性能和监控面板屏幕截图。\]](http://docs.aws.amazon.com/zh_cn/fsx/latest/WindowsGuide/images/FSxW-monitor-perf-panel.png)
   + **摘要**指标默认显示，其中显示了所有活动警告、CloudWatch 警报以及**文件系统活动**指标。
   + 选择**存储**可查看存储容量和利用率指标。
   + 选择**性能**可查看文件服务器和存储性能指标。
   + 选择 **CloudWatch 警报**可查看为文件系统配置的所有警报的图表。

   有关更多信息，请参阅 [使用文件系统指标](monitoring-cloudwatch.md#how_to_use_metrics)。

**在 CloudWatch 控制台中查看指标**

1. 要在 Amazon CloudWatch 控制台的**指标**页面中查看文件系统指标，请在 Amazon FSx 控制台的**监控和性能**面板中导航到该指标。

1. 从指标图表右上角的操作菜单中选择**在指标中查看**，如下图所示。  
![\[“总 IOPS”指标图表的图像，其中显示了图表操作菜单以显示“在指标中查看”操作。\]](http://docs.aws.amazon.com/zh_cn/fsx/latest/WindowsGuide/images/view-metric-in-CW-fsxW.png)

   这将在 CloudWatch 控制台中打开**指标**页面，显示指标图表，如下图所示。  
![\[CloudWatch 控制台中显示的“总 IOPS”指标图表的图像。\]](http://docs.aws.amazon.com/zh_cn/fsx/latest/WindowsGuide/images/metric-in-CW-console.png)

**将指标添加到 CloudWatch 控制面板**

1. 要将一组 FSx for Windows 文件系统指标添加到 CloudWatch 控制台中的控制面板，请在 Amazon FSx 控制台的**监控和性能**面板中选择这组指标（**摘要**、**存储**或**性能**）。

1. 选择面板右上角的**添加到控制面板**，这将打开 CloudWatch 控制台。

1. 从列表中选择一个现有的 CloudWatch 控制面板，或者创建一个新的控制面板。有关更多信息，请参阅《Amazon CloudWatch 用户指南》**中的[使用 Amazon CloudWatch 控制面板](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch_Dashboards.html)。

**从 AWS CLI 访问指标**
+ 使用带有 `--namespace "AWS/FSx"` 命名空间的 [https://docs.aws.amazon.com/cli/latest/reference/cloudwatch/list-metrics.html](https://docs.aws.amazon.com/cli/latest/reference/cloudwatch/list-metrics.html) 命令。有关更多信息，请参阅 [AWS CLI 命令参考](https://docs.aws.amazon.com/cli/latest/reference/)。

  ```
  $ aws cloudwatch list-metrics --namespace "AWS/FSx"
  aws cloudwatch list-metrics --namespace "AWS/FSx"
  {
      "Metrics": [
          {
              "Namespace": "AWS/FSx",
              "MetricName": "DataWriteOperationTime",
              "Dimensions": [
                  {
                      "Name": "FileSystemId",
                      "Value": "fs-09a106ebc3a0bb087"
                  }
              ]
          },
          {
              "Namespace": "AWS/FSx",
              "MetricName": "CapacityPoolWriteBytes",
              "Dimensions": [
                  {
                      "Name": "VolumeId",
                      "Value": "fsvol-0cb2281509f5db3c2"
                  },
                  {
                      "Name": "FileSystemId",
                      "Value": "fs-09a106ebc3a0bb087"
                  }
              ]
          },
          {
              "Namespace": "AWS/FSx",
              "MetricName": "DiskReadBytes",
              "Dimensions": [
                  {
                      "Name": "FileSystemId",
                      "Value": "fs-09a106ebc3a0bb087"
                  }
              ]
          },
          {
              "Namespace": "AWS/FSx",
              "MetricName": "CompressionRatio",
              "Dimensions": [
                  {
                      "Name": "FileSystemId",
                      "Value": "fs-0f84c9a176a4d7c92"
                  }
              ]
          },
  .
  .
  .
  }
  ```

**使用 CloudWatch API**

**从 CloudWatch API 访问指标**
+ 调用 `[GetMetricStatistics](https://docs.aws.amazon.com/AmazonCloudWatch/latest/APIReference/API_GetMetricStatistics.html)`。有关更多信息，请参阅 [Amazon CloudWatch API 参考](https://docs.aws.amazon.com/AmazonCloudWatch/latest/APIReference/)。

# 创建 CloudWatch 警报
<a name="creating_alarms"></a>

可以创建 CloudWatch 告警，在告警改变状态时发送 Amazon SNS 消息。警报会每隔一段时间（由您指定）监控一个指标，并根据相对于给定阈值的指标值每隔若干个时间段执行一项或多项操作。操作是一个发送到 Amazon SNS 主题或自动扩缩策略的通知。

告警仅为持续状态更改调用操作。CloudWatch 警报不会仅仅因为处于特定状态就调用操作；状态必须已改变并在指定的若干个时间段内保持不变。您可以通过 Amazon FSx 控制台或 CloudWatch 控制台创建警报。

以下过程介绍了如何使用控制台、AWS CLI 和 API 为 Amazon FSx 创建警报。

**设置 CloudWatch 警报（控制台）**

1. 通过以下网址打开 Amazon FSx 控制台：[https://console.aws.amazon.com/fsx/](https://console.aws.amazon.com/fsx/)。

1. 从导航窗格中，选择**文件系统**，然后选择要为其创建警报的文件系统。

1. 选择**操作**菜单，然后选择**查看详细信息**。

1. 在**摘要**页面上，选择**监控和性能**。

1. 选择 **CloudWatch 警报**。

1. 选择**创建 CloudWatch 警报**。随后您将被重定向至 CloudWatch 控制台。

1. 选择**选择指标**，然后选择**下一步**。

1. 在**指标**部分中，选择 **FSx**。

1. 选择**文件系统指标**，选中要为其创建警报的指标，然后选择**选择指标**。

1. 在**条件**部分中，选择您希望用于该警报的条件，然后选择**下一步**。
**注意**  
对于单可用区文件系统，在文件系统维护期间，可能不会发布指标；对于多可用区文件系统，在主文件服务器和辅助文件服务器之间进行失效转移和失效自动恢复期间，可能不会发布指标。为了防止不必要和误导性的警报条件更改，以及为了配置警报以使其能够应对缺失的数据点，请参阅《Amazon CloudWatch 用户指南》**中的[配置 CloudWatch 警报处理缺失数据的方式](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/AlarmThatSendsEmail.html#alarms-and-missing-data)。

1. 如果您希望 CloudWatch 在警报状态触发操作时向您发送电子邮件或 SNS 通知，请选择**每当此警报状态为**警报状态。

   对于**选择 SNS 主题**，选择一个现有的 SNS 主题。如果您选择**创建主题**，那么您就可以为新电子邮件订阅列表设置名称和电子邮件地址。此列表将保存下来并会在将来的警报字段中显示出来。选择**下一步**。
**注意**  
如果您使用**创建主题**创建了一个新的 Amazon SNS 主题，那么电子邮件地址在接收通知之前必须通过验证。当警报进入警报状态时，才会发送电子邮件。如果在验证电子邮件地址之前警报状态发生了变化，那么它们不会接收到通知。

1. 填写指标的**名称**、**描述**和**每当**值，然后选择**下一步**。

1. 在**预览和创建**页面上，查看您即将创建的警报，然后选择**创建警报**。

**使用 CloudWatch 控制台设置警报**

1. 登录到 AWS 管理控制台 并通过以下网址打开 CloudWatch 控制台：[https://console.aws.amazon.com/cloudwatch/](https://console.aws.amazon.com/cloudwatch/)。

1. 选择**创建警报**以启动**创建警报向导**。

1. 选择 **FSx 指标**并滚动浏览 Amazon FSx 指标，以找到要为其设置警报的指标。要在此对话框中仅显示 Amazon FSx 指标，请搜索文件系统的文件系统 ID。选择要为其创建警报的指标，然后选择**下一步**。

1.  填写指标的**名称**、**描述**和**每当**值。

1. 如果您希望 CloudWatch 在达到警报状态时向您发送一封电子邮件，对于 **Whenever this alarm（每当此警报）**，请选择 **State is ALARM（状态为“警报”）**。对于**发送通知到**，选择一个现有 SNS 主题。如果您选择**创建主题**，那么您就可以为新电子邮件订阅列表设置名称和电子邮件地址。此列表将保存下来并会在将来的警报字段中显示出来。
**注意**  
如果您使用**创建主题**创建了一个新的 Amazon SNS 主题，那么电子邮件地址在接收通知之前必须通过验证。当警报进入警报状态时，才会发送电子邮件。如果在验证电子邮件地址之前警报状态发生了变化，那么它们不会接收到通知。

1. 此时，可在**警报预览**区域预览即将创建的警报。选择**创建警报**。

**设置 CloudWatch 警报（CLI）**
+ 调用 `[put-metric-alarm](https://docs.aws.amazon.com/cli/latest/reference/put-metric-alarm.html)`。有关更多信息，请参阅 [AWS CLI Command Reference](https://docs.aws.amazon.com/cli/latest/reference/)**。

**设置警报（API）**
+ 调用 `[PutMetricAlarm](https://docs.aws.amazon.com/AmazonCloudWatch/latest/APIReference/API_PutMetricAlarm.html)`。有关更多信息，请参阅 [Amazon CloudWatch API 参考](https://docs.aws.amazon.com/AmazonCloudWatch/latest/APIReference/)**。