管理存储容量 - FSx for Lustre

管理存储容量

当您需要更多存储空间和吞吐量时,可以增加在 FSx for Lustre 文件系统上配置的存储容量。由于 FSx for Lustre 文件系统的吞吐量会随存储容量线性扩展,因此吞吐能力也会相应增加。要增加存储容量,您可以使用 Amazon FSx 控制台、AWS Command Line Interface(AWS CLI)或 Amazon FSx API。

当您请求更新文件系统的存储容量时,Amazon FSx 会自动添加新的网络文件服务器并扩展您的元数据服务器。在扩展存储容量时,文件系统可能会在几分钟内不可用。在文件系统不可用时客户端发出的文件操作将以透明方式重试,并最终在存储扩展完成后成功。在文件系统不可用期间,文件系统状态设置为UPDATING。存储扩展完成后,文件系统状态将设置为AVAILABLE

然后,Amazon FSx 会运行存储优化流程,在现有和新添加的文件服务器间以透明的方式重新平衡数据。重新平衡在后台执行,不会影响文件系统的可用性。在重新平衡期间,由于数据移动消耗了资源,您可能会发现文件系统性能降低。对于大多数文件系统,存储优化需要几个小时到几天的时间。在优化阶段,您可以访问和使用您的文件系统。

您可以随时使用 Amazon FSx 控制台、CLI 和 API 跟踪存储优化进度。有关更多信息,请参阅 监控存储容量增加

增加存储容量时的注意事项

以下是增加存储容量时需要考虑的几个重要事项:

  • 仅增加 – 您可以仅增加文件系统的存储容量;不得减少存储容量。

  • 增量增加 – 增加存储容量时,使用增加存储容量对话框中列出的增量。

  • 两次增加的间隔时间 – 在上次增加请求后 6 小时之前,无法进一步增加文件系统的存储容量。

  • 吞吐能力 – 增加存储容量时,会自动增加吞吐能力。对于有 SSD 缓存的持久性 HDD 文件系统,读取缓存存储容量也同样会增加,确保 SSD 缓存的大小为 HDD 存储容量的 20%。Amazon FSx 计算存储和吞吐能力单位的新值,并将其列在增加存储容量对话框中。

    注意

    您可以单独修改基于 SSD 的持久性文件系统的吞吐能力,而无需更新文件系统的存储容量。有关更多信息,请参阅 管理吞吐能力

  • 部署类型 – 您可以增加所有部署类型的存储容量,scratch 1 文件系统除外。如果您有 scratch 1 文件系统,可以创建一个存储容量更大的新文件系统。

何时增加存储容量

当文件系统的可用存储容量不足时,请增加其存储容量。使用 FreeStorageCapacity CloudWatch 指标来监控文件系统上的可用存储容量。您可以根据此指标创建 Amazon CloudWatch 警报,并在指标降至特定阈值以下时收到通知。有关更多信息,请参阅 使用 Amazon CloudWatch 监控

您可以使用 CloudWatch 指标来监控文件系统的持续吞吐量使用水平。如果您确定文件系统需要更高的吞吐能力,则可以使用指标信息来帮助您确定增加多少存储容量。有关如何确定文件系统当前吞吐量的信息,请参阅如何使用 Amazon FSx for Lustre CloudWatch 指标。有关存储容量如何影响吞吐能力的信息,请参阅Amazon FSx for Lustre 性能

您还可以在文件系统详细信息页面的摘要面板上查看文件系统的存储容量和总吞吐量。

如何处理并发存储扩展和备份请求

您可以在存储扩展工作流程开始前或正在进行时请求备份。Amazon FSx 会按照如下顺序处理上述两项请求:

  • 如果存储扩展工作流程正在进行(存储扩展状态为 IN_PROGRESS,文件系统状态为 UPDATING),而您请求备份,则备份请求将排队。当存储扩展处于存储优化阶段(存储扩展状态为 UPDATED_OPTIMIZING,文件系统状态为 AVAILABLE)时,将启动备份任务。

  • 如果备份正在进行(备份状态为 CREATING),而您请求进行存储扩展,则存储扩展请求将排队。存储扩展工作流程在 Amazon FSx 将备份传输到 Amazon S3 时启动(备份状态为 TRANSFERRING)。

如果存储扩展请求处于待处理状态,而文件系统备份请求也处于待处理状态,则备份任务的优先级更高。存储扩展任务需等到备份任务完成后启动。