本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
Amazon for FSx Lustre 是什么?
FSx for Lustre 可以轻松且经济高效地推出和运行流行的高性能产品 Lustre 文件系统。您可以将 Lustre 用于速度至关重要的工作负载,例如机器学习、高性能计算(HPC)、视频处理和财务建模。
开源 Lustre 文件系统专为需要快速存储的应用程序而设计,在这些应用程序中,您希望存储与计算保持同步。Lustre 旨在解决快速而廉价地处理世界上不断增长的数据集的问题。它是一个广泛使用的文件系统,专为世界上速度最快的计算机而设计。它提供亚毫秒级的延迟、高达数百的吞吐量和高达 GBps 数百万的 IOPS。有关 Lustre,请参阅 Lustre 网站
作为一项完全托管的服务,Amazon FSx 让您可以更轻松地使用 Lustre 适用于存储速度至关重要的工作负载。 FSx for Lustre 消除了传统的设置和管理复杂性 Lustre 文件系统,使您能够在几分钟内启动并运行经过实战考验的高性能文件系统。此外,还提供了多种部署选项,因此您可以根据需要优化成本。
FSx for Lustre 与 POSIX 兼容,因此您无需进行任何更改即可使用当前基于 Linux 的应用程序。 FSx for Lustre 提供了一个本机文件系统接口,并且可以像任何文件系统一样使用 Linux 操作系统。它还提供 read-after-write一致性并支持文件锁定。
主题
多种部署选项
Amazon for Lustre 提供了多种暂存文件系统和永久文件系统 FSx 供您选择,以满足不同的数据处理需求。临时文件系统适用于临时存储和短期数据处理。如果文件服务器出现故障,则不会复制数据,也不会持久保留数据。持久性文件系统适用于长期存储和侧重于吞吐量的工作负载。在持久性文件系统中,会复制数据,并更换出现故障的文件服务器。有关更多信息,请参阅 适用于 FSx Lustre 文件系统的部署选项。
多种存储选项
Amazon FSx for Lustre 提供固态硬盘 (SSD) 和硬盘驱动器 (HDD) 存储选项,这些选项针对不同的数据处理要求进行了优化:
SSD 存储选项 – 对于通常具有小型随机文件操作的低延迟、IOPS 密集型工作负载,选择 SSD 存储选项。
HDD 存储选项 – 对于通常具有大型顺序文件操作的吞吐量密集型工作负载,选择 HDD 存储选项。
如果要为文件系统预调配 HDD 存储选项,可以选择预调配大小为 HDD 存储容量 20% 的只读 SSD 缓存。这样可以为经常访问的文件提供亚毫秒级延迟和更高的 IOPS。基于 SSD 的文件系统和基于 HDD 的文件系统都预调配了基于 SSD 的元数据服务器。因此,所有元数据操作(代表大多数文件系统操作)都以亚毫秒级延迟传送。
有关这些存储选项的性能的更多信息,请参阅 Amazon FSx for Lustre 性能。
FSx 适用于 Lustre 和数据存储库
您可以将 Lustre 文件系统链接 FSx 到 Amazon S3 上的数据存储库或本地数据存储。
FSx 用于 Lustre S3 数据存储库集成
FSx for Lustre 与 Amazon S3 集成,使您可以更轻松地使用 Lustre 高性能文件系统。当链接到 Amazon S3 存储桶时,fo FSx r Lustre 文件系统会以文件形式透明地呈现 S3 对象。创建文件系统时,Amazon 会 FSx 导入您的 S3 存储桶中所有现有文件的清单。Amazon 还 FSx 可以在创建文件系统后导入添加到数据存储库中的文件清单。您可以设置导入首选项以满足您的工作流程需求。文件系统还允许将文件系统数据写回 S3。数据存储库任务简化了您 FSx 的 for Lustre 文件系统与 Amazon S3 上的持久数据存储库之间的数据和元数据传输。有关更多信息,请参阅在 Amazon 上使用数据存储库 for Lu FSx stre 和数据存储库任务。
FSx 适用于 Lustre 和本地数据存储库
借助 Amazon FSx for Lustre,您可以 AWS Cloud 通过使用 AWS Direct Connect 或 AWS VPN导入数据,将数据处理工作负载从本地扩展到中。有关更多信息,请参阅 使用 Amazon FSx 处理您的本地数据。
正在访问 FSx Lustre 文件系统
您可以混合搭配计算实例类型和连接到单个 FSx for Lustre 文件系统的 Linux Amazon 系统映像 (AMIs)。
Amazon FSx for Lustre 文件系统可通过在亚马逊弹性计算云(亚马逊 EC2)实例、亚马逊弹性容器服务(亚马逊 ECS)Docker 容器上运行的计算工作负载以及在亚马逊弹性 Kubernetes 服务(亚马逊 EKS)上运行的容器上运行的计算工作负载进行访问。
Amazon EC2 — 您可以使用开源软件从您的亚马逊 EC2 计算实例访问您的文件系统 Lustre 客户。亚马逊 EC2 实例可以从同一 Amazon Virtual Private Cloud (Amazon VPC) 内的其他可用区域访问您的文件系统,前提是您的联网配置允许在 VPC 内跨子网进行访问。挂载 Amazon FSx for Lustre 文件系统后,您可以像使用本地文件系统一样处理其文件和目录。
亚马逊 EKS — 如亚马逊 EKS 用户 FSx 指南中所述,您可以使用开源 FSx Lustre CSI 驱动程序,从在 Amazon EKS 上运行的容器中访问 Ama zon for Lustre。在 Amazon EKS 上运行的容器可以使用由亚马逊 FSx 支持的高性能永久性卷 (PVs) for Lustre。
亚马逊 ECS — 你可以从亚马逊 FSx 实例上的 Amazon ECS Docker 容器访问 Amazon for Lustre EC2 。有关更多信息,请参阅 从 Amazon Elastic Container Service 挂载。
Amazon FSx for Lustre 与最受欢迎的基于 Linux 的版本兼容, AMIs包括亚马逊 Linux 2023 和亚马逊 Linux 2、红帽企业 Linux (RHEL)、CentOS、Ubuntu 和 SUSE Linux。这些区域有:Lustre 亚马逊 Linux 2023 和亚马逊 Linux 2 中包含客户端。对于 RHEL、CentOS 和 Ubuntu 来说, AWS Lustre 客户机存储库提供与这些操作系统兼容的客户端。
使用 f FSx or Lustre,您可以 AWS Cloud 通过或导入数据,将计算密集型工作负载从本地扩展到中。 AWS Direct Connect AWS Virtual Private Network您可以从本地访问您的 Amazon FSx 文件系统,根据需要将数据复制到文件系统中,并在云端实例上运行计算密集型工作负载。
有关可以访问 Lustre 文件系统的客户端、计算实例和环境 FSx 的更多信息,请参阅访问文件系统。
与 AWS 服务的集成
Amazon FSx for Lustre 与亚马逊 SageMaker AI 集成为输入数据源。将 SageMaker AI 与 Lustre 配 FSx 合使用时,通过省去从 Amazon S3 的初始下载步骤,可以加快您的机器学习训练作业。此外,在节省 S3 请求成本的同时,还避免了重复下载同一数据集上迭代作业的通用对象,从而降低了总拥有成本(TCO)。有关更多信息,请参阅什么是 SageMaker AI? 在《亚马逊 A SageMaker I 开发者指南》中。有关如何使用 Amazon FSx for Lustre 作为 A SageMaker I 数据源的演练,请参阅 M AWS ac hine Learning 博客上的 “使用 Amazon for Lustre 和 Amazon EFS 文件系统加速亚马逊 A SageMaker I
FSx for Lustre 与 AWS Batch 使用 EC2 启动模板集成。 AWS Batch 使您能够在上运行批量计算工作负载 AWS Cloud,包括高性能计算 (HPC)、机器学习 (ML) 和其他异步工作负载。 AWS Batch 根据任务资源要求自动和动态地调整实例的大小。有关更多信息,请参阅什么是 AWS Batch? 在《AWS Batch 用户指南》中。
FSx for Lustre 集成了。 AWS ParallelCluster AWS ParallelCluster 是一款 AWS支持开源集群管理工具,用于部署和管理 HPC 集群。它可以在集群创建过程中自动 FSx 为 Lustre 文件系统创建或使用现有文件系统。
安全与合规
FSx for Lustre 文件系统支持静态和传输中的加密。Amazon 使用在 AWS Key Management Service (AWS KMS) 中管理的密钥 FSx自动加密文件系统的静态数据。某些情况下,当从支持的 Amazon EC2 实例访问 AWS 区域 时,传输中的数据还会在文件系统上自动加密。有关 Lustre 中数据加密 FSx 的更多信息,包括 AWS 区域 何处支持对传输中的数据进行加密,请参阅中的数据加密 Amazon FSx for Lustre。亚马逊 FSx 已通过评估,符合 ISO、PCI-DSS 和 SOC 认证,并且符合 HIPAA 资格。有关更多信息,请参阅 Lustre FSx 的 Amazon 安全。
假设
在本指南中,我们做出了以下假设:
-
如果您使用亚马逊弹性计算云 (Amazon EC2),我们假设您熟悉该服务。有关如何使用亚马逊的更多信息 EC2,请参阅亚马逊 EC2 文档。
-
我们假设您熟悉使用 Amazon Virtual Private Cloud(Amazon VPC)。有关如何使用 Amazon VPC 的更多信息,请参阅《Amazon VPC 用户指南》。
-
我们假设您没有根据 Amazon VPC 服务更改 VPC 的默认安全组规则。如果有,请务必添加必要的规则,以允许从您的亚马逊 EC2 实例到您的 Amazon for Lustre 文件系统的网络流量。 FSx 有关更多详细信息,请参阅 使用 Amazon VPC 进行文件系统访问控制。
亚马逊对于 Lustre FSx 的定价
使用 Amazon FSx for Lustre,无需支付前期硬件或软件成本。您只需为使用的资源付费,没有最低承付款、设置费用或额外费用。有关与该服务相关的定价和费用的信息,请参阅 Amazon FSx for Lustre 定价
Amazon FSx for Lustre 论坛
如果您在使用 Amazon FSx for Lustre 时遇到问题,请访问论坛
你是首次使用 Amazon for Lustr FSx e 吗?
如果您是首次使用 Amazon FSx for Lustre 的用户,我们建议您按顺序阅读以下章节:
-
如果您已准备好创建第一个 Amazon FSx for Lustre 文件系统,请尝试开始使用 Amazon for Lu FSx stre。
-
有关性能的信息,请参阅 Amazon FSx for Lustre 性能。
-
有关将文件系统关联到 Amazon S3 桶数据存储库的更多信息,请参阅在 Amazon 上使用数据存储库 for Lu FSx stre。
-
有关 Amazon FSx for Lustre 的安全详情,请参阅Lustre FSx 的 Amazon 安全。
-
有关 Amazon FSx for Lustre 的可扩展性限制(包括吞吐量和文件系统大小)的信息,请参阅Amazon for Lust FSx re 的配额。
-
有关 Amazon FSx for Lustre API 的信息,请参阅 Amazon FSx for Lustre API 参考。