本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
管理存储容量
Amazon for FSx NetApp ONTAP 提供了许多与存储相关的功能,您可以使用这些功能来管理文件系统的存储容量。
FSx用于ONTAP存储层
存储层是 Amazon FSx NetApp ONTAP 文件系统的物理存储介质。FSxf ONTAP or 提供以下存储层:
SSDtier — 用户配置的高性能固态硬盘 (SSD) 存储,专为数据集的活动部分而构建。
容量池层 – 完全弹性的存储,可以自动扩展到 PB 级大小,并且针对不经常访问的数据进行成本优化。
fo FSx r ONTAP volume 是一种虚拟资源,与文件夹类似,它不消耗存储容量。您存储的(以及消耗物理存储空间的)数据位于卷内。创建卷时,您需要指定卷的大小,但可以在创建后修改其大小。FSx因为ONTAP卷是精简配置的,文件系统存储空间不是事先预留的。取而代之的是,SSD容量池存储空间是根据需要动态分配的。您在卷级别配置的分层策略决定存储在该层中的数据是否以及何时过渡到容量池层。SSD
下图说明了文件系统中跨多个FSxONTAP卷排列的数据示例。
下图说明了上图四个卷中的数据如何消耗文件系统的物理存储容量。
您可以选择更符合文件系统中每个卷的要求的分层策略,从而降低存储成本。有关更多信息,请参阅 卷数据分层。
选择合适的文件系统SSD存储容量
在FSx为ONTAP文件系统选择SSD存储容量时,需要记住以下几点会影响可用于SSD存储数据的存储量:
为 NetApp ONTAP软件开销预留的存储容量。
文件元数据
最近写入的数据
您打算SSD存储在存储器上的文件,无论是尚未达到冷却期的数据,还是最近读取但已检索回的数据SSD。
SSD存储空间的使用方式
文件系统的SSD存储空间用于 NetApp ONTAP软件(开销)、文件元数据和数据的组合。
NetApp ONTAP软件开销
与其他 NetApp ONTAP文件系统一样,文件系统多达 16% 的SSD存储容量是为ONTAP开销预留的,这意味着它不能用于存储您的文件。开ONTAP销按如下方式分配:
11% 是为 NetApp ONTAP软件预留的。对于SSD存储容量超过 30 太字节 (TiB) 的文件系统,预留 6%。
5% 预留给聚合快照。在文件系统的文件服务器之间同步数据时需要聚合快照。
文件元数据
文件元数据通常占用文件消耗的存储容量的 3-7%。该百分比取决于平均文件大小(平均文件大小越小,需要的元数据越多),以及文件的存储效率节省量。请注意,文件元数据无法从存储效率节省中受益。您可以使用以下准则来估算文件系统上用于元数据的SSD存储量。
平均文件大小 | 元数据大小与文件数据百分比的对应关系 |
---|---|
4 KB |
7% |
8 KB |
3.5% |
32KB 或更大 |
1-3% |
在调整计划在容量池层上SSD存储的文件元数据所需的存储容量时,我们建议您对计划在容量池层上SSD存储的每 10 GiB 数据使用 1 GiB 存储的保守比率。
存储在您的SSD等级上的文件数据
除了您的活动数据集和所有文件元数据外,写入文件系统的所有数据最初都会写入该SSD层,然后再绑定到容量池存储。无论卷采用何种分层策略,都是如此,但使用 SnapMirror 向配置了所有数据分层策略的卷传输数据除外。
只要容量池层的利用率低于 90%,容量池SSD层的随机读取就会缓存在该SSD层中。有关更多信息,请参阅 卷数据分层。
建议的SSD容量利用率
我们建议您持续使用SSD存储层的利用率不要超过 80%。对于第二代文件系统,我们还建议您对任何文件系统聚合的持续利用率不要超过 80%。这些建议与 NetApp的建议一致ONTAP。由于文件系统的SSD层还用于暂存对容量池层的写入以及从容量池层进行随机读取,因此访问模式的任何突然变化都可能迅速导致该SSD层的利用率提高。
SSD利用率为 90% 时,从容量池层读取的数据将不再缓存在该SSD层上,因此写入文件系统的任何新数据都将保留剩余SSD容量。这会导致从容量池层重复读取相同的数据从容量池存储中读取,而不是从容量池SSD层进行缓存和读取,这可能会影响文件系统的吞吐容量。
当分层利用率达到或高于 98% 时,所有分SSD层功能都会停止。有关更多信息,请参阅 分层阈值。
存储效率
NetApp ONTAP在卷级别提供块级存储效率功能,包括压缩、压缩和重复数据删除。这些功能可以在不牺牲性能的情况下为您节省高达 65% 的存储容量,用于一般文件共享。您可以按卷启用存储效率。这些功能可以减少数据消耗的存储容量,从而减少容量池和备份存储中SSD占用的存储空间。您可以在每个卷上为SSD存储中的数据启用压缩和重复数据删除。当数据分层到容量池SSD存储时,通过压缩和重复数据删除节省的存储空间将得以保留。无论文件系统的存储效率配置如何,始终为备份数据启用存储效率。
下表显示了典型的存储节省示例。
仅限压缩 | 仅限重复数据删除 | 压缩和重复数据删除 | |
---|---|---|---|
通用文件共享 | 50% | 30% | 65% |
虚拟服务器和台式机 | 55% | 70% | 70% |
数据库 | 65-70% | 0% | 65-70% |
工程数据 | 55% | 30% | 75% |
地震数据 | 40% | 3% | 40% |
对于大多数工作负载,启用压缩和重复数据删除不会对文件系统性能产生不利影响。对于大多数工作负载,压缩可以提高整体性能。为了提供从RAM缓存中快速读取和写入,FSxONTAP文件服务器在前端网络接口卡 (NICs) 上配备的网络带宽要高于文件服务器和存储磁盘之间的可用带宽。由于数据压缩可以减少文件服务器和存储磁盘之间发送的数据量,因此对于大多数工作负载,使用数据压缩时,文件系统的总体吞吐量将有所增加。文件系统的前端NIC饱和后,与数据压缩相关的吞吐容量的增加将受到限制。
Amazon FSx for NetApp ONTAP 还支持其他可为您节省空间的ONTAP功能,包括快照、精简配置和 FlexClone 卷。
存储效率功能默认未启用。您可按如下方式将其启用:
要查看启用存储效率的文件系统节省的存储量,请参阅监控存储效率节省情况。
计算存储效率节省量
您可以StorageUsed
FSx对ONTAP CloudWatch 文件系统指标使用LogicalDataStored
和来计算压缩、重复数据删除、压缩、快照和所节省的存储空间。FlexClones这些指标使用单个维度 FileSystemId
。有关更多信息,请参阅 文件系统指标。
要以字节为单位计算存储效率节省,请取给定时段内
StorageUsed
的平均值,然后从相同时段内LogicalDataStored
的平均值中减去该值。要计算存储效率带来的节省占逻辑数据总大小的百分比,请取某个给定时间段内的
StorageUsed
的Average
,然后从同一时间段的LogicalDataStored
的Average
中减去此值。然后使用差值除以同一时间段内的LogicalDataStored
的Average
。
SSD尺码示例
假设您要为某个应用程序存储 100TiB 的数据。该应用程序中 80% 的数据不经常被访问。在这种情况下,80% (80 TB) 的数据将自动分层到容量池层,其余 20% (20 TB) 仍保留在SSD存储中。根据通用文件共享工作负载的通常存储效率节省为 65%,这相当于 7TiB 的数据。要保持 80% 的SSD利用率,您需要为 20 TiB SSD 的活动访问数据提供 8.75 TiB 的存储容量。您预置的SSD存储量还需要考虑16%的ONTAP软件存储开销,如以下计算所示。
ssdNeeded = ssdProvisioned * (1 - 0.16) 8.75 TiB / 0.84 = ssdProvisioned 10.42 TiB = ssdProvisioned
因此,在本示例中,您需要预配置至少 10.42 TiB SSD 的存储空间。您还将使用 28TiB 的容量池存储空间来存储剩余 80TiB 不经常访问的数据。