SUS04-BP06 使用共享文件系统或存储来访问通用数据
采用共享文件系统或存储以避免数据重复,并为您的工作负载提供更高效的基础设施。
常见反模式:
-
为每个客户端预置存储。
-
未卸下不活动的客户端的数据卷。
-
不提供跨平台和系统的存储访问。
建立此最佳实践的好处:使用共享文件系统或存储实现将数据共享到一个或多个使用者,而无需复制数据。这有助于减少工作负载所需的存储资源。
在未建立这种最佳实践的情况下暴露的风险等级:中
实施指导
如果您有多个用户或应用程序访问同一个数据集,则使用共享存储技术很重要,这可以为工作负载提供高效的基础设施。共享存储技术提供一个位置来集中存储和管理数据集并避免数据重复。它还加强了不同系统之间数据的一致性。此外,因为多个计算资源会同时并行访问和处理数据,所以利用共享存储技术可以更高效地使用计算能力。
仅在需要时才从这些共享存储服务中提取数据,并卸下未使用的卷以释放资源。
实施步骤
-
当数据具有多个使用者时,将数据迁移到共享存储。下面是 AWS 上的共享存储技术的一些示例:
Storage option When to use Amazon EBS 多重挂载使您可以将单个预调配 IOPS SSD(io1 或 io2)卷挂载到同一可用区中的多个实例。
请参阅何时选择 Amazon EFS
。 不需要文件系统结构而旨在与对象存储一起使用的应用程序可以使用 Amazon S3 作为可大规模扩展、持久、低成本的对象存储解决方案。
-
仅在需要时将数据复制到共享文件系统或从共享文件系统提取数据。例如,您可以创建采用 Amazon S3 的 Amazon FSx for Lustre 文件系统
,并仅将处理作业所需的数据子集加载到 Amazon FSx。 -
根据您的使用模式适当删除数据,如SUS04-BP03 使用策略管理数据集的生命周期所述。
-
将卷与未积极使用它们的客户端分离。
资源
相关文档:
相关视频: