在线存储 - 亚马逊 SageMaker AI

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

在线存储

在线存储是一种低延迟、高可用性数据存储,支持实时查找特征。它通常用于机器学习 (ML) 模型处理。创建特征组时,您可以在标准在线存储 (Standard) 或内存层在线存储 (InMemory) 之间进行选择。这样,您就可以在考虑性能和成本的同时,选择与特定应用程序的读取和写入模式最匹配的存储类型,有关定价的更多详情,请参阅 Amazon SageMaker AI 定价

在线存储包含以下 StorageType 选项。有关在线存储内容的更多信息,请参阅 OnlineStoreConfig

标准层存储类型

Standard 层是在线存储特征组的托管低延迟数据存储。它为您的应用程序提供机器学习模型服务的快速数据检索。Standard 是默认存储类型。

内存层存储类型

InMemory 层是在线存储特征组的托管数据存储,支持极低延迟检索。它为用于高吞吐量应用程序的机器学习模型处理提供大规模实时数据检索。该InMemory等级由亚马逊 ElastiCache (RedisOSS)提供支持。有关更多信息,请参阅什么是亚马逊 ElastiCache (RedisOSS)? 。

在线存储 InMemory 层支持集合类型,即列表、集和向量。有关 InMemory 集合类型的更多信息,请参阅 集合类型

Feature Store 提供对在线存储的低延迟读取和写入。应用程序延迟主要由两个主要部分组成:基础架构或网络延迟以及功能商店API延迟。降低网络延迟有助于以极低的延迟读取和写入 Feature Store。您可以通过部署 AWS PrivateLink 到功能存储运行时端点来减少功能存储的网络延迟。借助 AWS PrivateLink,您可以使用接口VPC终端节点,以可扩展的方式从您的 Amazon Virtual Private Cloud (VPC) 私密访问所有功能商店运行时API操作。privateDNSEnabled选项设置为 true 的 AWS PrivateLink 部署:

  • 它会将所有 Feature Store 读/写流量保持在你的范围内。VPC

  • 使用 Feature Store 时,它会将流量保留在与发起流量的客户端相同的 AZ 中。这样可以避免在AZs减少网络延迟之间的 “跳跃”。

按照使用接口VPC端点访问 AWS 服务中的步骤设置 AWS PrivateLink 功能存储。中的 Feature Store Runtime 的服务名称 AWS PrivateLink 为com.amazonaws.region.sagemaker.featurestore-runtime

InMemory 层在线存储可根据存储使用情况和请求自动扩展。如果新的使用模式变化很快,自动扩缩可能需要几分钟时间才能适应。在自动扩缩期间:

  • 对特征组的写入操作可能会收到节流错误。应在几分钟后重试您的请求。

  • 对特征组的读取操作可能会收到节流错误。标准重试策略适用于这种情况。

  • 读取操作可能会导致延迟增加。

默认 InMemory 层特征组的最大大小为 50 GiB。

请注意,InMemory 层目前仅支持在线特征组,不支持在线+离线特征组,因此 InMemory 层的在线和离线存储之间无法进行复制。此外,该InMemory等级目前不支持客户托管KMS密钥。