吞吐量模式 - 亚马逊 SageMaker AI

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

吞吐量模式

Ama SageMaker zon Feature Store 提供两种定价模式可供选择:按需 (On-demand) 和预配置 (Provisioned) 吞吐量模式。 On-demand最适合可预测性较低的流量,而最Provisioned适合一致且可预测的流量。

您可以选择在给定特征组的 On-demandProvisioned 吞吐量模式之间切换,以适应应用流量规律不断变化或较难预测的时期。24 小时内只能将特征组吞吐模式更新为 On-demand 一次。吞吐量模式可以使用UpdateFeatureGroupAPI或通过控制台 UI 以编程方式更新。有关如何使用控制台的更多信息,请参阅在控制台中使用 A SageMaker mazon Feature Store

您可以将 Provisioned 吞吐量模式用于离线特征组或具有 Standard 存储类型的特征组。对于其他存储配置,则使用 On-demand 吞吐量模式。有关联机和离线存储配置的信息,请分别参阅 在线存储离线存储

有关定价的更多详情,请参阅 Amazon SageMaker AI 定价

按需吞吐量模式

当使用工作负载未知、应用流量不可预测且无法预测容量需求的特征组时,On-demand(默认)吞吐量模式最为有效。

On-demand 模式对应用程序在特征组上执行的读写操作收费。您无需指定应用程序的读写吞吐量,因为当工作负载增加或减少时,特征存放区可立即满足您的需求。您只需支付您使用的费用,费用以 ReadRequestsUnitsWriteRequestsUnits 为单位。

您可以使用CreateFeatureGroupUpdateFeatureGroupAPIs或通过控制台 UI 启用On-demand吞吐量模式。有关使用管理控制台用户界面的更多信息,请参阅 在控制台中使用 A SageMaker mazon Feature Store

重要

24 小时内只能将特征组吞吐模式更新为 On-demand 一次。

预配置吞吐量模式

当使用具有可预测工作负载的特征组时,Provisioned 吞吐量模式效果最佳,而且可以预测容量需求以控制成本。对于某些可以提前预测吞吐量要求的工作负载,这可以使其更具成本效益。

将特征组设置为 Provisioned 模式时,会指定容量单位,即应用程序可从特征组中消耗的最大容量。如果您的应用程序超过了该 Provisioned 吞吐能力,就会受到请求节流的限制。

以下是有关读写容量单位的信息。

  • 使用检索最大 4 KB 的单条记录GetRecordAPI将消耗至少 1RCU(读取容量单位)。回收较大的有效载荷可能需要更多时间。所需的读取容量单位总数取决于项目大小,包括特征存放区服务为每条记录添加的少量元数据。

  • 使用有效载荷为 1 KB 的单个写入请求PutRecordAPI将消耗至少 1WCU(写入容量单位),小数有效负载向上舍入到最接近的 KB。它可能会消耗更多精力,具体取决于事件时间、记录的删除状态和上线时间 (TTL) 状态。有关 TTL 的更多信息,请参阅 记录的生存时间 (TTL) 持续时间

重要

在设置容量单位时,请考虑以下几点:

  • 即使您没有完全使用 Provisioned 容量,也将按照您为特征组提供的读写能力收费。

  • 如果读取或写入容量设置过低,请求可能会出现节流。

  • 在某些情况下,由于特征存放区服务会添加记录级元数据以启用各种功能,因此记录可能会消耗额外的容量单位。

  • 仅使用GetRecord或仍BatchGetRecordAPIs会消耗与整条记录RCU相对应的要素子集。

  • 对于写入容量,应提供近期峰值容量的 2 倍,以避免在执行回填或批量摄取时出现节流,因为这可能会导致大量历史记录写入。这是因为写入历史记录会消耗额外的写入容量。

  • 特征存放区目前不支持 Provisioned 模式的自动扩缩。

您可以使用CreateFeatureGroupUpdateFeatureGroupAPIs或通过控制台 UI 启用On-demand吞吐量模式。有关使用管理控制台用户界面的更多信息,请参阅 在控制台中使用 A SageMaker mazon Feature Store

下面介绍在启用Provisioned模式时如何增加或减少功能组的RCU和WCU吞吐量。

增加预配置吞吐量

您可以使用RCU或WCU控制台用户界面增加UpdateFeatureGroupAPI或根据需要增加频率。

减少预配置吞吐量

您可以使用或控制台界面为功能组减少RCU和WCU(UpdateFeatureGroupAPI或两者兼而有之)。

每天可对特征组执行的 Provisioned 容量递减次数有一个默认配额。一天是根据世界时协调时间 (UTC) 定义的。在某一天,您可以在一小时内执行最多四次减少,只要您在当天未执行任何其他减少。随后,只要前一小时没有减少,每小时就可以再减少一次。这实际上将每日的减小操作的最大次数设置为 27 次(在前 1 个小时内为 4 次减小操作,对于一天内的每个后续 1 小时时段,为 1 次减小操作)。

吞吐量模式指标

处于 On-demand 模式的特征组将发出 ConsumedReadRequestsUnitsConsumedWriteRequestsUnits 指标。处于 Provisioned 模式的特征组将发出 ConsumedReadCapacityUnitsConsumedWriteCapacityUnits 指标。有关特征存放区指标的更多信息,请参阅 亚马逊 SageMaker 精选商店指标

吞吐量模式限制

每个 AWS 账户 都有默认的服务配额或限制,用于帮助确保可用性并管理账单风险。有关默认配额和限制的信息,请参阅 配额、命名规则和数据类型

在某些情况下,这些限制可能低于文件中的规定。如果您需要更高的限额,可以提交增加限额的申请。最好在达到当前限制之前进行操作,以避免作业中断。有关服务配额以及如何请求增加配额的更多信息,请参阅 AWS 服务配额