本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
吞吐量模式
Ama SageMaker zon Feature Store 提供两种定价模式可供选择:按需 (On-demand
) 和预配置 (Provisioned
) 吞吐量模式。 On-demand
最适合可预测性较低的流量,而最Provisioned
适合一致且可预测的流量。
您可以选择在给定特征组的 On-demand
和 Provisioned
吞吐量模式之间切换,以适应应用流量规律不断变化或较难预测的时期。24 小时内只能将特征组吞吐模式更新为 On-demand
一次。吞吐量模式可以使用UpdateFeatureGroupAPI或通过控制台 UI 以编程方式更新。有关如何使用控制台的更多信息,请参阅在控制台中使用 A SageMaker mazon Feature Store。
您可以将 Provisioned
吞吐量模式用于离线特征组或具有 Standard
存储类型的特征组。对于其他存储配置,则使用 On-demand
吞吐量模式。有关联机和离线存储配置的信息,请分别参阅 在线存储 和 离线存储。
有关定价的更多详情,请参阅 Amazon SageMaker AI 定价
按需吞吐量模式
当使用工作负载未知、应用流量不可预测且无法预测容量需求的特征组时,On-demand
(默认)吞吐量模式最为有效。
On-demand
模式对应用程序在特征组上执行的读写操作收费。您无需指定应用程序的读写吞吐量,因为当工作负载增加或减少时,特征存放区可立即满足您的需求。您只需支付您使用的费用,费用以 ReadRequestsUnits
和 WriteRequestsUnits
为单位。
您可以使用CreateFeatureGroup或UpdateFeatureGroupAPIs或通过控制台 UI 启用On-demand
吞吐量模式。有关使用管理控制台用户界面的更多信息,请参阅 在控制台中使用 A SageMaker mazon Feature Store。
重要
24 小时内只能将特征组吞吐模式更新为 On-demand
一次。
预配置吞吐量模式
当使用具有可预测工作负载的特征组时,Provisioned
吞吐量模式效果最佳,而且可以预测容量需求以控制成本。对于某些可以提前预测吞吐量要求的工作负载,这可以使其更具成本效益。
将特征组设置为 Provisioned
模式时,会指定容量单位,即应用程序可从特征组中消耗的最大容量。如果您的应用程序超过了该 Provisioned
吞吐能力,就会受到请求节流的限制。
以下是有关读写容量单位的信息。
-
使用检索最大 4 KB 的单条记录
GetRecord
API将消耗至少 1RCU(读取容量单位)。回收较大的有效载荷可能需要更多时间。所需的读取容量单位总数取决于项目大小,包括特征存放区服务为每条记录添加的少量元数据。 -
使用有效载荷为 1 KB 的单个写入请求
PutRecord
API将消耗至少 1WCU(写入容量单位),小数有效负载向上舍入到最接近的 KB。它可能会消耗更多精力,具体取决于事件时间、记录的删除状态和上线时间 (TTL) 状态。有关 TTL 的更多信息,请参阅 记录的生存时间 (TTL) 持续时间。
重要
在设置容量单位时,请考虑以下几点:
-
即使您没有完全使用
Provisioned
容量,也将按照您为特征组提供的读写能力收费。 -
如果读取或写入容量设置过低,请求可能会出现节流。
-
在某些情况下,由于特征存放区服务会添加记录级元数据以启用各种功能,因此记录可能会消耗额外的容量单位。
-
仅使用
GetRecord
或仍BatchGetRecord
APIs会消耗与整条记录RCU相对应的要素子集。 -
对于写入容量,应提供近期峰值容量的 2 倍,以避免在执行回填或批量摄取时出现节流,因为这可能会导致大量历史记录写入。这是因为写入历史记录会消耗额外的写入容量。
-
特征存放区目前不支持
Provisioned
模式的自动扩缩。
您可以使用CreateFeatureGroup或UpdateFeatureGroupAPIs或通过控制台 UI 启用On-demand
吞吐量模式。有关使用管理控制台用户界面的更多信息,请参阅 在控制台中使用 A SageMaker mazon Feature Store。
下面介绍在启用Provisioned
模式时如何增加或减少功能组的RCU和WCU吞吐量。
增加预配置吞吐量
您可以使用RCU或WCU控制台用户界面增加UpdateFeatureGroupAPI或根据需要增加频率。
减少预配置吞吐量
您可以使用或控制台界面为功能组减少RCU和WCU(UpdateFeatureGroupAPI或两者兼而有之)。
每天可对特征组执行的 Provisioned
容量递减次数有一个默认配额。一天是根据世界时协调时间 (UTC) 定义的。在某一天,您可以在一小时内执行最多四次减少,只要您在当天未执行任何其他减少。随后,只要前一小时没有减少,每小时就可以再减少一次。这实际上将每日的减小操作的最大次数设置为 27 次(在前 1 个小时内为 4 次减小操作,对于一天内的每个后续 1 小时时段,为 1 次减小操作)。
吞吐量模式指标
处于 On-demand
模式的特征组将发出 ConsumedReadRequestsUnits
和 ConsumedWriteRequestsUnits
指标。处于 Provisioned
模式的特征组将发出 ConsumedReadCapacityUnits
和 ConsumedWriteCapacityUnits
指标。有关特征存放区指标的更多信息,请参阅 亚马逊 SageMaker 精选商店指标。
吞吐量模式限制
每个 AWS 账户 都有默认的服务配额或限制,用于帮助确保可用性并管理账单风险。有关默认配额和限制的信息,请参阅 配额、命名规则和数据类型。
在某些情况下,这些限制可能低于文件中的规定。如果您需要更高的限额,可以提交增加限额的申请。最好在达到当前限制之前进行操作,以避免作业中断。有关服务配额以及如何请求增加配额的更多信息,请参阅 AWS 服务配额。