本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
使用 Amazon Bedrock 中的预配置吞吐量增加模型调用容量
吞吐量是指模型处理和返回的输入和输出的数量和速率。您可以购买预配置吞吐量,以固定成本为模型预置更高的吞吐量。如果您自定义了模型,则必须购买预配置吞吐量才能使用它。
您购买的预配置吞吐量按小时计费。有关定价的详细信息,请参阅 Amazon Bedrock 定价
-
您选择的型号(对于自定义型号,定价与其定制的基本型号相同)。
-
您为预配置吞吐量指定的模型单位数 (MUs)。MU 为指定模型提供特定的吞吐量级别。MU 的吞吐量级别指定了以下内容:
-
MU 在一分钟内可以在所有请求中处理的输入令牌数量。
-
MU 在一分钟内可以在所有请求中生成的输出令牌的数量。
注意
有关 MU 指定内容的更多信息,请联系您的 AWS 账户 经理。
-
-
您承诺保持预配置吞吐量的持续时间。承诺期限越长,每小时价格的折扣就越多。您可以在以下承诺级别之间进行选择:
-
无需承诺 — 您可以随时删除预配置吞吐量。
-
1 个月 — 在一个月的承诺期限结束之前,您无法删除预配置吞吐量。
-
6 个月 — 在六个月的承诺期限结束之前,您无法删除预配置吞吐量。
注意
在您删除预配置吞吐量之前,计费将继续。
-
以下步骤概述了设置和使用预配置吞吐量的过程。
-
确定MUs您要为预配置吞吐量购买的数量,以及您要承诺使用预配置吞吐量的时间。
-
为基本型号或自定义型号购买预置吞吐量。
-
创建预配置模型后,您可以使用它来运行模型推理。