选择您的 Cookie 首选项

我们使用必要 Cookie 和类似工具提供我们的网站和服务。我们使用性能 Cookie 收集匿名统计数据,以便我们可以了解客户如何使用我们的网站并进行改进。必要 Cookie 无法停用,但您可以单击“自定义”或“拒绝”来拒绝性能 Cookie。

如果您同意,AWS 和经批准的第三方还将使用 Cookie 提供有用的网站功能、记住您的首选项并显示相关内容,包括相关广告。要接受或拒绝所有非必要 Cookie,请单击“接受”或“拒绝”。要做出更详细的选择,请单击“自定义”。

使用推理配置文件设置模型调用资源

聚焦模式
使用推理配置文件设置模型调用资源 - Amazon Bedrock

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

推理配置文件是 Amazon Bedrock 中的一种资源,用于定义模型以及推理配置文件可以将模型调用请求路由到的一个或多个区域。您可以将推理配置文件用于以下任务:

  • 跟踪使用情况指标-设置 CloudWatch 日志并提交带有应用程序推理配置文件的模型调用请求,以收集模型调用的使用指标。当你查看推理概况的信息时,你可以检查这些指标,并使用它们来为你的决策提供依据。有关如何设置 CloudWatch 日志的更多信息,请参阅使用日志监控模型调用 CloudWatch

  • 使用标签监控成本 — 在提交按需模型调用请求时,将标签附加到应用程序推理配置文件以跟踪成本。有关如何使用标签进行成本分配的更多信息,请参阅 AWS Billing 用户指南中的使用 AWS 成本分配标签组织和跟踪成本

  • 跨区域推理 — 使用包含多个区域的推理配置文件来提高吞吐量。 AWS 区域推理配置文件将在这些区域中分发模型调用请求,以提高吞吐量和性能。有关跨区域推理的更多信息,请参阅。通过跨区域推理提高吞吐量

Amazon Bedrock 提供以下类型的推理配置文件:

  • 跨区域(系统定义)推理配置文件 — 在 Amazon Bedrock 中预定义的推理配置文件,包括模型请求可以路由到的多个区域。

  • 应用程序推理配置文件 — 用户为跟踪成本和模型使用情况而创建的推理配置文件。您可以创建一个推理配置文件,将模型调用请求路由到一个区域或多个区域:

    • 要创建用于跟踪某个区域中模型的成本和使用情况的推理配置文件,请在您希望推理配置文件将请求路由到的区域中指定基础模型。

    • 要创建用于跟踪模型跨多个区域的成本和使用情况的推理配置文件,请指定用于定义模型的跨区域(系统定义)推理配置文件以及您希望推理配置文件将请求路由到的区域。

您可以使用具有以下功能的推理配置文件将请求路由到多个区域,并跟踪使用这些功能发出的调用请求的使用情况和成本:

使用推理配置文件的价格是根据您调用推理配置文件所在区域的模型价格计算的。有关定价的信息,请参阅 Amazon Bedrock 定价

有关跨区域推理配置文件可以提供的吞吐量的更多详细信息,请参阅。通过跨区域推理提高吞吐量

隐私网站条款Cookie 首选项
© 2025, Amazon Web Services, Inc. 或其附属公司。保留所有权利。