Amazon Bedrock 端点和配额 - AWS 一般参考

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

Amazon Bedrock 端点和配额

以下是该服务的服务端点和服务限额。要以编程方式连接到 AWS 服务,请使用终端节点。除标准 AWS 终端节点外,一些 AWS 服务还提供选定区域的FIPS终端节点。有关更多信息,请参阅 AWS 服务端点。服务配额,也称为限制,是您的 AWS 账户的最大服务资源或操作数量。有关更多信息,请参阅 AWS 服务配额

服务端点

Amazon Bedrock 控制飞机 APIs

下表提供了 Amazon Bedrock 支持的用于管理、训练和部署模型的特定区域终端节点的列表。使用这些终端节点进行 Amazon Bedrock API 操作

区域名称 区域 端点 协议
美国东部(俄亥俄州) us-east-2

bedrock.us-east-2.amazonaws.com

bedrock-fips.us-east-2.amazonaws.com

HTTPS

HTTPS

美国东部(弗吉尼亚州北部) us-east-1

bedrock.us-east-1.amazonaws.com

bedrock-fips.us-east-1.amazonaws.com

HTTPS

HTTPS

美国西部(俄勒冈州) us-west-2

bedrock.us-west-2.amazonaws.com

bedrock-fips.us-west-2.amazonaws.com

HTTPS

HTTPS

亚太地区(孟买) ap-south-1 bedrock.ap-south-1.amazonaws.com HTTPS
亚太地区(首尔) ap-northeast-2 bedrock.ap-northeast-2.amazonaws.com HTTPS
亚太地区(新加坡) ap-southeast-1 bedrock.ap-southeast-1.amazonaws.com HTTPS
亚太地区(悉尼) ap-southeast-2 bedrock.ap-southeast-2.amazonaws.com HTTPS
亚太地区(东京) ap-northeast-1 bedrock.ap-northeast-1.amazonaws.com HTTPS
加拿大(中部) ca-central-1

bedrock.ca-central-1.amazonaws.com

bedrock-fips.ca-central-1.amazonaws.com

HTTPS

HTTPS

欧洲地区(法兰克福) eu-central-1 bedrock.eu-central-1.amazonaws.com HTTPS
欧洲地区(爱尔兰) eu-west-1 bedrock.eu-west-1.amazonaws.com HTTPS
欧洲地区(伦敦) eu-west-2 bedrock.eu-west-2.amazonaws.com HTTPS
欧洲地区(巴黎) eu-west-3 bedrock.eu-west-3.amazonaws.com HTTPS
欧洲(苏黎世) eu-central-2 bedrock.eu-central-2.amazonaws.com HTTPS
南美洲(圣保罗) sa-east-1 bedrock.sa-east-1.amazonaws.com HTTPS
AWS GovCloud (美国东部) us-gov-east-1

bedrock.us-gov-east-1.amazonaws.com

bedrock-fips.us-gov-east-1.amazonaws.com

HTTPS

HTTPS

AWS GovCloud (美国西部) us-gov-west-1

bedrock.us-gov-west-1.amazonaws.com

bedrock-fips.us-gov-west-1.amazonaws.com

HTTPS

HTTPS

亚马逊 Bedrock 运行时 APIs

下表提供了 Amazon Bedrock 支持对托管在 Amazon Bedrock 中的模型发出推理请求的特定区域终端节点列表。使用这些终端节点进行 Amazon Bedrock 运行时API操作

区域名称 区域 端点 协议
美国东部(俄亥俄州) us-east-2

bedrock-runtime.us-east-2.amazonaws.com

bedrock-runtime-fips.us-east-2.amazonaws.com

HTTPS

HTTPS

美国东部(弗吉尼亚州北部) us-east-1

bedrock-runtime.us-east-1.amazonaws.com

bedrock-runtime-fips.us-east-1.amazonaws.com

HTTPS

HTTPS

美国西部(俄勒冈州) us-west-2

bedrock-runtime.us-west-2.amazonaws.com

bedrock-runtime-fips.us-west-2.amazonaws.com

HTTPS

HTTPS

亚太地区(孟买) ap-south-1 bedrock-runtime.ap-south-1.amazonaws.com HTTPS
亚太地区(首尔) ap-northeast-2 bedrock-runtime.ap-northeast-2.amazonaws.com HTTPS
亚太地区(新加坡) ap-southeast-1 bedrock-runtime.ap-southeast-1.amazonaws.com HTTPS
亚太地区(悉尼) ap-southeast-2 bedrock-runtime.ap-southeast-2.amazonaws.com HTTPS
亚太地区(东京) ap-northeast-1 bedrock-runtime.ap-northeast-1.amazonaws.com HTTPS
加拿大(中部) ca-central-1

bedrock-runtime.ca-central-1.amazonaws.com

bedrock-runtime-fips.ca-central-1.amazonaws.com

HTTPS

HTTPS

欧洲地区(法兰克福) eu-central-1 bedrock-runtime.eu-central-1.amazonaws.com HTTPS
欧洲地区(爱尔兰) eu-west-1 bedrock-runtime.eu-west-1.amazonaws.com HTTPS
欧洲地区(伦敦) eu-west-2 bedrock-runtime.eu-west-2.amazonaws.com HTTPS
欧洲地区(巴黎) eu-west-3 bedrock-runtime.eu-west-3.amazonaws.com HTTPS
欧洲(苏黎世) eu-central-2 bedrock-runtime.eu-central-2.amazonaws.com HTTPS
南美洲(圣保罗) sa-east-1 bedrock-runtime.sa-east-1.amazonaws.com HTTPS
AWS GovCloud (美国东部) us-gov-east-1

bedrock-runtime.us-gov-east-1.amazonaws.com

bedrock-runtime-fips.us-gov-east-1.amazonaws.com

HTTPS

HTTPS

AWS GovCloud (美国西部) us-gov-west-1

bedrock-runtime.us-gov-west-1.amazonaws.com

bedrock-runtime-fips.us-gov-west-1.amazonaws.com

HTTPS

HTTPS

Amazon Bedrock 构建时的代理 APIs

下表提供了 Amazon Bedrock 代理支持创建和管理代理和知识库的特定区域终端节点列表。使用这些终端节点进行 Amazon Bedrock API 操作的代理

区域名称 区域 端点 协议
美国东部 (弗吉尼亚北部) us-east-1 bedrock-agent.us-east-1.amazonaws.com HTTPS
bedrock-agent-fips.us-east-1.amazonaws.com HTTPS
美国西部(俄勒冈州) us-west-2 bedrock-agent.us-west-2.amazonaws.com HTTPS
bedrock-agent-fips.us-west-2.amazonaws.com HTTPS
亚太地区(新加坡) ap-southeast-1 bedrock-agent.ap-southeast-1.amazonaws.com HTTPS
亚太地区(悉尼) ap-southeast-2 bedrock-agent.ap-southeast-2.amazonaws.com HTTPS
Asia Pacific (Tokyo) ap-northeast-1 bedrock-agent.ap-northeast-1.amazonaws.com HTTPS
加拿大(中部) ca-central-1 bedrock-agent.ca-central-1.amazonaws.com HTTPS
欧洲(法兰克福) eu-central-1 bedrock-agent.eu-central-1.amazonaws.com HTTPS
欧洲地区(爱尔兰) eu-west-1 bedrock-agent.eu-west-1.amazonaws.com HTTPS
欧洲(伦敦) eu-west-2 bedrock-agent.eu-west-2.amazonaws.com HTTPS
欧洲(巴黎) eu-west-3 bedrock-agent.eu-west-3.amazonaws.com HTTPS
亚太地区(孟买) ap-south-1 bedrock-agent.ap-south-1.amazonaws.com HTTPS
南美洲(圣保罗) sa-east-1 bedrock-agent.sa-east-1.amazonaws.com HTTPS

亚马逊 Bedrock 运行时代理 APIs

下表提供了 Amazon Bedrock 代理支持调用代理和查询知识库的特定区域终端节点列表。将这些终端节点用于执行 Amazon Bedrock 运行时API操作的代理

区域名称 区域 端点 协议
美国东部 (弗吉尼亚北部) us-east-1 bedrock-agent-runtime.us-east-1.amazonaws.com HTTPS
bedrock-agent-runtime-fips.us-east-1.amazonaws.com HTTPS
美国西部(俄勒冈州) us-west-2 bedrock-agent-runtime.us-west-2.amazonaws.com HTTPS
bedrock-agent-runtime-fips.us-west-2.amazonaws.com HTTPS
亚太地区(新加坡) ap-southeast-1 bedrock-agent-runtime.ap-southeast-1.amazonaws.com HTTPS
亚太地区(悉尼) ap-southeast-2 bedrock-agent-runtime.ap-southeast-2.amazonaws.com HTTPS
Asia Pacific (Tokyo) ap-northeast-1 bedrock-agent-runtime.ap-northeast-1.amazonaws.com HTTPS
加拿大(中部) ca-central-1 bedrock-agent-runtime.ca-central-1.amazows.com HTTPS
欧洲(法兰克福) eu-central-1 bedrock-agent-runtime.eu-ctral-1.amazonaws.com HTTPS
欧洲(巴黎) eu-west-3 bedrock-agent-runtime.eu-west-3.amazonaws.com HTTPS
欧洲地区(爱尔兰) eu-west-1 bedrock-agent-runtime.eu-west-1.amazonaws.com HTTPS
欧洲(伦敦) eu-west-2 bedrock-agent-runtime.eu-west-2.amazonaws.com HTTPS
亚太地区(孟买) ap-south-1 bedrock-agent-runtime.ap-south-1.amazows.com HTTPS
南美洲(圣保罗) sa-east-1 bedrock-agent-runtime.sa-east-1.amazonaws.com HTTPS

服务限额

有关如何申请增加配额的说明,包括可调整值标记为 “是” 的配额和标记为 “” 的配额,请参阅申请增加 Amazon Bedrock 配额下表显示了 Amazon Bedrock 的配额列表:

名称 默认值 可调整 描述
APIs每位代理 每个受支持的区域:11 个 您可以APIs向代理添加的最大数量。
每个代理的操作组数 每个受支持的区域:20 个 您可以向代理添加的操作组的最大数量。
每个流程的代理节点数 每个受支持的区域:10 个 代理节点的最大数量。
每个账户的代理数

ca-central-1:200

eu-central-1:200

每个其他支持的区域:50 个

一个账户中代理的最大数量。
AssociateAgentKnowledgeBase 每秒请求数 每个受支持的区域:6 个 每秒的最大 AssociateAgentKnowledgeBase API请求数。
每个代理关联的别名 每个受支持的区域:10 个 您可以与代理关联的最大别名数。
每个代理的相关知识库数 每个受支持的区域:2 个 您可以与代理关联的最大知识库数量。
Batch 推理输入文件大小 每个支持的区域:1,073,741,824 提交以进行批量推断的单个文件的最大大小(以字节为单位)。
Batch 推理任务规模 每个支持的区域:5,368,709,120 批量推理作业中包含的所有输入文件的最大累积大小(以字节为单位)。
代理说明中的字符数 每个受支持的区域:8000 个 代理说明中的最大字符数。
每个流的收集器节点数 每个受支持的区域:1 个 收集器节点的最大数量。
每个账户的并发摄取任务数 每个受支持的区域:5 个 一个账户中可以同时运行的最大摄取任务数。
每个数据源的并发摄取作业 每个受支持的区域:1 个 一个数据源可以同时运行的最大摄取任务数。
每个知识库的并发摄取作业 每个受支持的区域:1 个 知识库可以同时运行的最大摄取作业数。
并行模型导入任务 每个受支持的区域:1 个 同时进行的模型导入任务的最大数量。
每个流程的条件节点数 每个受支持的区域:5 个 条件节点的最大数量。
每个条件节点的条件 每个受支持的区域:5 个 每个条件节点的最大条件数。
上下文基础查询长度(以文本为单位) 每个受支持的区域:1 个 上下文基础查询的最大长度(以文本为单位)
上下文基础响应长度(以文本为单位) 每个受支持的区域:5 个 上下文基础响应的最大长度(以文本为单位)
上下文基础源长度(以文本为单位)

us-east-1:100 个

us-west-2:100 个

每个其他支持的区域:50 个

用于上下文基础的接地源的最大长度(以文本为单位)
CreateAgent 每秒请求数 每个受支持的区域:6 个 每秒的最大 CreateAgent API请求数。
CreateAgentActionGroup 每秒请求数 每个受支持的区域:12 个 每秒的最大 CreateAgentActionGroup API请求数。
CreateAgentAlias 每秒请求数 每个受支持的区域:2 个 每秒的最大 CreateAgentAlias API请求数。
CreateDataSource 每秒请求数 每个受支持的区域:2 个 每秒的最大 CreateDataSource API请求数。
CreateFlow 每秒请求数 每个受支持的区域:2 个 每秒的最大 CreateFlow 请求数。
CreateFlowAlias 每秒请求数 每个受支持的区域:2 个 每秒的最大 CreateFlowAlias 请求数。
CreateFlowVersion 每秒请求数 每个受支持的区域:2 个 每秒的最大 CreateFlowVersion 请求数。
CreateKnowledgeBase 每秒请求数 每个受支持的区域:2 个 每秒的最大 CreateKnowledgeBase API请求数。
CreatePrompt 每秒请求数 每个受支持的区域:2 个 每秒的最大 CreatePrompt 请求数。
CreatePromptVersion 每秒请求数 每个受支持的区域:2 个 每秒的最大 CreatePromptVersion 请求数。
Anthropic Claude 3.5 Haiku 的每分钟跨区域 InvokeModel 请求量 每个受支持的区域:2,000 个 一分钟内您可以拨打 InvokeModel 的最大次数。 InvokeModelWithResponseStream 配额考虑了 Anthropic Claude 3.5 Haiku InvokeModel 和 InvokeModelWithResponseStream 代币的总和。
Anthropic Claude 3.5 每分钟跨区域 InvokeModel 代币 Haiku 每个支持的区域:4,000,000 您可以通过 InvokeModel 和在一分钟 InvokeModelWithResponseStream 内提供的最大代币数量。配额考虑了 Anthropic Claude 3.5 Haiku InvokeModel 和 InvokeModelWithResponseStream 代币的总和。
每个账户的自定义模型数 每个受支持的区域:100 个 一个账户中自定义模型的最大数量。
每个知识库的数据源 每个受支持的区域:5 个 每个知识库的最大数据源数量。
DeleteAgent 每秒请求数 每个受支持的区域:2 个 每秒的最大 DeleteAgent API请求数。
DeleteAgentActionGroup 每秒请求数 每个受支持的区域:2 个 每秒的最大 DeleteAgentActionGroup API请求数。
DeleteAgentAlias 每秒请求数 每个受支持的区域:2 个 每秒的最大 DeleteAgentAlias API请求数。
DeleteAgentVersion 每秒请求数 每个受支持的区域:2 个 每秒的最大 DeleteAgentVersion API请求数。
DeleteDataSource 每秒请求数 每个受支持的区域:2 个 每秒的最大 DeleteDataSource API请求数。
DeleteFlow 每秒请求数 每个受支持的区域:2 个 每秒的最大 DeleteFlow 请求数。
DeleteFlowAlias 每秒请求数 每个受支持的区域:2 个 每秒的最大 DeleteFlowAlias 请求数。
DeleteFlowVersion 每秒请求数 每个受支持的区域:2 个 每秒的最大 DeleteFlowVersion 请求数。
DeleteKnowledgeBase 每秒请求数 每个受支持的区域:2 个 每秒的最大 DeleteKnowledgeBase API请求数。
DeletePrompt 每秒请求数 每个受支持的区域:2 个 每秒的最大 DeletePrompt 请求数。
DisassociateAgentKnowledgeBase 每秒请求数 每个受支持的区域:4 个 每秒的最大 DisassociateAgentKnowledgeBase API请求数。
已为每个代理启用操作组 每个受支持的区域:11 个 可以在代理中启用的最大操作组数。
每个推理配置文件的终端节点 每个受支持的区域:5 个 推理配置文件中的最大端点数。端点由模型和模型的调用请求发送到的区域定义。
每个主题的示例短语 每个受支持的区域:5 个 每个主题可以包含的最大主题示例数量
每个摄取任务要添加或更新的文件 每个支持的区域:5 百万个 每个摄取任务可以载入的最大新文件和更新文件数。
每个摄取任务要删除的文件 每个支持的区域:5 百万个 每个摄取任务可以删除的最大文件数。
每个流的流量别名 每个受支持的区域:10 个 流量别名的最大数量。
每个流量的流量版本 每个受支持的区域:10 个 流程版本的最大数量。
每个账户的流量 每个受支持的区域:100 个 每个账户的最大流量数。
GetAgent 每秒请求数 每个受支持的区域:15 个 每秒的最大 GetAgent API请求数。
GetAgentActionGroup 每秒请求数 每个受支持的区域:20 个 每秒的最大 GetAgentActionGroup API请求数。
GetAgentAlias 每秒请求数 每个受支持的区域:10 个 每秒的最大 GetAgentAlias API请求数。
GetAgentKnowledgeBase 每秒请求数 每个受支持的区域:15 个 每秒的最大 GetAgentKnowledgeBase API请求数。
GetAgentVersion 每秒请求数 每个受支持的区域:10 个 每秒的最大 GetAgentVersion API请求数。
GetDataSource 每秒请求数 每个受支持的区域:10 个 每秒的最大 GetDataSource API请求数。
GetFlow 每秒请求数 每个受支持的区域:10 个 每秒的最大 GetFlow 请求数。
GetFlowAlias 每秒请求数 每个受支持的区域:10 个 每秒的最大 GetFlowAlias 请求数。
GetFlowVersion 每秒请求数 每个受支持的区域:10 个 每秒的最大 GetFlowVersion 请求数。
GetIngestionJob 每秒请求数 每个受支持的区域:10 个 每秒的最大 GetIngestionJob API请求数。
GetKnowledgeBase 每秒请求数 每个受支持的区域:10 个 每秒的最大 GetKnowledgeBase API请求数。
GetPrompt 每秒请求数 每个受支持的区域:10 个 每秒的最大 GetPrompt 请求数。
每个账户的护栏 每个受支持的区域:100 个 一个账户中护栏的最大数量
每个账户导入的模型 每个受支持的区域:3 个 一个账户中导入的模型的最大数量。
每个账户的推理配置文件 每个受支持的区域:1,000 个 一个账户中推理配置文件的最大数量。
摄取任务文件大小 每个受支持的区域:50 个 摄取任务中文件的最大大小(以 MB 为单位)。
摄取任务规模 每个受支持的区域:100 个 摄取任务的最大大小(以 GB 为单位)。
每个流的输入节点 每个受支持的区域:1 个 流输入节点的最大数量。
每个流的迭代器节点 每个受支持的区域:1 个 迭代器节点的最大数量。
每个流程的知识库节点数 每个受支持的区域:10 个 知识库节点的最大数量。
每个账户的知识库 每个受支持的区域:100 个 每个账户的最大知识库数量。
每个流的 Lambda 函数节点数 每个受支持的区域:10 个 Lambda 函数节点的最大数量。
每个流的 Lex 节点数 每个受支持的区域:5 个 Lex 节点的最大数量。
ListAgentActionGroups 每秒请求数 每个受支持的区域:10 个 每秒的最大 ListAgentActionGroups API请求数。
ListAgentAliases 每秒请求数 每个受支持的区域:10 个 每秒的最大 ListAgentAliases API请求数。
ListAgentKnowledgeBases 每秒请求数 每个受支持的区域:10 个 每秒的最大 ListAgentKnowledgeBases API请求数。
ListAgentVersions 每秒请求数 每个受支持的区域:10 个 每秒的最大 ListAgentVersions API请求数。
ListAgents 每秒请求数 每个受支持的区域:10 个 每秒的最大 ListAgents API请求数。
ListDataSources 每秒请求数 每个受支持的区域:10 个 每秒的最大 ListDataSources API请求数。
ListFlowAliases 每秒请求数 每个受支持的区域:10 个 每秒的最大 ListFlowAliases 请求数。
ListFlowVersions 每秒请求数 每个受支持的区域:10 个 每秒的最大 ListFlowVersions 请求数。
ListFlows 每秒请求数 每个受支持的区域:10 个 每秒的最大 ListFlows 请求数。
ListIngestionJobs 每秒请求数 每个受支持的区域:10 个 每秒的最大 ListIngestionJobs API请求数。
ListKnowledgeBases 每秒请求数 每个受支持的区域:10 个 每秒的最大 ListKnowledgeBases API请求数。
ListPrompts 每秒请求数 每个受支持的区域:10 个 每秒的最大 ListPrompts 请求数。
模型单位无承诺基本型号的预置吞吐量 每个受支持的区域:2 个 在基本模型的无承诺预置吞吐量中可以分配的最大模型单位数
模型单位无需承诺自定义模型的预配置吞吐量 每个受支持的区域:2 个 在自定义模型的无承诺预置吞吐量中可以分配的最大模型单位数
AI21实验室 Jurassic-2 Mid 每个预配置模型的模型单位 每个受支持的区域:0 个 可以分配给AI21实验室 Jurassic-2 Mid 的预配置模型的最大模型单位数。
AI21实验室 Jurassic-2 Ultra 的每个预配置模型的模型单位 每个受支持的区域:0 个 可以分配给 AI21 Labs Jurassic-2 Ultra 的预配置模型的最大模型单位数。
Amazon Titan Embeddings G1 的每个预配置模型的模型单位——文本 每个受支持的区域:0 个 可以分配给 Amazon Titan Embeddings G1 的预配置模型的最大模型单位数量-文本。
Amazon Titan 图像生成器 G1 的每个预配置模型的模型单位 每个受支持的区域:0 个 可以分配给 Amazon Titan Image Generator G1 的预配置模型的最大模型单位数。
Amazon Titan 图像生成器 G2 的每个预配置模型的模型单位 每个受支持的区域:0 个 可以分配给 Amazon Titan Image Generator G2 的预配置模型的最大模型单位数。
Amazon Titan Lite V1 4K 每个预配置型号的型号单位 每个受支持的区域:0 个 可以分配给 Amazon Titan Text Lite V1 4K 的预配置模型的最大模型单位数。
Amazon Titan 多模式嵌入式 G1 的每个预配置模型的模型单位 每个受支持的区域:0 个 可以分配给 Amazon Titan 多式联运 Embeddings G1 的预配置模型的最大模型单位数。
Amazon Titan 文本嵌入 V2 的每个预配置模型的模型单位 每个受支持的区域:0 个 可以分配给 Amazon Titan 文本嵌入 V2 的预配置模型的最大模型单位数。
Amazon Titan Titan Text G1-Express 8K 的每个预配置型号的模型单位 每个受支持的区域:0 个 可以分配给 Amazon Titan Text G1-Express 8K 的预配置模型的最大模型单位数量。
亚马逊 Titan Titan Text Premier V1 32K 的每个预配置型号的型号单位 每个受支持的区域:0 个 可以分配给 Amazon Titan Text Premier V1 32K 的预配置模型的最大模型单位数量。
Anthropic Claude 3 Haiku 200K 每个预配置模型的模型单位 每个受支持的区域:0 个 可以分配给 Anthropic Claude 3 Haiku 200K 的预配置模型的最大模型单位数。
Anthropic Claude 3 Haiku 48K 每个预配置模型的模型单位 每个受支持的区域:0 个 可以分配给 Anthropic Claude 3 Haiku 48K 的预配置模型的最大模型单位数。
Anthropic Claude 3 Sonnet 200K 每个预配置模型的模型单位 每个受支持的区域:0 个 可以分配给 Anthropic Claude 3 Sonnet 200K 的预配置模型的最大模型单位数。
Anthropic Claude 3 Sonnet 28K 每个预配置模型的模型单位 每个受支持的区域:0 个 可以分配给 Anthropic Claude 3 Sonnet 28K 的预配置模型的最大模型单位数。
Anthropic Claude 3.5 Sonnet 18K 每个预配置模型的模型单位 每个受支持的区域:0 个 可以分配给 Anthropic Claude 3.5 Sonnet 18K 的预配置模型的最大模型单位数。
Anthropic Claude 3.5 Sonnet 200K 每个预配置模型的模型单位 每个受支持的区域:0 个 可以分配给 Anthropic Claude 3.5 Sonnet 200K 的预配置模型的最大模型单位数。
Anthropic Claude 3.5 Sonnet 51K 每个预配置模型的模型单位 每个受支持的区域:0 个 可以分配给 Anthropic Claude 3.5 Sonnet 51K 的预配置模型的最大模型单位数。
Anthropic Claude Instant V1 100K 每个预配置模型的模型单位 每个受支持的区域:0 个 可以分配给 Anthropic Claude Instant V1 100K 的预配置模型的最大模型单位数。
Anthropic Claude V2 100K 每个预配置模型的模型单位 每个受支持的区域:0 个 可以分配给 Anthropic Claude V2 100K 的预配置模型的最大模型单位数。
Anthropic Claude V2 18K 每个预配置模型的模型单位 每个受支持的区域:0 个 可以分配给 Anthropic Claude V2 18K 的预配置模型的最大模型单位数。
Anthropic Claude V2.1 18K 每个预配置模型的模型单位 每个受支持的区域:0 个 可以分配给 Anthropic Claude V2.1 18K 的预配置模型的最大模型单位数。
Anthropic Claude V2.1 200K 每个预配置模型的模型单位 每个受支持的区域:0 个 可以分配给 Anthropic Claude V2.1 200k 的预配置模型的最大模型单位数。
Cohere Command 每个预配置模型的模型单位 每个受支持的区域:0 个 可以分配给 Cohere Command 的预配置模型的最大模型单位数。
Cohere Command Light 的每个预配置模型的模型单位 每个受支持的区域:0 个 可以分配给 Cohere Command Light 的预配置模型的最大模型单位数。
Cohere Command R 的每个预配置模型的模型单位 每个受支持的区域:0 个 可以分配给 Cohere Command R 128k 的预配置模型的最大模型单位数。
Cohere Command R Plus 每个预配置模型的模型单位 每个受支持的区域:0 个 可以分配给 Cohere Command R Plus 128k 的预配置模型的最大模型单位数。
Cohere 每个预配置模型的模型单位嵌入英语 每个受支持的区域:0 个 可以分配给 Cohere Embed English 的预配置模型的最大模型单位数。
Cohere 嵌入式多语言每个预配置模型的模型单位 每个受支持的区域:0 个 可以分配给 Cohere Embed 多语言的已置备模型的最大模型单位数。
Meta Llama 2 13B 每个预配置模型的模型单位 每个受支持的区域:0 个 可以分配给 Meta Llama 2 13B 的预配置模型的最大模型单位数。
Meta Llama 2 70B 每个预配置模型的模型单位 每个受支持的区域:0 个 可以分配给 Meta Llama 2 70B 的预配置模型的最大模型单位数。
Meta Llama 2 Chat 13B 每个预配置模型的模型单位 每个受支持的区域:0 个 可以分配给 Meta Llama 2 Chat 13B 的预配置模型的最大模型单位数量。
Meta Llama 2 Chat 70B 每个预配置模型的模型单位 每个受支持的区域:0 个 可以分配给 Meta Llama 2 Chat 70B 的预配置模型的最大模型单位数量。
Meta Llama 3 70B Instruct 每个预配置模型的模型单位 每个受支持的区域:0 个 可以分配给 Meta Llama 3 70B Instruct 的预配置模型的最大模型单位数量。
Meta Llama 3 8B Instruct 每个预配置模型的模型单位 每个受支持的区域:0 个 可以分配给 Meta Llama 3 8B Instruct 的预配置模型的最大模型单位数量。
Meta Llama 3.1 70B Instruct 每个预配置模型的模型单位 每个受支持的区域:0 个 可以分配给 Meta Llama 3.1 70B Instruct 的预配置模型的最大模型单位数。
Meta Llama 3.1 8B Instruct 每个预配置模型的模型单位 每个受支持的区域:0 个 可以分配给 Meta Llama 3.1 8B Instruct 的预配置模型的最大模型单位数。
Meta Llama 3.2 1B Instruct 每个预配置模型的模型单位 每个受支持的区域:0 个 可以分配给 Meta Llama 3.2 1B Instruct 的预配置模型的最大模型单位数。
Meta Llama 3.2 3B Instruct 每个预配置模型的模型单位 每个受支持的区域:0 个 可以分配给 Meta Llama 3.2 3B Instruct 的预配置模型的最大模型单位数。
Mistral Large 2407 每个预配置模型的模型单位 每个受支持的区域:0 个 可以分配给 Mistral Large 2407 的预配置模型的最大模型单位数。
Mistral Small 每个预配置模型的模型单位 每个受支持的区域:0 个 可以分配给 Mistral Small 的预配置模型的最大模型单位数。
Stability.ai Stable Diffusion XL 0.8 的每个预配置模型的模型单位 每个受支持的区域:0 个 可以分配给 Stability.ai Stable Diffusion XL 0.8 的预配置模型的最大模型单位数
Stability.ai Stable Diffusion XL 1.0 的每个预配置模型的模型单位 每个受支持的区域:0 个 可以分配给 Stability.ai Stable Diffusion XL 1.0 的预配置模型的最大模型单位数。
并发的自动模型评估任务数 每个受支持的区域:20 个 在当前区域的此账户中,您一次可以指定的最大自动模型评估任务数量。
使用人工操作的并行模型评估作业数量 每个受支持的区域:10 个 在当前区域的此账户中,您一次可以指定的使用人类工作者的模型评估作业的最大数量。
自定义指标的数量 每个受支持的区域:10 个 在使用人工操作的模型评估作业中,您可以指定的最大自定义指标数量。
基于人工的模型评估作业中的自定义提示数据集数量 每个受支持的区域:1 个 在当前区域的此账户中,您可以在基于人类的模型评估作业中指定的自定义提示数据集的最大数量。
每个作业的数据集数量 每个受支持的区域:5 个 您可以在自动模型评估作业中指定的最大数据集数。这包括自定义和内置提示数据集。
评估任务数量 每个受支持的区域:5,000 个 您可在当前区域的该账户中创建的最大模型评估任务数量。
每个数据集的指标数量 每个受支持的区域:3 个 在自动模型评估作业中,您可以为每个数据集指定的最大指标数。这包括自定义指标和内置指标。
使用人工操作的模型评估作业中的模型数量 每个受支持的区域:2 个 在使用人工工作的模型评估作业中,您可以指定的最大模型数量。
自动模型评估任务中的模型数量 每个受支持的区域:1 个 您可以在自动模型评估作业中指定的最大模型数量。
自定义提示数据集中的提示数 每个受支持的区域:1000 个 自定义提示数据集可以包含的最大提示数。
按需 ApplyGuardrail 内容筛选策略每秒文本单位数 每个受支持的区域:25 个 内容筛选策略每秒可处理的最大文本单元数
按需 ApplyGuardrail 拒绝主题策略每秒文本单位数 每个受支持的区域:25 个 被拒绝的主题策略每秒可以处理的最大文本单元数
按需 ApplyGuardrail 敏感信息筛选策略文本单位每秒 每个受支持的区域:25 个 敏感信息筛选策略每秒可处理的最大文本单元数
按需 ApplyGuardrail 字词过滤策略每秒文本单位数 每个受支持的区域:25 个 Word 筛选策略每秒可处理的最大文本单元数。
按需 ApplyGuardrail 上下文基础策略文本单位每秒

us-east-1:106

us-west-2:106

其他所有支持的区域:53

每秒可以为上下文基础策略处理的最大文本单元数
每秒按需 ApplyGuardrail 请求数 每个受支持的区域:25 个 每秒允许的最大 ApplyGuardrail API呼叫数
AI21Labs Jamba 1.5 Large 的每分钟按需 InvokeModel 请求数 每个受支持的区域:100 个 在 AI21 Labs Jamba 1.5 Large 中,您可以在一分钟内调用模型推理的最大次数。配额考虑了 Converse 和 InvokeModel
AI21Labs Jamba 1.5 Mini 的每分钟按需 InvokeModel 请求数 每个受支持的区域:100 个 您可以在一分钟内为 AI21 Labs Jamba 1.5 Mini 调用模型推理的最大次数。配额考虑了 Converse 和 InvokeModel
AI21Labs Jamba Instruct 的每分钟按需 InvokeModel 请求数 每个受支持的区域:100 个 您可以在一分钟内为 AI21 Labs Jamba Instruct 调用模型推理的最大次数。配额考虑了 Converse 和 InvokeModel
AI21Labs Jurassic-2 Mid 每分钟按需 InvokeModel 请求数 每个受支持的区域:400 个 一分钟内您可以拨打 InvokeModel 的最大次数。 InvokeModelWithResponseStream 配额考虑了 AI21 Labs Jurassic-2 Mi InvokeModel d 的总和和和以及对它的 InvokeModelWithResponseStream 请求
AI21Labs Jurassic-2 Ultra 的每分钟按需 InvokeModel 请求数 每个受支持的区域:100 个 一分钟内您可以拨打 InvokeModel 的最大次数。 InvokeModelWithResponseStream 配额考虑了 AI21 Labs Jurassic-2 Ultra 的总 InvokeModel 和和和和以及 InvokeModelWithResponseStream 申请量
Amazon Titan 图像生成器 G1 的每分钟按需 InvokeModel 请求数 每个受支持的区域:60 个 您在一分钟内可以调用 InvokeModel Amazon Titan 图像生成器 G1 的最大次数。
Amazon Titan 图像生成器 G1 V2 的每分钟按需 InvokeModel 请求数 每个受支持的区域:60 个 您在一分钟内可以调用 InvokeModel Amazon Titan 图像生成器 G V2 的最大次数。
Amazon Titan 多模式嵌入式 G1 的每分钟按需 InvokeModel 请求数 每个受支持的区域:2,000 个 您在一分钟内可以拨打 InvokeModel Amazon Titan 多式联运 Embeddings G1 的最大次数。
Amazon Titan 文本嵌入的每分钟按需 InvokeModel 请求数 每个受支持的区域:2,000 个 您在一分钟内可以拨打 InvokeModel Amazon Titan 文本嵌入的最大次数
Amazon Titan 文本嵌入式 V2 的每分钟按需 InvokeModel 请求数 每个受支持的区域:2,000 个 你在一分钟内可以拨打 InvokeModel Amazon Titan Text Embeddings V2 的最大次数
Amazon Titan Text Express 每分钟按需 InvokeModel 请求数 每个受支持的区域:400 个 一分钟内您可以拨打 InvokeModel 的最大次数。 InvokeModelWithResponseStream 配额考虑了 Amazon Titan Text Ex InvokeModel p InvokeModelWithResponseStream ress 的总和和和和和和的请求
Amazon Titan Text Lite 每分钟按需 InvokeModel 请求数 每个受支持的区域:800 个 一分钟内您可以拨打 InvokeModel 的最大次数。 InvokeModelWithResponseStream 配额考虑了 Amazon Titan Text Lite 的总 InvokeModel 和和和和以及对精简版的 InvokeModelWithResponseStream 请求
亚马逊 Titan Titan Text Premier 每分钟按需 InvokeModel 请求数 每个受支持的区域:100 个 一分钟内您可以拨打 InvokeModel 的最大次数。 InvokeModelWithResponseStream 配额考虑了 Amazon Titan Titan Text Premier 的总 InvokeModel 和和和和和的 InvokeModelWithResponseStream 请求
Anthropic Claude 3 Haiku 每分钟按需 InvokeModel 请求数

us-east-1:1000 个

us-west-2:1000 个

ap-northeast-1:200

ap-southeast-1:200

其他支持的每个区域:400

一分钟内您可以拨打 InvokeModel 的最大次数。 InvokeModelWithResponseStream 配额考虑了 Anthropic Claude 3 Haiku InvokeModel 和 InvokeModelWithResponseStream 代币的总和。
Anthropic Claude 3 Opus 每分钟按需 InvokeModel 请求数 每个受支持的区域:50 个 一分钟内您可以拨打 InvokeModel 的最大次数。 InvokeModelWithResponseStream 配额考虑了 Anthropic Claude 3 Opus 的总 InvokeModel 和和以及对作品的 InvokeModelWithResponseStream 请求。
Anthropic Claude 3 Sonnet 每分钟按需 InvokeModel 请求数

us-east-1:500 个

us-west-2:500 个

每个其他支持的区域:100 个

一分钟内您可以拨打 InvokeModel 的最大次数。 InvokeModelWithResponseStream 配额考虑了 Anthropic Claude 3 Sonne InvokeModelWithResponseStream t 的总 InvokeModel 和和和以及对 Sonnet 的请求
Anthropic Claude 3.5 Haiku 每分钟按需 InvokeModel 请求 每个受支持的区域:1000 个 一分钟内您可以拨打 InvokeModel 的最大次数。 InvokeModelWithResponseStream 配额考虑了 Anthropic Claude 3.5 Haiku InvokeModel 和 InvokeModelWithResponseStream 代币的总和。
Anthropic Claude 3.5 Sonnet 每分钟按需 InvokeModel 请求

us-east-1:50

us-east-2:50

us-west-2:250

ap-northeast-2:50

ap-south-1:50

ap-southeast-2:50

每个其他支持的区域:20 个

你可以在一分钟内为 Anthropic Claude 3.5 Sonnet 调用模型推断的最大次数。配额考虑了 Converse、 ConverseStream、 InvokeModel 和 InvokeModelWithResponseStream的总和。
Anthropic Claude 3.5 Sonnet V2 的每分钟按需 InvokeModel 请求数

us-west-2:250

每个其他支持的区域:50 个

你可以在一分钟内为 Anthropic Claude 3.5 Sonnet V2 调用模型推理的最大次数。配额考虑了 Converse、 ConverseStream、 InvokeModel 和 InvokeModelWithResponseStream的总和。
Anthropic Claude Instant 的按需 InvokeModel 请求

us-east-1:1000 个

us-west-2:1000 个

其他支持的每个区域:400

一分钟内您可以拨打 InvokeModel 的最大次数。 InvokeModelWithResponseStream 配额考虑了 Anthropic Claude Instan InvokeModelWithResponseStream t 的总 InvokeModel 和和和和和的请求
Anthropic Claude V InvokeModel 2 每分钟按需请求数

us-east-1:500 个

us-west-2:500 个

每个其他支持的区域:100 个

一分钟内您可以拨打 InvokeModel 的最大次数。 InvokeModelWithResponseStream 配额考虑了 Anthropic Claude InvokeModel V InvokeModelWithResponseStream 2 的总和和和和和的请求
Cohere Command 的每分钟按需 InvokeModel 请求数 每个受支持的区域:400 个 一分钟内您可以拨打 InvokeModel 的最大次数。 InvokeModelWithResponseStream 配额考虑了 Cohere Command InvokeModel 和 InvokeModelWithResponseStream 请求的总和。
Cohere 命令灯每分钟按需 InvokeModel 请求数 每个受支持的区域:800 个 一分钟内您可以拨打 InvokeModel 的最大次数。 InvokeModelWithResponseStream 配额考虑了 Cohere Command Light InvokeModel 和 InvokeModelWithResponseStream 请求的总和。
Cohere Command R 的每分钟按需 InvokeModel 请求数 每个受支持的区域:400 个 一分钟内您可以拨打 InvokeModel 的最大次数。 InvokeModelWithResponseStream 配额考虑了 Cohere Command R 128k InvokeModel 和 InvokeModelWithResponseStream 请求的总和。
Cohere Command R Plus 每分钟的按需 InvokeModel 请求数 每个受支持的区域:400 个 一分钟内您可以拨打 InvokeModel 的最大次数。 InvokeModelWithResponseStream 配额考虑了 Cohere Command R Plus 128k InvokeModel 和 InvokeModelWithResponseStream 请求的总和。
Coh InvokeModel ere Embed Embed Embe 每个受支持的区域:2,000 个 你在一分钟内可以拨打 Cohere Embed E InvokeModel mbed English 的最大次数。
Cohere 嵌入式多语言每分钟按需 InvokeModel 请求 每个受支持的区域:2,000 个 您在一分钟内可以拨打 Cohere E InvokeModel mbed 多语言的最大次数。
Meta Llama 2 13B 的每分钟按需 InvokeModel 请求数 每个受支持的区域:800 个 一分钟内您可以拨打 InvokeModel 的最大次数。 InvokeModelWithResponseStream 配额考虑了 Meta Llama 2 13 InvokeModelWithResponseStream B 的总 InvokeModel 和和和和的请求。
Meta Llama 2 70B 的每分钟按需 InvokeModel 请求数 每个受支持的区域:400 个 一分钟内您可以拨打 InvokeModel 的最大次数。 InvokeModelWithResponseStream 配额考虑了 Meta Llama 2 70 InvokeModelWithResponseStream B 的总 InvokeModel 和和和和的请求。
Meta Llama 2 Chat 13B 的每分钟按需 InvokeModel 请求数 每个受支持的区域:800 个 一分钟内您可以拨打 InvokeModel 的最大次数。 InvokeModelWithResponseStream 配额考虑了 Meta Llama 2 Chat 13B 的总 InvokeModel 和和和和的 InvokeModelWithResponseStream 请求。
Meta Llama 2 Chat 70B 每分钟按需 InvokeModel 请求数 每个受支持的区域:400 个 一分钟内您可以拨打 InvokeModel 的最大次数。 InvokeModelWithResponseStream 配额考虑了 Meta Llama 2 Chat 70B 的总 InvokeModel 和和和和的 InvokeModelWithResponseStream 请求。
Meta Llama 3 70B Instruct 的每分钟按需 InvokeModel 请求数 每个受支持的区域:400 个 一分钟内您可以拨打 InvokeModel 的最大次数。 InvokeModelWithResponseStream 配额考虑了 Meta Llama 3 70B Instruct 的总 InvokeModel 和和和和的 InvokeModelWithResponseStream 请求。
Meta Llama 3 8B Instruct 的每分钟按需 InvokeModel 请求数 每个受支持的区域:800 个 一分钟内您可以拨打 InvokeModel 的最大次数。 InvokeModelWithResponseStream 配额考虑了 Meta Llama 3 8B Instruct 的总 InvokeModel 和和和和的 InvokeModelWithResponseStream 请求。
Mistral 7B Instruct 每分钟按需 InvokeModel 请求数 每个受支持的区域:800 个 你在一分钟内可以呼叫 InvokeModel Mistral mi b-instruct-v stral-7 的最大次数 0
Mistral AI Mistral Small 每分钟按需 InvokeModel 请求数 每个受支持的区域:400 个 你可以在一分钟内呼叫 InvokeModel 的最大次数 Mistral AI Mistral Small InvokeModelWithResponseStream
Mistral Large 每分钟按需 InvokeModel 请求数 每个受支持的区域:400 个 Mistral mistral-large-240 InvokeModel 2-v1 InvokeModelWithResponseStream 在一分钟内可以拨打的最大次数
Mistral Mixtral 8x7b Instruct 每分钟按需 InvokeModel 请求数 每个受支持的区域:400 个 你在一分钟内可以拨打 Mistral mixtral- InvokeModel 8x7b-v0 的最大次数
Stability.ai Stable Diffusion 3 Large 每分钟按需 InvokeModel 请求 每个受支持的区域:15 个 你在一分钟内可以呼叫 Stability.ai Stable Di InvokeModel ffusion 3 Large 的最大次数。
Stability.ai Stable Diffusion 3 Medium 的按需 InvokeModel 请求 每个受支持的区域:60 个 你在一分钟内可以拨打 Stability.ai Stable Dif InvokeModel fusion 3 Medium 的最大次数
Stability.ai Stable Diffusion XL 0.8 的每分钟按需 InvokeModel 请求 每个受支持的区域:60 个 你在一分钟内可以拨打 Stability.ai Stable Di InvokeModel ffusion XL 0.8 的最大次数
Stability.ai Stable Diffusion XL 1.0 的每分钟按需 InvokeModel 请求 每个受支持的区域:60 个 你在一分钟内可以拨打 Stability.ai Stable Di InvokeModel ffusion XL 1.0 的最大次数
Stability.ai Stable Image Core 的每分钟按需 InvokeModel 请求数 每个受支持的区域:90 个 你在一分钟内可以调用 InvokeModel Stability.ai Stable Image Core 的最大次数。
Stability.ai Stable Image Ultra 的每分钟按需 InvokeModel 请求 每个受支持的区域:10 个 你在一分钟内可以调用 InvokeModel Stability.ai Stable Image Ultra 的最大次数。
AI21Labs Jamba 1.5 Large 每分钟按需 InvokeModel 代币 每个受支持的区域:30 万个 您可以在一分钟内为 AI21 Labs Jamba 1.5 Large 提交用于模型推断的最大代币数量。配额考虑了匡威和 InvokeModel的代币总和。
AI21Labs Jamba 1.5 Mini 每分钟按需 InvokeModel 代币 每个受支持的区域:30 万个 您可以在一分钟内为 AI21 Labs Jamba 1.5 Mini 提交用于模型推断的最大代币数量。配额考虑了匡威和 InvokeModel的代币总和。
AI21Labs Jamba Instruct 每分钟按需 InvokeModel 代币 每个受支持的区域:30 万个 您可以在一分钟内为 AI21 Labs Jamba Instruct 提交用于模型推断的最大代币数量。配额考虑了 Converse 和 InvokeModel
AI21Labs Jurassic-2 Mid 每分钟按需 InvokeModel 代币 每个受支持的区域:30 万个 你可以在一分钟内为 AI21 Labs Jurassic- InvokeModel 2 Mid 提供的最大代币数量。
AI21Labs Jurassic-2 Ultra 每分钟按需 InvokeModel 代币 每个受支持的区域:30 万个 你可以在一分钟内为 AI21 Labs Jurassic-2 InvokeModel Ultra 提供的最大代币数量。
亚马逊 Titan 图像生成器 G1 的每分钟按需 InvokeModel 代币 每个受支持的区域:2,000 个 您可以在一分钟内为 Amazon Titan 图像生成器 G1 提供的最大代币数量。 InvokeModel
亚马逊 Titan 图像生成器 G1 V2 的每分钟按需 InvokeModel 代币 每个受支持的区域:2,000 个 您可以在一分钟内为 Amazon Titan Image Generator G1 V2 提供的最大代币数量。 InvokeModel
Amazon Titan 多模式嵌入式 G1 的每分钟按需代 InvokeModel 币 每个受支持的区域:30 万个 您可以在一分钟内为 Amazon Titan 多式联运 Embeddings G1 提供的最大代币数量。 InvokeModel
Amazon Titan 文本嵌入的每分钟按需 InvokeModel 代币 每个受支持的区域:30 万个 您可以在一分钟内为 Amazon Titan 文本嵌 InvokeModel 入提供的最大代币数量。
Amazon Titan 文本嵌入 V2 的每分钟按需 InvokeModel 代币 每个受支持的区域:30 万个 您可以在一分钟内为 Amazon Titan Text Embeddings V2 提供的最大代币数量。 InvokeModel
Amazon Titan Text Express 每分钟按需 InvokeModel 代币 每个受支持的区域:30 万个 您可以通过 InvokeModel 和在一分钟 InvokeModelWithResponseStream 内提供的最大代币数量。配额考虑了 Amazon Titan Text Express InvokeModel 和 InvokeModelWithResponseStream 代币的总和。
Amazon Titan Text Lite 每分钟按需 InvokeModel 代币 每个受支持的区域:30 万个 您可以通过 InvokeModel 和在一分钟 InvokeModelWithResponseStream 内提供的最大代币数量。配额考虑了 Amazon Titan Text Lite InvokeModel 和 InvokeModelWithResponseStream 代币的总和。
亚马逊 Titan Titan Text Premier 每分钟按需 InvokeModel 代币 每个受支持的区域:30 万个 您可以通过 InvokeModel 和在一分钟 InvokeModelWithResponseStream 内提供的最大代币数量。配额考虑了 Amazon Titan Text Premier InvokeModel 和 InvokeModelWithResponseStream 代币的总和。
Anthropic Claude 3 Haiku 每分钟按需 InvokeModel 代币

us-east-1:2,000,000

us-west-2:2,000,000

ap-northeast-1:200,000

ap-southeast-1:200,000

每个其他支持的区域:300,000

您可以通过 InvokeModel 和在一分钟 InvokeModelWithResponseStream 内提供的最大代币数量。配额考虑了 Anthropic Claude 3 Haiku InvokeModel 和 InvokeModelWithResponseStream 代币的总和。
Anthropic Claude 3 Opus 每分钟按需 InvokeModel 代币 每个受支持的区域:40 万个 您可以通过 InvokeModel 和在一分钟 InvokeModelWithResponseStream 内提供的最大代币数量。配额考虑了 Anthropic Claude 3 Opus InvokeModel 和 InvokeModelWithResponseStream 代币的总和。
Anthropic Claude 3 Sonnet 每分钟按需 InvokeModel 代币

us-east-1:1,000,000

us-west-2:1,000,000

每个其他支持的区域:200,000

您可以通过 InvokeModel 和在一分钟 InvokeModelWithResponseStream 内提供的最大代币数量。配额考虑了 Anthropic Claude 3 Sonnet InvokeModel 和 InvokeModelWithResponseStream 代币的总和。
Anthropic Claude 3.5 Hai InvokeModel ku 的每分钟按需 每个支持的区域:2,000,000 您可以通过 InvokeModel 和在一分钟 InvokeModelWithResponseStream 内提供的最大代币数量。配额考虑了 Anthropic Claude 3.5 Haiku InvokeModel 和 InvokeModelWithResponseStream 代币的总和。
Anthropic Claude 3.5 Sonnet 每分钟按需 InvokeModel 通

us-east-1:400,000

us-east-2:400,000

us-west-2:2,000,000

ap-northeast-2:400,000

ap-south-1:400,000

ap-southeast-2:400,000

每个其他支持的区域:200,000

您可以在一分钟内为 Anthropic Claude 3.5 Sonnet 提交用于模型推断的最大代币数量。配额考虑了 Converse、 ConverseStream、 InvokeModel 和 InvokeModelWithResponseStream的总和。
Anthropic Claude 3.5 Sonnet V2 每分钟按需 InvokeModel 代币

us-west-2:2,000,000

所有其他支持的区域:400,000

您可以在一分钟内为 Anthropic Claude 3.5 Sonnet V2 提交用于模型推断的最大代币数量。配额考虑了 Converse、 ConverseStream、 InvokeModel 和 InvokeModelWithResponseStream的总和。
Anthro InvokeModel pic Claude Instant 每分钟按需

us-east-1:1,000,000

us-west-2:1,000,000

每个其他支持的区域:300,000

您可以通过 InvokeModel 和在一分钟 InvokeModelWithResponseStream 内提供的最大代币数量。配额考虑了 Anthropic Claude Instant InvokeModel 和 InvokeModelWithResponseStream 代币的总和。
Anthropic Claude V2 每分钟按需 InvokeModel 代币

us-east-1:50 万个

us-west-2:50 万个

每个其他支持的区域:200,000

您可以通过 InvokeModel 和在一分钟 InvokeModelWithResponseStream 内提供的最大代币数量。配额考虑了 Anthropic Claude V2 InvokeModel 和 InvokeModelWithResponseStream 代币的总和。
Cohere Command 每分钟按需 InvokeModel 代币 每个受支持的区域:30 万个 您可以通过 InvokeModel 和在一分钟 InvokeModelWithResponseStream 内提供的最大代币数量。配额考虑了 Cohere Command InvokeModel 和 InvokeModelWithResponseStream 代币的总和。
Cohere 命令灯每分钟按需 InvokeModel 代币 每个受支持的区域:30 万个 你可以在一分钟内为 Cohere Command Light 提供的最大代币数量。 InvokeModel
Cohere Command R 每分钟的按需 InvokeModel 代币 每个受支持的区域:30 万个 您可以通过 InvokeModel 和在一分钟 InvokeModelWithResponseStream 内提供的最大代币数量。配额考虑了 Cohere Command R 128k InvokeModel 和 InvokeModelWithResponseStream 代币的总和。
Cohere Command R Plus 每分钟的按需 InvokeModel 代币 每个受支持的区域:30 万个 您可以通过 InvokeModel 和在一分钟 InvokeModelWithResponseStream 内提供的最大代币数量。配额考虑了 Cohere Command R Plus 128k InvokeModel 和 InvokeModelWithResponseStream 代币的总和。
Cohere 嵌入英语每分钟按需 InvokeModel 代币 每个受支持的区域:30 万个 您可以在一分钟内为 Cohere Embed Embed English 提供的最大代币数量。 InvokeModel
Cohere 嵌入式多语言每分钟按需 InvokeModel 代币 每个受支持的区域:30 万个 您可以在一分钟内为 Cohere Embed 多语言提供的最大代币数量。 InvokeModel
Meta Llama 2 每分钟按需 InvokeModel 代币 13B 每个受支持的区域:30 万个 您可以通过 InvokeModel 和在一分钟 InvokeModelWithResponseStream 内提供的最大代币数量。配额考虑了 Meta Llama 2 13B InvokeModel 和 InvokeModelWithResponseStream 代币的总和。
Meta Llama 2 每分钟按需 InvokeModel 代币 70B 每个受支持的区域:30 万个 您可以通过 InvokeModel 和在一分钟 InvokeModelWithResponseStream 内提供的最大代币数量。配额考虑了 Meta Llama 2 70B InvokeModel 和 InvokeModelWithResponseStream 代币的总和。
Meta Llama 2 Chat 每分钟按需 InvokeModel 代币 13B 每个受支持的区域:30 万个 您可以通过 InvokeModel 和在一分钟 InvokeModelWithResponseStream 内提供的最大代币数量。配额考虑了 Meta Llama 2 Chat 13B InvokeModel 和 InvokeModelWithResponseStream 代币的总和。
Meta Llama 2 Chat 每分钟按需 InvokeModel 代币 70B 每个受支持的区域:30 万个 您可以通过 InvokeModel 和在一分钟 InvokeModelWithResponseStream 内提供的最大代币数量。配额考虑了 Meta Llama 2 Chat 70B InvokeModel 和 InvokeModelWithResponseStream 代币的总和。
Meta Llama 3 70B Instruct 每分钟按需 InvokeModel 代币 每个受支持的区域:30 万个 您可以通过 InvokeModel 和在一分钟 InvokeModelWithResponseStream 内提供的最大代币数量。配额考虑了 Meta Llama 3 70B Instruct InvokeModel 和 InvokeModelWithResponseStream 代币的总和。
Meta Llama 3 8B Instruct 每分钟按需 InvokeModel 代币 每个受支持的区域:30 万个 您可以通过 InvokeModel 和在一分钟 InvokeModelWithResponseStream 内提供的最大代币数量。配额考虑了 Meta Llama 3 8B Instruct InvokeModel 和 InvokeModelWithResponseStream 代币的总和。
Mistral AI Mistral 7B Instruct 每分钟按需 InvokeModel 代币 每个受支持的区域:30 万个 您可以通过 InvokeModel 和在一分钟 InvokeModelWithResponseStream 内提供的最大代币数量。配额考虑了 Mistral AI Mistral 7B Instruct InvokeModel 和 InvokeModelWithResponseStream 代币的总和。
Mistral AI Mistral Large 每分钟按需 InvokeModel 代币 每个受支持的区域:30 万个 您可以通过 InvokeModel 和在一分钟 InvokeModelWithResponseStream 内提供的最大代币数量。配额考虑了 Mistral AI Mistral Large InvokeModel 和 InvokeModelWithResponseStream 代币的总和。
Mistral AI Mistral Small 每分钟按需 InvokeModel 代币 每个受支持的区域:30 万个 您可以通过 InvokeModel 和在一分钟 InvokeModelWithResponseStream 内提供的最大代币数量。配额考虑了 Mistral AI Mistral Small InvokeModel 和 InvokeModelWithResponseStream 代币的总和。
Mistral AI Mixtral 8X7BB Instruct 每分钟按需 InvokeModel 代币 每个受支持的区域:30 万个 您可以通过 InvokeModel 和在一分钟 InvokeModelWithResponseStream 内提供的最大代币数量。配额考虑了 Mistral mixtral-8x InvokeModelWithResponseStream b-instruct-v 7 0 的 InvokeModel 和代币的总和。
Meta Llama 3.1 405B Instruct 每分钟的按需模型推理请求数 每个受支持的区域:200 个 你可以在一分钟内为 Meta Llama 3.1 405B Instruct 调用模型推理的最大次数。配额考虑了 InvokeModel、、 InvokeModelWithResponseStream、Converse 和 ConverseStream的请求总和。
Meta Llama 3.1 70B Instruct 每分钟的按需模型推理请求数 每个受支持的区域:400 个 你可以在一分钟内为 Meta Llama 3.1 70B Instruct 调用模型推理的最大次数。配额考虑了 InvokeModel、、 InvokeModelWithResponseStream、Converse 和 ConverseStream的请求总和。
Meta Llama 3.1 8B Instruct 每分钟的按需模型推理请求数 每个受支持的区域:800 个 你可以在一分钟内为 Meta Llama 3.1 8B Instruct 调用模型推理的最大次数。配额考虑了 InvokeModel、、 InvokeModelWithResponseStream、Converse 和 ConverseStream的请求总和。
Meta Llama 3.2 11B Instruct 每分钟的按需模型推理请求数 每个受支持的区域:400 个 你可以在一分钟内为 Meta Llama 3.2 11B Instruct 调用模型推理的最大次数。配额考虑了 InvokeModel、、 InvokeModelWithResponseStream、Converse 和 ConverseStream的请求总和。
Meta Llama 3.2 1B Instruct 每分钟按需模型推理请求数 每个受支持的区域:800 个 你可以在一分钟内为 Meta Llama 3.2 1B Instruct 调用模型推理的最大次数。配额考虑了 InvokeModel、、 InvokeModelWithResponseStream、Converse 和 ConverseStream的请求总和。
Meta Llama 3.2 3B Instruct 每分钟的按需模型推理请求数 每个受支持的区域:800 个 你可以在一分钟内为 Meta Llama 3.2 3B Instruct 调用模型推理的最大次数。配额考虑了 InvokeModel、、 InvokeModelWithResponseStream、Converse 和 ConverseStream的请求总和。
Meta Llama 3.2 90B Instruct 每分钟的按需模型推理请求数 每个受支持的区域:400 个 你可以在一分钟内为 Meta Llama 3.2 90B Instruct 调用模型推理的最大次数。配额考虑了 InvokeModel、、 InvokeModelWithResponseStream、Converse 和 ConverseStream的请求总和。
Mistral Large 2407 每分钟的按需模型推理请求数 每个受支持的区域:400 个 您可以在一分钟内为 Mistral Large 2407 调用模型推断的最大次数。配额考虑了 InvokeModel、 InvokeModelWithResponseStream、Converse 和 ConverseStream
Meta Llama 3.1 8B Instruct 每分钟按需模型推理令牌 每个受支持的区域:30 万个 你可以在一分钟内为 Meta Llama 3.1 8B Instruct 提交用于模型推断的最大代币数量。配额考虑了 InvokeModel、 InvokeModelWithResponseStream、Converse 和 ConverseStream的代币总和。
Meta Llama 3.2 11B Instruct 每分钟按需模型推理令牌 每个受支持的区域:30 万个 你可以在一分钟内为 Meta Llama 3.2 11B Instruct 提交用于模型推断的最大代币数量。配额考虑了 InvokeModel、 InvokeModelWithResponseStream、Converse 和 ConverseStream的代币总和。
Meta Llama 3.2 1B Instruct 每分钟按需模型推理令牌 每个受支持的区域:30 万个 你可以在一分钟内为 Meta Llama 3.2 1B Instruct 提交用于模型推断的最大代币数量。配额考虑了 InvokeModel、 InvokeModelWithResponseStream、Converse 和 ConverseStream的代币总和。
Meta Llama 3.2 3B Instruct 每分钟按需模型推理令牌 每个受支持的区域:30 万个 你可以在一分钟内为 Meta Llama 3.2 3B Instruct 提交用于模型推断的最大代币数量。配额考虑了 InvokeModel、 InvokeModelWithResponseStream、Converse 和 ConverseStream的代币总和。
Meta Llama 3.2 90B Instruct 每分钟按需模型推理令牌 每个受支持的区域:30 万个 你可以在一分钟内为 Meta Llama 3.2 90B Instruct 提交用于模型推断的最大代币数量。配额考虑了 InvokeModel、 InvokeModelWithResponseStream、Converse 和 ConverseStream的代币总和。
Mistral Large 2407 每分钟按需模型推理令牌 每个受支持的区域:30 万个 您可以在一分钟内为 Mistral Large 2407 提交用于模型推断的最大代币数量。配额考虑了 InvokeModel、 InvokeModelWithResponseStream、Converse 和 ConverseStream
Meta Llama 3.1 405B Instruct 每分钟按需模型推理令牌 每个受支持的区域:40 万个 你可以在一分钟内为 Meta Llama 3.1 405B Instruct 提交用于模型推断的最大代币数量。配额考虑了 InvokeModel、 InvokeModelWithResponseStream、Converse 和 ConverseStream的代币总和。
Meta Llama 3.1 70B Instruct 每分钟按需模型推理令牌 每个受支持的区域:30 万个 你可以在一分钟内为 Meta Llama 3.1 70B Instruct 提交用于模型推断的最大代币数量。配额考虑了 InvokeModel、 InvokeModelWithResponseStream、Converse 和 ConverseStream的代币总和。
每个流的输出节点 每个受支持的区域:10 个 流量输出节点的最大数量。
每个函数的参数 每个支持的区域:5 个 您在一个操作组函数中可以拥有的最大参数数。
PrepareAgent 每秒请求数 每个受支持的区域:2 个 每秒的最大 PrepareAgent API请求数。
PrepareFlow 每秒请求数 每个受支持的区域:2 个 每秒的最大 PrepareFlow 请求数。
每个流程的提示节点 每个受支持的区域:10 个 提示节点的最大数量。
每个账户的提示数 每个受支持的区域:50 个 最大提示数。
每个批次推理作业的记录 每个受支持的区域:50,000 个 批量推理作业中所有输入文件的最大记录数。
每个批处理推理作业的每个输入文件的记录 每个受支持的区域:50,000 个 批量推理作业中输入文件中的最大记录数。
敏感信息过滤器中的正则表达式实体 每个受支持的区域:10 个 单词策略中可以包含的护栏过滤器正则表达式的最大数量
以字符为单位的正则表达式长度 每个受支持的区域:500 个 护栏过滤器正则表达式的最大长度(以字符为单位)
每秒检索请求数 每个受支持的区域:5 个 每秒的最大检索API请求数。
RetrieveAndGenerate 每秒请求数 每个受支持的区域:5 个 每秒的最大 RetrieveAndGenerate API请求数。
每个流的 S3 检索节点数 每个受支持的区域:10 个 S3 检索节点的最大数量。
每个流的 S3 存储节点数 每个受支持的区域:10 个 S3 存储节点的最大数量。
预定的自定义作业 每个受支持的区域:2 个 计划自定义任务的最大数量。
提示的大小 每个受支持的区域:4 个 单个提示的最大大小(以 KB 为单位)是自定义提示数据集。
StartIngestionJob 每秒请求数 每个支持的区域:0.1 每秒的最大 StartIngestionJob API请求数。
使用基础模型计算正在进行和已提交的批量推理作业的总和

eu-south-1:10

每个其他支持的区域:20 个

使用基础模型的正在进行和已提交的批量推理作业的最大数量。
使用自定义模型的正在进行和已提交的批量推理作业的总和 每个受支持的区域:3 个 使用自定义模型的正在进行和已提交的批量推理作业的最大数量
Claude 3 Haiku v1 微调作业的训练和验证记录总和 每个受支持的区域:10000 个 Claude 3 Haiku 微调作业允许的最大训练和验证记录总数。
Meta Llama 2 13B v1 微调作业的训练和验证记录总和 每个受支持的区域:10000 个 Meta Llama 2 13B 微调作业允许的最大训练和验证记录总数。
Meta Llama 2 70B v1 微调作业的训练和验证记录总和 每个受支持的区域:10000 个 Meta Llama 2 70B 微调作业允许的最大训练和验证记录总数。
Meta Llama 3.1 70B Instruct v1 微调作业的训练和验证记录总和 每个受支持的区域:10000 个 Meta Llama 3.1 70B Instruct Fine-tuning 作业允许的最大训练和验证记录总数。
Meta Llama 3.1 8B Instruct v1 微调作业的训练和验证记录总和 每个受支持的区域:10000 个 Meta Llama 3.1 8B Instruct Fine-tuning 作业允许的最大训练和验证记录总数。
Meta Llama 3.2 1B Instruct v1 微调作业的训练和验证记录总和 每个受支持的区域:10000 个 Meta Llama 3.2 1B Instruct Fine-tuning 作业允许的最大训练和验证记录总数。
Meta Llama 3.2 3B Instruct v1 微调作业的训练和验证记录总和 每个受支持的区域:10000 个 Meta Llama 3.2 3B Instruct Fine-tuning 作业允许的最大训练和验证记录总数。
Titan Image Generator Generator G1 V1 微调作业的训练和验证记录总和 每个受支持的区域:10000 个 Titan Image Generator 微调作业允许的最大训练和验证记录总数。
Titan Image Generator Generator G1 V2 微调作业的训练和验证记录总和 每个受支持的区域:10000 个 Titan Image Generator V2 微调作业允许的最大训练和验证记录总数。
Titan 多模态嵌入式 G1 v1 微调作业的训练和验证记录总和 每个受支持的区域:50,000 个 Titan Multimodal Embeddings 微调作业允许的最大训练和验证记录总数。
Titan Text G1-Express v1 继续预训练作业的训练和验证记录总和 每个受支持的区域:10 万个 Titan Text Express 继续预训练作业允许的最大训练和验证记录总数。
Titan Text G1-Express v1 微调作业的训练和验证记录总和 每个受支持的区域:10000 个 Titan Text Express 微调作业允许的最大训练和验证记录总数。
Titan Text G1-Lite v1 继续预训练作业的训练和验证记录总和 每个受支持的区域:10 万个 Titan Text Lite 继续预训练作业允许的最大训练和验证记录总数。
Titan Text G1-Lite v1 微调作业的训练和验证记录总和 每个受支持的区域:10000 个 Titan Text Lite 微调作业允许的最大训练和验证记录总数。
Titan Text G1-Premier v1 微调作业的训练和验证记录总和 每个支持的区域:2 万个 Titan Text Premier 微调作业允许的最大训练和验证记录总数。
工作人员的任务时间 每个受支持的区域:30 个 工作人员完成任务的最大时间长度(以天为单位)。
每条护栏的主题 每个受支持的区域:30 个 跨护栏主题策略可以定义的最大主题数
每个流的节点总数 每个受支持的区域:40 个 流中的最大节点数。
UpdateAgent 每秒请求数 每个受支持的区域:4 个 每秒的最大 UpdateAgent API请求数。
UpdateAgentActionGroup 每秒请求数 每个受支持的区域:6 个 每秒的最大 UpdateAgentActionGroup API请求数
UpdateAgentAlias 每秒请求数 每个受支持的区域:2 个 每秒的最大 UpdateAgentAlias API请求数。
UpdateAgentKnowledgeBase 每秒请求数 每个受支持的区域:4 个 每秒的最大 UpdateAgentKnowledgeBase API请求数。
UpdateDataSource 每秒请求数 每个受支持的区域:2 个 每秒的最大 UpdateDataSource API请求数。
UpdateFlow 每秒请求数 每个受支持的区域:2 个 每秒的最大 UpdateFlow 请求数。
UpdateFlowAlias 每秒请求数 每个受支持的区域:2 个 每秒的最大 UpdateFlowAlias 请求数。
UpdateKnowledgeBase 每秒请求数 每个受支持的区域:2 个 每秒的最大 UpdateKnowledgeBase API请求数。
UpdatePrompt 每秒请求数 每个受支持的区域:2 个 每秒的最大 UpdatePrompt 请求数。
用户查询大小 每个受支持的区域:1000 个 用户查询的最大大小(以字符为单位)。
ValidateFlowDefinition 每秒请求数 每个受支持的区域:2 个 每秒的最大 ValidateFlowDefinition 请求数。
每个护栏的版本 每个受支持的区域:20 个 护栏可以拥有的最大版本数
每个提示的版本 每个受支持的区域:10 个 每个提示的最大版本数。
以字符为单位的单词长度 每个受支持的区域:100 个 屏蔽单词列表中单词的最大长度(以字符为单位)
每字字数政策 每个受支持的区域:1 万个 屏蔽单词列表中可以包含的最大单词数