Amazon Bedrock 的配额 - Amazon Bedrock

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

Amazon Bedrock 的配额

您的 Amazon Bedrock AWS 账户 有默认配额,以前称为限制。要查看 Amazon Bedrock 的服务配额,请按照查看服务配额中的步骤进行操作,然后选择 Amazon Bedrock 作为服务。有些配额因型号而异。除非另有说明,否则配额适用于模型的所有版本。

为了保持服务的性能并确保适当使用 Amazon Bedrock,分配给账户的默认配额可能会根据地区因素、付款历史记录、欺诈性使用情况和/或配额增加请求的批准情况进行更新。

您可以按照以下步骤申请增加账户的配额:

  • 如果在下表的 “通过服务配额调整” 列中将配额标记为 “”,则可以按照《服务配额用户指南》中《服务配额用户指南》中请求增加配额中的步骤进行调整。

  • 如果在下表的 “通过 Service Quotas 可调整” 列中将配额标记为 “”,则可以通过以下方式之一请求增加配额:

    • 要申请增加运行时配额,请联系您的 AWS 账户 经理。如果您没有 AWS 账户 经理,则此时无法增加配额。

    • 要申请其他配额上调,请通过提高限额表提交申请,以考虑增加配额。

    注意

    由于需求过大,将优先考虑那些产生的流量消耗了现有配额分配的客户。如果您不符合此条件,您的请求可能会被拒绝。

选择一个主题以了解有关其默认全局配额的更多信息。除非另有说明,否则所有全球和区域配额均相同。

在您进行模型推理时,以下配额适用。这些配额考虑了 ConverseConverseStreamInvokeModel、和InvokeModelWithResponseStream请求的总和。推理延迟因模型而异,与输入和输出令牌的数量以及当时所有客户的持续按需请求总数成正比。为了保证吞吐量,我们建议您尝试预配置吞吐量。

模型 每分钟处理的请求数 每分钟处理的令牌数 区域 通过 Service Quotas 进行调整
AI21 Labs Jurassic-2 Mid 400 300,000 us-east-1
AI21 Labs Jurassic-2 Ultra 100 300,000 全部
AI21 Jamba-Instruct 100 300,000 全部
Amazon Titan Embeddings G1 - Text 2000 300,000 全部
Amazon Titan Text Embeddings V2 2000 300,000 全部
Amazon Titan Image Generator G1 V1 60 不适用 全部
Amazon Titan Image Generator G1 V2 60 不适用 全部
Amazon Titan Multimodal Embeddings G1 2000 300,000 全部
Amazon Titan Text G1 - Express 400 300,000 全部
Amazon Titan Text G1 - Lite 800 300,000 全部
Amazon Titan Text Premier 100 300,000 全部
Anthropic Claude Instant 1000 1000000

us-east-1

us-west-2

400 300,000 其他地区
AnthropicClaude2.x 500 500,000

us-east-1

us-west-2

100 200,000 其他地区
Anthropic Claude 3 Sonnet 500 1000000

us-east-1

us-west-2

100 200,000 其他地区
Anthropic Claude 3 Haiku 1000 2,000,000

us-east-1

us-west-2

200 200,000

ap-northeast-1

ap-southeast-1

400 300,000 其他地区
Anthropic Claude 3.5 Sonnet 250 2,000,000 us-west-2
20 200,000

ap-northeast-1

ap-southeast-1

eu-central-1

50 400,000 其他地区
Anthropic Claude 3 Opus 50 400,000 全部
Cohere Command R 400 300,000 全部
Cohere Command R+ 400 300,000 全部
Cohere Command 400 300,000 全部
Cohere Command Light 800 300,000 全部
CohereEmbed(英语) 2000 300,000 全部
CohereEmbed(多语言) 2000 300,000 全部
MetaLlama 213B 800 300,000 全部
MetaLlama 270B 400 300,000 全部
Meta Llama 3 8B Instruct 800 300,000 全部
Meta Llama 3 70B Instruct 400 300,000 全部
Meta Llama 3.1 8B Instruct 800 300,000 us-west-2
Meta Llama 3.1 70B Instruct 400 300,000 us-west-2
Meta Llama 3.1 405B Instruct 50 400,000 us-west-2
Mistral AI Mistral 7B Instruct 800 300,000 全部
Mistral AI Mixtral 8X7B Instruct 400 300,000 全部
Mistral AI Mistral Large 400 300,000 全部
Mistral AI Mistral Large 2 (24.07) 400 300,000 us-west-2
Mistral AI Mistral Small 400 300,000 全部
Stable Diffusion XL 60 不适用 全部

下表显示了 Amazon Bedrock 中每秒允许进行不同API操作的最大API请求数:

功能 API操作 每秒最大请求数
不适用 交谈 200
ConverseStream 200
DeleteModelInvocationLoggingConfiguration 1
GetFoundationModel 10
GetModelInvocationLoggingConfiguration 10
InvokeModel 200
InvokeModelWithResponseStream 200
ListFoundationModels 10
ListTagsForResource 20
PutModelInvocationLoggingConfiguration 1
TagResource 20
UntagResource 20
代理 AssociateAgentKnowledgeBase 6
CreateAgent 6
CreateAgentActionGroup 12
CreateAgentAlias 2
DeleteAgent 2
DeleteAgentActionGroup 2
DeleteAgentAlias 2
DeleteAgentVersion 2
DisassociateAgentKnowledgeBase 4
GetAgent 15
GetAgentActionGroup 20
GetAgentAlias 10
GetAgentKnowledgeBase 15
GetAgentVersion 10
ListAgents 10
ListAgentActionGroups 10
ListAgentAliases 10
ListAgentKnowledgeBases 10
ListAgentVersions 10
PrepareAgent 2
UpdateAgent 4
UpdateAgentActionGroup 6
UpdateAgentAlias 2
UpdateAgentKnowledgeBase 4
自定义模型 CreateModelCustomizationJob 1
DeleteCustomModel 10
GetCustomModel 10
GetModelCustomizationJob 10
ListModelCustomizationJobs 10
StopModelCustomizationJob 10
防护机制 CreateGuardrail 1
CreateGuardrailVersion 1
DeleteGuardrail 1
GetGuardrail 10
ListGuardrails 10
UpdateGuardrail 1
知识库 CreateDataSource 2
CreateKnowledgeBase 2
DeleteDataSource 2
DeleteKnowledgeBase 2
GetDataSource 10
GetIngestionJob 10
GetKnowledgeBase 10
ListDataSources 10
ListIngestionJobs 10
ListKnowledgeBases 10
检索 5
RetrieveAndGenerate 5
StartIngestionJob 0.1
UpdateDataSource 2
UpdateKnowledgeBase 2
模型评估 CreateEvaluationJob 5
GetEvaluationJob 10
ListEvaluationJobs 10
StopEvaluationJob 5
预调配吞吐量 CreateProvisionedModelThroughput 1
DeleteProvisionedModelThroughput 1
GetProvisionedModelThroughput 10
ListProvisionedModelThroughputs 10
UpdateProvisionedModelThroughput 1

选择一个选项卡可查看特定型号的提示配额。

Amazon 泰坦 Text models
描述 通过 Service Quotas 进行调整
文本提示长度,以字符为单位 42,000
Amazon 泰坦图像生成器 G1 V1
描述 通过 Service Quotas 进行调整
文本提示长度,以字符为单位 1024
输入图像大小 5MB
以像素为单位的输入图像高度(画内/外绘) 1024
输入图像宽度(以像素为单位)(画内/外绘) 1024
以像素为单位的输入图像高度(图像变化) 4,096
以像素为单位的输入图像宽度(图像变化) 4,096
输入图像的总像素数 12,582,912
Amazon Titan Embeddings G1 - Text
描述 通过 Service Quotas 进行调整
文本输入长度,以字符为单位 50000
Amazon Titan Multimodal Embeddings G1
描述 通过 Service Quotas 进行调整
文本输入长度,以字符为单位 100000
以 Base64 编码的图像字符串,以字符为单位 25,000,000

在您进行批量推理时,以下配额适用。配额取决于输入和输出数据的模式。

模式 最小文件大小 最大文件大小 通过 Service Quotas 进行调整
文本到嵌入 75 MB 500 MB
文本到文本 20 MB 150 MB
文本/图像到图像 1 MB 50 MB

使用护栏时,将强制执行以下配额。

限额 描述
每个账户的护栏 一个账户中护栏的最大数量。 100
每个护栏的版本 护栏可以拥有的最大版本数。 20
每个主题的主题护栏 可以跨护栏主题策略定义的最大主题数。 30
每个主题的示例短语 一个主题中可以包含的最大主题示例数量。 5
敏感信息过滤器中的正则表达式 敏感信息策略中可以包含的护栏过滤器正则表达式的最大数量 10
以字符为单位的正则表达式长度 护栏过滤器正则表达式的最大长度(以字符为单位)。 500
“每字字数” 政策 屏蔽单词列表中可以包含的最大单词数。 10000
以字符为单位的单词长度 屏蔽单词列表中单词的最大长度(以字符为单位)。 100
每秒按需 ApplyGuardrail 请求数 每秒允许的最大 ApplyGuardrail API呼叫数。 25
按需 ApplyGuardrail 拒绝的主题策略文本单位每秒。 “已拒绝” 主题策略每秒可处理的最大文本单元数。 25
按需 ApplyGuardrail 内容筛选策略每秒文本单位数 内容筛选策略每秒可处理的最大文本单元数。 25
按需 ApplyGuardrail 字词过滤策略每秒文本单位数 Word 筛选策略每秒可处理的最大文本单元数。 25
按需 ApplyGuardrail 敏感信息筛选策略文本单位每秒 敏感信息筛选策略每秒可处理的最大文本单元数。 25
注意

一个文本单位最多可包含 1,000 个字符

以下配额适用于 Amazon Bedrock 的知识库。

描述 最高 通过 Service Quotas 进行调整 描述
每个账户的知识库 100 每个账户的最大知识库数量。
每个知识库的数据源 5 每个知识库的最大数据源数量。
数据源区块大小(Titan文本 G1-嵌入) 8192 使用的数据源的最大大小(以 KB 为单位)Titan Embeddings G1 - Text。
数据源区块大小(CohereEmbed英语) 512 使用CohereEmbed英语的数据源的最大大小(以 KB 为单位)。
数据源区块大小(CohereEmbed多语言) 512 使用CohereEmbed多语言的数据源的最大大小(以 KB 为单位)。
数据源每个区块的元数据字段/属性总数。 250 每个区块的文档元数据字段/属性的最大数量。
Web Crawler 的数据源已爬网内容项总数 25000 可以抓取的网页内容项的最大数量(每个内容项最大 50 MB)。
数据源已爬取的文件总数 250 万 可以抓取的数据源文件或内容项目的最大数量(每个文件/内容项最大 50 MB)。
高级解析总数据大小 100 MB 使用高级解析可以解析的数据的最大组合大小(以 MB 为单位)。
高级解析文件总数 100 使用高级解析可以解析的最大文件数。
每个摄取任务要添加或更新的文件 5,000,000 每个摄取任务可以载入的最大新文件和更新文件数。
每个摄取任务要删除的文件 5,000,000 每个摄取任务可以删除的最大文件数。
摄取任务文件大小(源文档) 50 MB 摄取作业中源文档文件的最大大小(以 MB 为单位)。
摄取任务文件大小(元数据文件) 10 KB 摄取任务中元数据文件的最大大小(以 KB 为单位)。
摄取任务规模 100 GB 摄取任务的最大大小(以 GB 为单位)。
每个数据源的并发摄取作业 1 一个数据源可以同时执行的最大摄取任务数。
每个知识库的并发摄取作业 1 知识库可以同时执行的最大摄取作业数。
每个账户的并发摄取任务数 5 一个账户中可以同时执行的最大摄取任务数。
用户查询大小 1000 用户查询的最大大小(以字符为单位)。

以下配额适用于 Amazon Bedrock 的代理。

限额 最高 通过 Service Quotas 进行调整 描述
每个账户的代理数 50 可以 一个账户中代理的最大数量。
每个代理的关联别名 10 您可以与代理关联的最大别名数。
代理说明中的字符 4,000 代理说明中的最大字符数。
每个代理的操作组 20 您可以向代理添加的操作组的最大数量。
已为每个代理启用操作组 11 可以在代理中启用的最大操作组数。
APIs或每个代理的函数 11 您可以APIs向代理添加的最大数量。
每个函数的参数 5 您可以为操作组的函数添加的最大参数数。
Lambda 响应有效负载大小 25 KB 操作组 Lambda 响应中有效负载的最大大小。
每个代理的相关知识库数 2 可以 您可以与代理关联的最大知识库数量。

以下配额适用于提示管理。

限额 最高 通过 Service Quotas 进行调整 描述
每个账户的提示数 50 不可以 在提示管理中,你可以在一个账户中拥有的最大提示数。
每个提示的版本 10 提示管理中提示可以拥有的最大版本数。

以下配额适用于提示流。

限额 最高 通过 Service Quotas 进行调整 描述
每个账户的提示流量 10 一个账户中可以拥有的最大提示流数量。
每个提示流的节点数 20 在提示流中可以拥有的最大节点数。
每个提示流的版本 10 提示流可以拥有的最大版本数。
每个提示流的别名 10 您可以与提示流关联的最大别名数。
每个账户的提示流量 10 一个账户中可以拥有的最大提示流数量。
每个账户的提示流量 10 一个账户中可以拥有的最大提示流数量。
每个提示流的流输入节点 1 您可以添加到提示流的最大流程输入节点数。
每个提示流的流输出节点 5 您可以添加到提示流的最大流程输出节点数。
每个提示流的条件节点 5 您可以添加到提示流的最大条件节点数。
每个提示流的迭代器节点 1 可以添加到提示流中的迭代器节点的最大数量。
每个提示流的收集器节点数 1 可以添加到提示流的最大收集器节点数。
每个提示流的提示节点 5 您可以添加到提示流的最大提示节点数。
每个提示流的 Lambda 节点数 5 您可以添加到提示流的最大 Lambda 节点数。
每个提示流的 Lex 节点数 5 您可以添加到提示流的最大 Lex 节点数。
每个提示流中每种节点类型的节点数 5 在提示流中,您可以为每种类型添加的最大节点数。
每个条件节点的条件 5 在提示流中,您可以向条件节点添加的最大条件数。

以下配额适用于模型自定义。

描述 最高 通过 Service Quotas 进行调整
一个账户中导入的模型的最大数量。 0
计划自定义任务的最大数量。 2
一个账户中自定义模型的最大数量。 100

要查看超参数配额,请参阅自定义模型超参数

选择一个选项卡可查看适用于用于自定义不同基础模型的训练和验证数据集的模型特定配额。

Amazon Titan Text Premier
描述 最大值(继续预训练)不可用 最大值(微调)仅限预览 通过 Service Quotas 进行调整
批次大小为 1 时输入和输出令牌数总和 不适用 4,096
批量大小为 2、3 或 4 时输入和输出令牌的总和 不适用 不适用
数据集中每个样本的字符配额 不适用 令牌配额 x 6
训练和验证记录的总和 不适用 20000
训练数据集文件大小 不适用 1 GB
验证数据集文件大小 不适用 100 MB
Amazon Titan Text G1 - Express
描述 最大值(继续预训练) 最大值(微调) 通过 Service Quotas 进行调整
批次大小为 1 时输入和输出令牌数总和 4,096 4,096
批量大小为 2、3 或 4 时输入和输出令牌的总和 2,048 2,048
数据集中每个样本的字符配额 词元配额 x 6 词元配额 x 6
训练和验证记录的总和 100000 10000
训练数据集文件大小 10 GB 1 GB
验证数据集文件大小 100 MB 100 MB
Amazon Titan Text G1 - Lite
描述 最大值(继续预训练) 最大值(微调) 通过 Service Quotas 进行调整
批量大小为 1 或 2 时输入和输出令牌的总和 4,096 4,096
批量大小为 3、4、5 或 6 时输入和输出令牌的总和 2,048 2,048
数据集中每个样本的字符配额 词元配额 x 6 词元配额 x 6
训练和验证记录的总和 100000 10000
训练数据集文件大小 10 GB 1 GB
验证数据集文件大小 100 MB 100 MB
Amazon 泰坦图像生成器 G1 V1
描述 最小值(微调) 最大值(微调) 通过 Service Quotas 进行调整
训练样本中的文本提示长度,以字符为单位 3 1024
训练数据集中的记录 5 10000
输入图像大小 0 50 MB
输入图像高度(以像素为单位) 512 4,096
输入图像宽度(以像素为单位) 512 4,096
输入图像的总像素数 0 12,582,912
输入图像的纵横比 1:4 4:1
训练和验证记录的总和 不适用 10000
Amazon Titan Multimodal Embeddings G1
描述 最小值(微调) 最大值(微调) 通过 Service Quotas 进行调整
训练样本中的文本提示长度,以字符为单位 0 2,560
训练数据集中的记录 1000 500,000
输入图像大小 0 5MB
输入图像高度(以像素为单位) 128 4096
输入图像宽度(以像素为单位) 128 4096
输入图像的总像素数 0 12,528,912
输入图像的纵横比 1:4 4:1
训练和验证记录的总和 不适用 50000
Cohere 命令
描述 最大值(微调) 通过 Service Quotas 进行调整
输入令牌 4,096
输出令牌 2,048
数据集中每个样本的字符配额 词元配额 x 6
训练数据集中的记录 10000
验证数据集中的记录 1000
Meta Llama 2
描述 最大值(微调) 通过 Service Quotas 进行调整
输入令牌 4,096
输出令牌 2,048
数据集中每个样本的字符配额 词元配额 x 6
训练和验证记录的总和 10000

以下配额适用于预调配吞吐量。

注意

如果通过 Service Quotas 将配额标记为不可调整,则您可以通过提高限额表提交申请,以考虑增加限额。

描述 默认 通过 Service Quotas 进行调整
可以在无承诺预置吞吐量之间分配的模型单元 2
对可按承诺在预配置吞吐量之间分配的单位进行建模 0

以下配额适用于模型评估作业,

作业类型 描述 默认 可调整

自动

您可以在自动模型评估作业中指定的最大数据集数。这包括自定义和内置提示数据集。

5

自动

在自动模型评估作业中,您可以为每个数据集指定的最大指标数。这包括自定义指标和内置指标。

3
人力

在使用人工操作的模型评估作业中,您可以指定的最大自定义指标数量。

10

自动

您可以在自动模型评估作业中指定的最大模型数量。

1
人力

在使用人工操作的模型评估作业中,您可以指定的最大模型数量。

2
自动

在当前区域的此账户中,您一次可以指定的最大自动模型评估任务数量。

20
人力

在当前区域的此账户中,您一次可以指定的使用人类工作者的模型评估作业的最大数量。

10
二者

您可在当前区域的该账户中创建的最大模型评估任务数量。

500
人力

在当前区域的此账户中,您可以在基于人类的模型评估作业中指定的自定义提示数据集的最大数量。

1
二者

自定义提示数据集可以包含的最大提示数。

1000
二者

单个提示的最大大小(以 KB 为单位)是自定义提示数据集。

4 KB
人力

工作人员完成任务的最大时间长度(以天为单位)。

30