Amazon Bedrock 端點和配額 - AWS 一般參考

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

Amazon Bedrock 端點和配額

以下是此服務的服務端點和服務配額。若要以程式設計方式連線至 AWS 服務,您可以使用端點。除了標準 AWS 端點之外,某些 AWS 服務還在所選區域中提供 FIPS 端點。如需詳細資訊,請參閱AWS 服務端點。服務配額也稱為限制,是 AWS 您的帳戶的服務資源或操作數量上限。如需詳細資訊,請參閱AWS 服務配額

服務端點

Amazon Bedrock 控制平面APIs

下表提供 Amazon Bedrock 支援的區域特定端點清單,用於管理、訓練和部署模型。將這些端點用於 Amazon Bedrock API 操作

區域名稱 區域 端點 通訊協定
美國東部 (俄亥俄) us-east-2

bedrock.us-east-2.amazonaws.com

bedrock-fips.us-east-2.amazonaws.com

HTTPS

HTTPS

美國東部 (維吉尼亞北部) us-east-1

bedrock.us-east-1.amazonaws.com

bedrock-fips.us-east-1.amazonaws.com

HTTPS

HTTPS

美國西部 (奧勒岡) us-west-2

bedrock.us-west-2.amazonaws.com

bedrock-fips.us-west-2.amazonaws.com

HTTPS

HTTPS

亞太區域 (孟買) ap-south-1 bedrock.ap-south-1.amazonaws.com HTTPS
亞太區域 (首爾) ap-northeast-2 bedrock.ap-northeast-2.amazonaws.com HTTPS
亞太區域 (新加坡) ap-southeast-1 bedrock.ap-southeast-1.amazonaws.com HTTPS
亞太區域 (悉尼) ap-southeast-2 bedrock.ap-southeast-2.amazonaws.com HTTPS
亞太區域 (東京) ap-northeast-1 bedrock.ap-northeast-1.amazonaws.com HTTPS
加拿大 (中部) ca-central-1

bedrock.ca-central-1.amazonaws.com

bedrock-fips.ca-central-1.amazonaws.com

HTTPS

HTTPS

歐洲 (法蘭克福) eu-central-1 bedrock.eu-central-1.amazonaws.com HTTPS
歐洲 (愛爾蘭) eu-west-1 bedrock.eu-west-1.amazonaws.com HTTPS
歐洲 (倫敦) eu-west-2 bedrock.eu-west-2.amazonaws.com HTTPS
歐洲 (巴黎) eu-west-3 bedrock.eu-west-3.amazonaws.com HTTPS
歐洲 (蘇黎世) eu-central-2 bedrock.eu-central-2.amazonaws.com HTTPS
南美洲 (聖保羅) sa-east-1 bedrock.sa-east-1.amazonaws.com HTTPS
AWS GovCloud (美國東部) us-gov-east-1

bedrock.us-gov-east-1.amazonaws.com

bedrock-fips.us-gov-east-1.amazonaws.com

HTTPS

HTTPS

AWS GovCloud (美國西部) us-gov-west-1

bedrock.us-gov-west-1.amazonaws.com

bedrock-fips.us-gov-west-1.amazonaws.com

HTTPS

HTTPS

Amazon Bedrock 執行期 APIs

下表提供 Amazon Bedrock 支援的區域特定端點清單,以針對 Amazon Bedrock 中託管的模型提出推論請求。將這些端點用於 Amazon Bedrock Runtime API 操作

區域名稱 區域 端點 通訊協定
美國東部 (俄亥俄) us-east-2

bedrock-runtime.us-east-2.amazonaws.com

bedrock-runtime-fips.us-east-2.amazonaws.com

HTTPS

HTTPS

美國東部 (維吉尼亞北部) us-east-1

bedrock-runtime.us-east-1.amazonaws.com

bedrock-runtime-fips.us-east-1.amazonaws.com

HTTPS

HTTPS

美國西部 (奧勒岡) us-west-2

bedrock-runtime.us-west-2.amazonaws.com

bedrock-runtime-fips.us-west-2.amazonaws.com

HTTPS

HTTPS

亞太區域 (孟買) ap-south-1 bedrock-runtime.ap-south-1.amazonaws.com HTTPS
亞太區域 (首爾) ap-northeast-2 bedrock-runtime.ap-northeast-2.amazonaws.com HTTPS
亞太區域 (新加坡) ap-southeast-1 bedrock-runtime.ap-southeast-1.amazonaws.com HTTPS
亞太區域 (悉尼) ap-southeast-2 bedrock-runtime.ap-southeast-2.amazonaws.com HTTPS
亞太區域 (東京) ap-northeast-1 bedrock-runtime.ap-northeast-1.amazonaws.com HTTPS
加拿大 (中部) ca-central-1

bedrock-runtime.ca-central-1.amazonaws.com

bedrock-runtime-fips.ca-central-1.amazonaws.com

HTTPS

HTTPS

歐洲 (法蘭克福) eu-central-1 bedrock-runtime.eu-central-1.amazonaws.com HTTPS
歐洲 (愛爾蘭) eu-west-1 bedrock-runtime.eu-west-1.amazonaws.com HTTPS
歐洲 (倫敦) eu-west-2 bedrock-runtime.eu-west-2.amazonaws.com HTTPS
歐洲 (巴黎) eu-west-3 bedrock-runtime.eu-west-3.amazonaws.com HTTPS
歐洲 (蘇黎世) eu-central-2 bedrock-runtime.eu-central-2.amazonaws.com HTTPS
南美洲 (聖保羅) sa-east-1 bedrock-runtime.sa-east-1.amazonaws.com HTTPS
AWS GovCloud (美國東部) us-gov-east-1

bedrock-runtime.us-gov-east-1.amazonaws.com

bedrock-runtime-fips.us-gov-east-1.amazonaws.com

HTTPS

HTTPS

AWS GovCloud (美國西部) us-gov-west-1

bedrock-runtime.us-gov-west-1.amazonaws.com

bedrock-runtime-fips.us-gov-west-1.amazonaws.com

HTTPS

HTTPS

Amazon Bedrock 建置時間 APIs 的代理程式

下表提供 Amazon Bedrock 代理程式支援的區域特定端點清單,用於建立和管理代理程式和知識庫。將這些端點用於 Amazon Bedrock API 操作的代理程式。

區域名稱 區域 端點 通訊協定
美國東部 (維吉尼亞北部) us-east-1 bedrock-agent.us-east-1.amazonaws.com HTTPS
bedrock-agent-fips.us-east-1.amazonaws.com HTTPS
美國西部 (奧勒岡) us-west-2 bedrock-agent.us-west-2.amazonaws.com HTTPS
bedrock-agent-fips.us-west-2.amazonaws.com HTTPS
亞太區域 (新加坡) ap-southeast-1 bedrock-agent.ap-southeast-1.amazonaws.com HTTPS
亞太區域 (悉尼) ap-southeast-2 bedrock-agent.ap-southeast-2.amazonaws.com HTTPS
亞太區域 (東京) ap-northeast-1 bedrock-agent.ap-northeast-1.amazonaws.com HTTPS
加拿大 (中部) ca-central-1 bedrock-agent.ca-central-1.amazonaws.com HTTPS
歐洲 (法蘭克福) eu-central-1 bedrock-agent.eu-central-1.amazonaws.com HTTPS
歐洲 (愛爾蘭) eu-west-1 bedrock-agent.eu-west-1.amazonaws.com HTTPS
歐洲 (倫敦) eu-west-2 bedrock-agent.eu-west-2.amazonaws.com HTTPS
歐洲 (巴黎) eu-west-3 bedrock-agent.eu-west-3.amazonaws.com HTTPS
亞太區域 (孟買) ap-south-1 bedrock-agent.ap-south-1.amazonaws.com HTTPS
南美洲 (聖保羅) sa-east-1 bedrock-agent.sa-east-1.amazonaws.com HTTPS

Amazon Bedrock 執行期 APIs 的代理程式

下表提供 Amazon Bedrock 的代理程式用於調用代理程式和查詢知識庫所支援的區域特定端點清單。將這些端點用於 Amazon Bedrock 執行期 API 操作的代理程式。

區域名稱 區域 端點 通訊協定
美國東部 (維吉尼亞北部) us-east-1 bedrock-agent-runtime.us-east-1.amazonaws.com HTTPS
bedrock-agent-runtime-fips.us-east-1.amazonaws.com HTTPS
美國西部 (奧勒岡) us-west-2 bedrock-agent-runtime.us-west-2.amazonaws.com HTTPS
bedrock-agent-runtime-fips.us-west-2.amazonaws.com HTTPS
亞太區域 (新加坡) ap-southeast-1 bedrock-agent-runtime.ap-southeast-1.amazonaws.com HTTPS
亞太區域 (悉尼) ap-southeast-2 bedrock-agent-runtime.ap-southeast-2.amazonaws.com HTTPS
亞太區域 (東京) ap-northeast-1 bedrock-agent-runtime.ap-northeast-1.amazonaws.com HTTPS
加拿大 (中部) ca-central-1 bedrock-agent-runtime.ca-central-1.amazonaws.com HTTPS
歐洲 (法蘭克福) eu-central-1 bedrock-agent-runtime.eu-central-1.amazonaws.com HTTPS
歐洲 (巴黎) eu-west-3 bedrock-agent-runtime.eu-west-3.amazonaws.com HTTPS
歐洲 (愛爾蘭) eu-west-1 bedrock-agent-runtime.eu-west-1.amazonaws.com HTTPS
歐洲 (倫敦) eu-west-2 bedrock-agent-runtime.eu-west-2.amazonaws.com HTTPS
亞太區域 (孟買) ap-south-1 bedrock-agent-runtime.ap-south-1.amazonaws.com HTTPS
南美洲 (聖保羅) sa-east-1 bedrock-agent-runtime.sa-east-1.amazonaws.com HTTPS

Service Quotas

如需如何請求增加配額的指示,兩者的可調整值都標示為,以及標示為的配額,請參閱請求增加 Amazon Bedrock 配額。下表顯示 Amazon Bedrock 的配額清單:

名稱 預設 可調整 描述
每個客服人員的APIs 每個支援的區域:11 您可以新增至客服人員的 APIs 數目上限。
每個代理程式的動作群組 每個受支援的區域:20 您可以新增至客服人員的動作群組數目上限。
每個流程的代理節點 每個受支援的區域:10 代理程式節點的數量上限。
每個帳戶的代理程式

ca-central-1:200

eu-central-1:200

每個其他支援的 區域:50 個

一個帳戶中的客服人員數量上限。
每秒的AssociateAgentKnowledgeBase 請求數 每個受支援的區域:6 每秒 AssociateAgentKnowledgeBase API 請求數目上限。
每個客服人員的關聯別名 每個受支援的區域:10 您可以與客服人員建立關聯的別名數目上限。
每個代理程式的關聯知識庫 每個支援的區域:2 您可以與客服人員建立關聯的知識庫數目上限。
批次推論輸入檔案大小 每個支援的區域:1,073,741,824 提交進行批次推論的單一檔案大小上限 (以位元組為單位)。
批次推論任務大小 每個支援的區域:5,368,709,120 批次推論任務中包含的所有輸入檔案 (以位元組為單位) 的最大累積大小。
代理程式指示中的字元數 每個支援的區域:8,000 客服人員指示中的字元數上限。
每個流程的收集器節點 每個受支援的區域:1 收集器節點的數量上限。
每個帳戶的並行擷取任務 每個受支援的區域:5 可在帳戶中同時執行的最大擷取任務數目。
每個資料來源的並行擷取任務 每個受支援的區域:1 可同時為資料來源執行的擷取任務數量上限。
每個知識庫的並行擷取任務 每個受支援的區域:1 知識庫可同時執行的最大擷取任務數量。
並行模型匯入任務 每個受支援的區域:1 同時進行中的模型匯入任務數量上限。
每個流程的條件節點 每個受支援的區域:5 條件節點的數量上限。
每個條件節點的條件 每個受支援的區域:5 每個條件節點的條件數目上限。
文字單位的文字接地查詢長度 每個受支援的區域:1 內容接地查詢的長度上限,以文字單位表示
文字單位的文字接地回應長度 每個受支援的區域:5 內容接地回應的長度上限,以文字單位表示
文字單位的文字接地來源長度

us-east-1:100

us-west-2:100

每個其他支援的 區域:50 個

用於內容接地之接地來源的文字單位長度上限
每秒的CreateAgent 請求數 每個受支援的區域:6 每秒 CreateAgent API 請求數目上限。
每秒的CreateAgentActionGroup 請求數 每個支援的區域:12 每秒 CreateAgentActionGroup API 請求數目上限。
每秒的CreateAgentAlias 請求數 每個支援的區域:2 每秒 CreateAgentAlias API 請求數目上限。
每秒的CreateDataSource 請求數 每個支援的區域:2 每秒 CreateDataSource API 請求數目上限。
每秒的CreateFlow 請求數 每個支援的區域:2 每秒的 CreateFlow 請求數目上限。
每秒的CreateFlowAlias 請求數 每個支援的區域:2 每秒的 CreateFlowAlias 請求數目上限。
每秒的CreateFlowVersion 請求數 每個支援的區域:2 每秒的 CreateFlowVersion 請求數目上限。
每秒的CreateKnowledgeBase 請求數 每個支援的區域:2 每秒 CreateKnowledgeBase API 請求數目上限。
每秒的CreatePrompt 請求數 每個支援的區域:2 每秒的 CreatePrompt 請求數目上限。
每秒的CreatePromptVersion 請求數 每個支援的區域:2 每秒的 CreatePromptVersion 請求數目上限。
Anthropic Claude 3.5 Haiku 的每分鐘跨區域 InvokeModel 請求 每個受支援的區域:2,000 您可以在一分鐘內呼叫 InvokeModel 和 InvokeModelWithResponseStream 的次數上限。配額會考量 Anthropic Claude 3.5 Haiku 的 InvokeModel 和 InvokeModelWithResponseStream 權杖總和。
Anthropic Claude 3.5 Haiku 的每分鐘跨區域 InvokeModel 權杖 每個支援的區域:4,000,000 您可以在一分鐘內透過 InvokeModel 和 InvokeModelWithResponseStream 提供的字符數量上限。配額會考量 Anthropic Claude 3.5 Haiku 的 InvokeModel 和 InvokeModelWithResponseStream 權杖總和。
每個帳戶的自訂模型數 每個受支援的區域:100 帳戶中的自訂模型數量上限。
每個知識庫的資料來源 每個受支援的區域:5 每個知識庫的資料來源數量上限。
每秒的DeleteAgent 請求數 每個支援的區域:2 每秒 DeleteAgent API 請求數目上限。
每秒的DeleteAgentActionGroup 請求數 每個支援的區域:2 每秒 DeleteAgentActionGroup API 請求數目上限。
每秒的DeleteAgentAlias 請求數 每個支援的區域:2 每秒 DeleteAgentAlias API 請求數目上限。
每秒的DeleteAgentVersion 請求數 每個支援的區域:2 每秒 DeleteAgentVersion API 請求數目上限。
每秒的DeleteDataSource 請求數 每個支援的區域:2 每秒 DeleteDataSource API 請求數目上限。
每秒的DeleteFlow 請求數 每個支援的區域:2 每秒的 DeleteFlow 請求數目上限。
每秒的DeleteFlowAlias 請求數 每個支援的區域:2 每秒的 DeleteFlowAlias 請求數目上限。
每秒的DeleteFlowVersion 請求數 每個支援的區域:2 每秒的 DeleteFlowVersion 請求數目上限。
每秒的DeleteKnowledgeBase 請求數 每個支援的區域:2 每秒 DeleteKnowledgeBase API 請求數目上限。
每秒的DeletePrompt 請求數 每個支援的區域:2 每秒的 DeletePrompt 請求數目上限。
每秒的DisassociateAgentKnowledgeBase 請求數 每個受支援的區域:4 每秒 DisassociateAgentKnowledgeBase API 請求數目上限。
每個代理程式已啟用的動作群組 每個支援的區域:11 您可以在客服人員中啟用的動作群組數目上限。
每個推論設定檔的端點 每個受支援的區域:5 推論設定檔中的端點數量上限。端點是由模型和向模型傳送調用請求的區域所定義。
每個主題的範例片語 每個受支援的區域:5 每個主題可以包含的主題範例數量上限
每個擷取任務要新增或更新的檔案 每個支援的區域:5,000,000 每個擷取任務可以擷取的新增和更新檔案數量上限。
每個擷取任務要刪除的檔案 每個支援的區域:5,000,000 每個擷取任務可刪除的檔案數目上限。
每個流程的流程別名 每個受支援的區域:10 流程別名的數量上限。
每個流程的流程版本 每個受支援的區域:10 流程版本的數量上限。
每個帳戶的流程 每個受支援的區域:100 每個帳戶的流程數目上限。
每秒的GetAgent 請求數 每個受支援的區域:15 每秒 GetAgent API 請求數目上限。
每秒的GetAgentActionGroup 請求數 每個受支援的區域:20 每秒 GetAgentActionGroup API 請求數目上限。
每秒的GetAgentAlias 請求數 每個受支援的區域:10 每秒 GetAgentAlias API 請求數目上限。
每秒的GetAgentKnowledgeBase 請求數 每個受支援的區域:15 每秒 GetAgentKnowledgeBase API 請求數目上限。
每秒的GetAgentVersion 請求數 每個受支援的區域:10 每秒 GetAgentVersion API 請求數目上限。
每秒的GetDataSource 請求數 每個受支援的區域:10 每秒 GetDataSource API 請求數目上限。
每秒的GetFlow 請求數 每個受支援的區域:10 每秒的 GetFlow 請求數目上限。
每秒的GetFlowAlias 請求數 每個受支援的區域:10 每秒的 GetFlowAlias 請求數目上限。
每秒的GetFlowVersion 請求數 每個受支援的區域:10 每秒的 GetFlowVersion 請求數目上限。
每秒的GetIngestionJob 請求數 每個受支援的區域:10 每秒 GetIngestionJob API 請求數目上限。
每秒的GetKnowledgeBase 請求數 每個受支援的區域:10 每秒 GetKnowledgeBase API 請求數目上限。
每秒的GetPrompt 請求數 每個受支援的區域:10 每秒的 GetPrompt 請求數目上限。
每個帳戶的護欄 每個受支援的區域:100 帳戶中的防護機制數目上限
每個帳戶的匯入模型 每個支援的區域:3 帳戶中匯入模型的數量上限。
每個帳戶的推論設定檔 每個受支援的區域:1,000 帳戶中推論設定檔的數量上限。
擷取任務檔案大小 每個受支援的區域:50 擷取任務中檔案的大小上限 (MB)。
擷取任務大小 每個受支援的區域:100 擷取任務的大小上限 (以 GB 為單位)。
每個流程的輸入節點 每個受支援的區域:1 流程輸入節點的數量上限。
每個流程的迭代器節點 每個受支援的區域:1 迭代器節點的數量上限。
每個流程的知識庫節點 每個受支援的區域:10 知識庫節點的數量上限。
每個帳戶的知識庫 每個受支援的區域:100 每個帳戶的知識庫數目上限。
每個流程的 Lambda 函數節點 每個受支援的區域:10 Lambda 函數節點的數量上限。
每個流程的 Lex 節點數 每個受支援的區域:5 Lex 節點的數量上限。
每秒的ListAgentActionGroups 請求數 每個受支援的區域:10 每秒 ListAgentActionGroups API 請求數目上限。
每秒的ListAgentAliases 請求數 每個受支援的區域:10 每秒 ListAgentAliases API 請求數目上限。
每秒的ListAgentKnowledgeBases 請求數 每個受支援的區域:10 每秒 ListAgentKnowledgeBases API 請求數目上限。
每秒的ListAgentVersions 請求數 每個受支援的區域:10 每秒 ListAgentVersions API 請求數目上限。
每秒的ListAgents 請求數 每個受支援的區域:10 每秒 ListAgents API 請求數目上限。
每秒的ListDataSources 請求數 每個受支援的區域:10 每秒 ListDataSources API 請求數目上限。
每秒的ListFlowAliases 請求數 每個受支援的區域:10 每秒的 ListFlowAliases 請求數目上限。
每秒的ListFlowVersions 請求數 每個受支援的區域:10 每秒的 ListFlowVersions 請求數目上限。
每秒的ListFlows 請求數 每個受支援的區域:10 每秒的 ListFlows 請求數目上限。
每秒的ListIngestionJobs 請求數 每個受支援的區域:10 每秒 ListIngestionJobs API 請求數目上限。
每秒的ListKnowledgeBases 請求數 每個受支援的區域:10 每秒 ListKnowledgeBases API 請求數目上限。
每秒的ListPrompts 請求數 每個受支援的區域:10 每秒的 ListPrompts 請求數目上限。
基礎模型之間的模型單位無承諾佈建輸送量 每個支援的區域:2 可以分散到基本模型無承諾佈建輸送量的模型單位數量上限
跨自訂模型的模型單位無承諾佈建輸送量 每個支援的區域:2 可在自訂模型的無承諾佈建輸送量中分佈的模型單位數量上限
AI21 Labs Jurassic-2 Mid 每個佈建模型的模型單位 每個支援的區域:0 可配置給 AI21 Labs Jurassic-2 Mid 佈建模型的模型單位數量上限。
AI21 Labs Jurassic-2 Ultra 每個佈建模型的模型單位 每個支援的區域:0 可配置給 AI21 Labs Jurassic-2 Ultra 佈建模型的模型單位數量上限。
Amazon Titan 內嵌 G1 每個佈建模型的模型單位 - 文字 每個支援的區域:0 可配置給 Amazon Titan Embeddings G1 - Text 佈建模型的模型單位數目上限。
Amazon Titan Image Generator G1 每個佈建模型的模型單位 每個支援的區域:0 可配置給 Amazon Titan Image Generator G1 佈建模型的模型單位數量上限。
Amazon Titan Image Generator G2 每個佈建模型的模型單位 每個支援的區域:0 可配置給 Amazon Titan Image Generator G2 佈建模型的模型單位數量上限。
Amazon Titan Lite V1 4K 每個佈建模型的模型單位 每個支援的區域:0 可配置給 Amazon Titan Text Lite V1 4K 佈建模型的模型單位數量上限。
Amazon Titan 多模型內嵌 G1 每個佈建模型的模型單位 每個支援的區域:0 可配置給 Amazon Titan Multimodal Embeddings G1 佈建模型的模型單位數量上限。
Amazon Titan Text Embeddings V2 每個佈建模型的模型單位 每個支援的區域:0 可配置給 Amazon Titan Text Embeddings V2 佈建模型的模型單位數量上限。
Amazon Titan Text G1 - Express 8K 每個佈建模型的模型單位 每個支援的區域:0 可配置給 Amazon Titan Text G1 - Express 8K 佈建模型的模型單位數量上限。
Amazon Titan Text Premier V1 32K 每個佈建模型的模型單位 每個支援的區域:0 可配置給 Amazon Titan Text Premier V1 32K 佈建模型的模型單位數量上限。
Anthropic Claude 3 Haiku 200K 每個佈建模型的模型單位 每個支援的區域:0 可配置給 Anthropic Claude 3 Haiku 200K 佈建模型的模型單位數量上限。
Anthropic Claude 3 Haiku 48K 每個佈建模型的模型單位 每個支援的區域:0 可配置給 Anthropic Claude 3 Haiku 48K 佈建模型的模型單位數量上限。
Anthropic Claude 3 Sonnet 200K 每個佈建模型的模型單位 每個支援的區域:0 可配置給 Anthropic Claude 3 Sonnet 200K 佈建模型的模型單位數量上限。
Anthropic Claude 3 Sonnet 28K 每個佈建模型的模型單位 每個支援的區域:0 可配置給 Anthropic Claude 3 Sonnet 28K 佈建模型的模型單位數量上限。
Anthropic Claude 3.5 Sonnet 18K 每個佈建模型的模型單位 每個支援的區域:0 可配置給 Anthropic Claude 3.5 Sonnet 18K 佈建模型的模型單位數量上限。
Anthropic Claude 3.5 Sonnet 200K 每個佈建模型的模型單位 每個支援的區域:0 可配置給 Anthropic Claude 3.5 Sonnet 200K 佈建模型的模型單位數量上限。
Anthropic Claude 3.5 Sonnet 51K 每個佈建模型的模型單位 每個支援的區域:0 可配置給 Anthropic Claude 3.5 Sonnet 51K 佈建模型的模型單位數量上限。
Anthropic Claude Instant V1 100K 每個佈建模型的模型單位 每個支援的區域:0 可配置給 Anthropic Claude Instant V1 100K 佈建模型的模型單位數量上限。
Anthropic Claude V2 100K 每個佈建模型的模型單位 每個支援的區域:0 可配置給 Anthropic Claude V2 100K 佈建模型的模型單位數量上限。
Anthropic Claude V2 18K 每個佈建模型的模型單位 每個支援的區域:0 可配置給 Anthropic Claude V2 18K 佈建模型的模型單位數量上限。
Anthropic Claude V2.1 18K 每個佈建模型的模型單位 每個支援的區域:0 可配置給 Anthropic Claude V2.1 18K 佈建模型的模型單位數量上限。
Anthropic Claude V2.1 200K 每個佈建模型的模型單位 每個支援的區域:0 可配置給 Anthropic Claude V2.1 200k 佈建模型的模型單位數量上限。
Cohere Command 每個佈建模型的模型單位 每個支援的區域:0 可配置給 Cohere Command 佈建模型的模型單位數量上限。
Cohere Command Light 每個佈建模型的模型單位 每個支援的區域:0 可配置給 Cohere Command Light 佈建模型的模型單位數量上限。
Cohere Command R 每個佈建模型的模型單位 每個支援的區域:0 可配置給 Cohere Command R 128k 佈建模型的模型單位數量上限。
Cohere Command R Plus 每個佈建模型的模型單位 每個支援的區域:0 可配置給 Cohere Command R Plus 128k 佈建模型的模型單位數目上限。
Cohere Embed English 每個佈建模型的模型單位 每個支援的區域:0 可配置給 Cohere Embed English 佈建模型的模型單位數量上限。
Cohere Embed Multiling 每個佈建模型的模型單位 每個支援的區域:0 可配置給 Cohere Embed Multilingual 佈建模型的模型單位數量上限。
Meta Llama 2 13B 每個佈建模型的模型單位 每個支援的區域:0 可配置給 Meta Llama 2 13B 佈建模型的模型單位數量上限。
Meta Llama 2 70B 每個佈建模型的模型單位 每個支援的區域:0 可配置給 Meta Llama 2 70B 佈建模型的模型單位數量上限。
Meta Llama 2 Chat 13B 每個佈建模型的模型單位 每個支援的區域:0 可配置給 Meta Llama 2 Chat 13B 佈建模型的模型單位數量上限。
Meta Llama 2 Chat 70B 每個佈建模型的模型單位 每個支援的區域:0 可配置給 Meta Llama 2 Chat 70B 佈建模型的模型單位數量上限。
Meta Llama 3 70B Instruct 每個佈建模型的模型單位 每個支援的區域:0 可配置給 Meta Llama 3 70B Instruct 佈建模型的模型單位數量上限。
Meta Llama 3 8B Instruct 每個佈建模型的模型單位 每個支援的區域:0 可配置給 Meta Llama 3 8B Instruct 佈建模型的模型單位數量上限。
Meta Llama 3.1 70B Instruct 每個佈建模型的模型單位 每個支援的區域:0 可配置給 Meta Llama 3.1 70B Instruct 佈建模型的模型單位數量上限。
Meta Llama 3.1 8B Instruct 每個佈建模型的模型單位 每個支援的區域:0 可配置給 Meta Llama 3.1 8B Instruct 佈建模型的模型單位數量上限。
Meta Llama 3.2 1B Instruct 每個佈建模型的模型單位 每個支援的區域:0 可配置給 Meta Llama 3.2 1B Instruct 佈建模型的模型單位數量上限。
Meta Llama 3.2 3B Instruct 每個佈建模型的模型單位 每個支援的區域:0 可配置給 Meta Llama 3.2 3B Instruct 佈建模型的模型單位數量上限。
Mistral Large 2407 每個佈建模型的模型單位 每個支援的區域:0 可配置給 Mistral Large 2407 佈建模型的模型單位數量上限。
Mistral Small 每個佈建模型的模型單位 每個支援的區域:0 可配置給 Mistral Small 佈建模型的模型單位數量上限。
適用於 Stability.ai Stable Diffusion XL 0.8 的每個佈建模型的模型單位 每個支援的區域:0 可配置給 Stability.ai Stable Diffusion XL 0.8 佈建模型的模型單位數量上限
適用於 Stability.ai Stable Diffusion XL 1.0 的每個佈建模型的模型單位 每個支援的區域:0 可配置給 Stability.ai Stable Diffusion XL 1.0 佈建模型的模型單位數量上限。
並行自動模型評估任務的數量 每個受支援的區域:20 您可以在目前區域中的此帳戶中一次指定的自動模型評估任務數量上限。
使用人力工作者的並行模型評估任務數目 每個受支援的區域:10 您可以在目前區域中的此帳戶中一次指定使用人力工作者的模型評估任務數目上限。
自訂指標的數量 每個受支援的區域:10 您可以在使用人工的模型評估任務中指定的自訂指標數量上限。
人工模型評估任務中的自訂提示資料集數量 每個受支援的區域:1 您可以在目前區域中此帳戶中的以人為基礎的模型評估任務中指定的自訂提示資料集數目上限。
每個任務的資料集數目 每個受支援的區域:5 您可以在自動化模型評估任務中指定的資料集數量上限。這包括自訂和內建提示資料集。
評估任務數目 每個受支援的區域:5,000 您可以在目前區域中在此帳戶中建立的模型評估任務數目上限。
每個資料集的指標數量 每個支援的區域:3 您可以在自動化模型評估任務中為每個資料集指定的指標數量上限。這包括自訂和內建指標。
使用人類工作者的模型評估任務中的模型數量 每個支援的區域:2 您可以在使用人工的模型評估任務中指定的模型數量上限。
自動化模型評估任務中的模型數量 每個受支援的區域:1 您可以在自動化模型評估任務中指定的模型數量上限。
自訂提示資料集中的提示數目 每個支援的區域:1,000 自訂提示資料集可以包含的提示數目上限。
每秒隨需 ApplyGuardrail 內容篩選政策文字單位 每個受支援的區域:25 每秒可為內容篩選政策處理的最大文字單位數
每秒隨需 ApplyGuardrail 拒絕主題政策文字單位 每個受支援的區域:25 每秒可針對被拒絕的主題政策處理的最大文字單位數
每秒隨需 ApplyGuardrail 敏感資訊篩選條件政策文字單位 每個受支援的區域:25 每秒可針對敏感資訊篩選條件政策處理的文字單位數目上限
每秒隨需 ApplyGuardrail Word 篩選條件政策文字單位 每個受支援的區域:25 每秒可針對 Word 篩選條件政策處理的文字單位數目上限。
每秒隨需 ApplyGuardrail 內容接地政策文字單位

us-east-1:106

us-west-2:106

每個其他支援的 區域:53

每秒可為內容接地政策處理的文字單位數目上限
每秒隨需 ApplyGuardrail 請求 每個受支援的區域:25 每秒允許的 ApplyGuardrail API Word呼叫數目上限
InvokeModel Labs Jamba 1.5 Large 的每分鐘隨需 AI21 請求 每個受支援的區域:100 AI21 Labs Jamba 1.5 Large 在一分鐘內可以呼叫模型推論的次數上限。配額會考慮 Converse 和 InvokeModel 的請求總和
InvokeModel Labs Jamba 1.5 Mini 的每分鐘隨需 AI21 請求 每個受支援的區域:100 AI21 Labs Jamba 1.5 Mini 在一分鐘內可以呼叫模型推論的次數上限。配額會考慮 Converse 和 InvokeModel 的請求總和
InvokeModel Labs Jamba Instruct 的每分鐘隨需 AI21 請求 每個受支援的區域:100 AI21 Labs Jamba Instruct 在一分鐘內可以呼叫模型推論的次數上限。配額會考慮 Converse 和 InvokeModel 的請求總和
InvokeModel Labs Jurassic-2 Mid 的每分鐘隨需 AI21 請求 每個支援的區域:400 您可以在一分鐘內呼叫 InvokeModel 和 InvokeModelWithResponseStream 的次數上限。配額會考量 InvokeModel Labs Jurassic-2 Mid 的 Word 和 AI21 InvokeModelWithResponseStream 請求的合併總和
InvokeModel Labs Jurassic-2 Ultra 的每分鐘隨需 AI21 請求 每個受支援的區域:100 您可以在一分鐘內呼叫 InvokeModel 和 InvokeModelWithResponseStream 的次數上限。配額會考慮 InvokeModel Labs Jurassic-2 Ultra 的 Word 和 AI21 InvokeModelWithResponseStream 請求的合併總和
Amazon Titan Image Generator G1 的每分鐘隨需 InvokeModel 請求 每個支援的區域:60 Amazon Titan Image Generator G1 在一分鐘內可以呼叫 InvokeModel 的次數上限。
Amazon Titan Image Generator G1 V2 的每分鐘隨需 InvokeModel 請求 每個支援的區域:60 Amazon Titan Image Generator G V2 在一分鐘內可以呼叫 InvokeModel 的次數上限。
Amazon Titan 多模式內嵌 G1 的每分鐘隨需 InvokeModel 請求 每個受支援的區域:2,000 對於 Amazon Titan 多模式內嵌 G1,一分鐘內您可以呼叫 InvokeModel 的次數上限。
Amazon Titan 文字內嵌的每分鐘隨需 InvokeModel 請求 每個受支援的區域:2,000 Amazon Titan Text Embeddings 在一分鐘內可以呼叫 InvokeModel 的次數上限
Amazon Titan Text Embeddings V2 的每分鐘隨需 InvokeModel 請求 每個受支援的區域:2,000 Amazon Titan Text Embeddings V2 一分鐘內可以呼叫 InvokeModel 的次數上限
Amazon Titan Text Express 的每分鐘隨需 InvokeModel 請求 每個支援的區域:400 您可以在一分鐘內呼叫 InvokeModel 和 InvokeModelWithResponseStream 的次數上限。配額會考慮 Amazon Titan Text Express 的 InvokeModel 和 InvokeModelWithResponseStream 請求的合併總和
Amazon Titan Text Lite 的每分鐘隨需 InvokeModel 請求 每個支援的區域:800 您可以在一分鐘內呼叫 InvokeModel 和 InvokeModelWithResponseStream 的次數上限。配額會考慮 Amazon Titan Text Lite 的 InvokeModel 和 InvokeModelWithResponseStream 請求的合併總和
Amazon Titan Text Premier 的每分鐘隨需 InvokeModel 請求 每個受支援的區域:100 您可以在一分鐘內呼叫 InvokeModel 和 InvokeModelWithResponseStream 的次數上限。配額會考慮 Amazon Titan Text Premier 的 InvokeModel 和 InvokeModelWithResponseStream 請求的合併總和
Anthropic Claude 3 Haiku 的每分鐘隨需 InvokeModel 請求

us-east-1:1,000

us-west-2:1,000

ap-northeast-1:200

ap-southeast-1:200

每個其他支援的 區域:400

您可以在一分鐘內呼叫 InvokeModel 和 InvokeModelWithResponseStream 的次數上限。配額會考量 Anthropic Claude 3 Haiku 的 InvokeModel 和 InvokeModelWithResponseStream 權杖總和。
Anthropic Claude 3 Opus 的每分鐘隨需 InvokeModel 請求 每個受支援的區域:50 您可以在一分鐘內呼叫 InvokeModel 和 InvokeModelWithResponseStream 的次數上限。配額會考慮 Anthropic Claude 3 Opus 的 InvokeModel 和 InvokeModelWithResponseStream 請求總和。
Anthropic Claude 3 Sonnet 的每分鐘隨需 InvokeModel 請求

us-east-1:500

us-west-2:500

每個其他支援的 區域:100

您可以在一分鐘內呼叫 InvokeModel 和 InvokeModelWithResponseStream 的次數上限。配額會考慮 Anthropic Claude 3 Sonnet 的 InvokeModel 和 InvokeModelWithResponseStream 請求的合併總和。
Anthropic Claude 3.5 Haiku 的每分鐘隨需 InvokeModel 請求 每個支援的區域:1,000 您可以在一分鐘內呼叫 InvokeModel 和 InvokeModelWithResponseStream 的次數上限。配額會考量 Anthropic Claude 3.5 Haiku 的 InvokeModel 和 InvokeModelWithResponseStream 權杖總和。
Anthropic Claude 3.5 Sonnet 的每分鐘隨需 InvokeModel 請求

us-east-1:50

us-east-2:50

us-west-2:250

ap-northeast-2:50

ap-south-1:50

ap-southeast-2:50

每個其他支援的 區域:20

Anthropic Claude 3.5 Sonnet 在一分鐘內可以呼叫模型推論的次數上限。配額會考慮 Converse、 ConverseStream、 InvokeModel 和 InvokeModelWithResponseStream 的合併總和。
Anthropic Claude 3.5 Sonnet V2 的每分鐘隨需 InvokeModel 請求

us-west-2:250

每個其他支援的 區域:50 個

Anthropic Claude 3.5 Sonnet V2 在一分鐘內可以呼叫模型推論的次數上限。配額會考慮 Converse、 ConverseStream、 InvokeModel 和 InvokeModelWithResponseStream 的合併總和。
Anthropic Claude Instant 的每分鐘隨需 InvokeModel 請求

us-east-1:1,000

us-west-2:1,000

每個其他支援的 區域:400

您可以在一分鐘內呼叫 InvokeModel 和 InvokeModelWithResponseStream 的次數上限。配額會考慮 Anthropic Claude Instant 的 InvokeModel 和 InvokeModelWithResponseStream 請求的合併總和
Anthropic Claude V2 的每分鐘隨需 InvokeModel 請求

us-east-1:500

us-west-2:500

每個其他支援的 區域:100

您可以在一分鐘內呼叫 InvokeModel 和 InvokeModelWithResponseStream 的次數上限。配額會考慮 Anthropic Claude V2 的 InvokeModel 和 InvokeModelWithResponseStream 請求的合併總和
Cohere Command 的每分鐘隨需 InvokeModel 請求 每個支援的區域:400 您可以在一分鐘內呼叫 InvokeModel 和 InvokeModelWithResponseStream 的次數上限。配額會考慮 Cohere Command 的 InvokeModel 和 InvokeModelWithResponseStream 請求總和。
Cohere Command Light 的每分鐘隨需 InvokeModel 請求 每個支援的區域:800 您可以在一分鐘內呼叫 InvokeModel 和 InvokeModelWithResponseStream 的次數上限。配額會考慮 Cohere Command Light 的 InvokeModel 和 InvokeModelWithResponseStream 請求的合併總和。
Cohere Command R 的每分鐘隨需 InvokeModel 請求 每個支援的區域:400 您可以在一分鐘內呼叫 InvokeModel 和 InvokeModelWithResponseStream 的次數上限。配額會考慮 Cohere Command R 128k 的 InvokeModel 和 InvokeModelWithResponseStream 請求的合併總和。
Cohere Command R Plus 的每分鐘隨需 InvokeModel 請求 每個支援的區域:400 您可以在一分鐘內呼叫 InvokeModel 和 InvokeModelWithResponseStream 的次數上限。配額會考慮 Cohere Command R Plus 128k 的 InvokeModel 和 InvokeModelWithResponseStream 請求的合併總和。
Cohere Embed English 的每分鐘隨需 InvokeModel 請求 每個受支援的區域:2,000 Cohere Embed English 在一分鐘內可以呼叫 InvokeModel 的次數上限。
Cohere Embed Multiling 的每分鐘隨需 InvokeModel 請求 每個受支援的區域:2,000 Cohere Embed Multilingual 在一分鐘內可以呼叫 InvokeModel 的次數上限。
Meta Llama 2 13B 的每分鐘隨需 InvokeModel 請求 每個支援的區域:800 您可以在一分鐘內呼叫 InvokeModel 和 InvokeModelWithResponseStream 的次數上限。配額會考慮 Meta Llama 2 13B 的 InvokeModel 和 InvokeModelWithResponseStream 請求的合併總和。
Meta Llama 2 70B 的每分鐘隨需 InvokeModel 請求 每個支援的區域:400 您可以在一分鐘內呼叫 InvokeModel 和 InvokeModelWithResponseStream 的次數上限。配額會考慮 Meta Llama 2 70B 的 InvokeModel 和 InvokeModelWithResponseStream 請求的合併總和。
Meta Llama 2 Chat 13B 的每分鐘隨需 InvokeModel 請求 每個支援的區域:800 您可以在一分鐘內呼叫 InvokeModel 和 InvokeModelWithResponseStream 的次數上限。配額會考慮 Meta Llama 2 Chat 13B 的 InvokeModel 和 InvokeModelWithResponseStream 請求的合併總和。
Meta Llama 2 Chat 70B 的每分鐘隨需 InvokeModel 請求 每個支援的區域:400 您可以在一分鐘內呼叫 InvokeModel 和 InvokeModelWithResponseStream 的次數上限。配額會考慮 Meta Llama 2 Chat 70B 的 InvokeModel 和 InvokeModelWithResponseStream 請求的合併總和。
Meta Llama 3 70B 指示的每分鐘隨需 InvokeModel 請求 每個支援的區域:400 您可以在一分鐘內呼叫 InvokeModel 和 InvokeModelWithResponseStream 的次數上限。配額會考慮 Meta Llama 3 70B Instruct 的 InvokeModel 和 InvokeModelWithResponseStream 請求的合併總和。
Meta Llama 3 8B 指示的每分鐘隨需 InvokeModel 請求 每個支援的區域:800 您可以在一分鐘內呼叫 InvokeModel 和 InvokeModelWithResponseStream 的次數上限。配額會考慮 Meta Llama 3 8B Instruct 的 InvokeModel 和 InvokeModelWithResponseStream 請求的合併總和。
Mistral 7B Instruct 的每分鐘隨需 InvokeModel 請求 每個支援的區域:800 對於 Mistral mistral-7 InvokeModel 0,您可以在一分鐘內呼叫b-instruct-v 的次數上限
Mistral AI Mistral Small 的每分鐘隨需 InvokeModel 請求 每個支援的區域:400 對於 Mistral AI Mistral Small,您可以在一分鐘內呼叫 InvokeModel 和 InvokeModelWithResponseStream 的次數上限
Mistral Large 的每分鐘隨需 InvokeModel 請求 每個支援的區域:400 對於 Mistral mistral-large-2402-v1,您可以在一分鐘內呼叫 InvokeModel 和 InvokeModelWithResponseStream 的次數上限
Mistral Mixtral 8x7b Instruct 的每分鐘隨需 InvokeModel 請求 每個支援的區域:400 對於 Mistral mixtral-8x7b-v0,您可以在一分鐘內呼叫 InvokeModel 的次數上限
Stability.ai Stable Diffusion 3 Large 的每分鐘隨需 InvokeModel 請求 每個受支援的區域:15 對於 Stability.ai Stable Diffusion 3 Large,您可以在一分鐘內呼叫 InvokeModel 的次數上限。
Stability.ai Stable Diffusion 3 Medium 的每分鐘隨需 InvokeModel 請求 每個支援的區域:60 Stability.ai Stable Diffusion 3 Medium 在一分鐘內可以呼叫 InvokeModel 的次數上限
Stability.ai Stable Diffusion XL 0.8 的每分鐘隨需 InvokeModel 請求 每個支援的區域:60 Stability.ai Stable Diffusion XL 0.8 一分鐘內可以呼叫 InvokeModel 的次數上限
Stability.ai Stable Diffusion XL 1.0 的每分鐘隨需 InvokeModel 請求 每個支援的區域:60 Stability.ai Stable Diffusion XL 1.0 在一分鐘內可以呼叫 InvokeModel 的次數上限
Stability.ai Stable Image Core 的每分鐘隨需 InvokeModel 請求 每個支援的區域:90 對於 Stability.ai Stable Image Core,您可以在一分鐘內呼叫 InvokeModel 的次數上限。
Stability.ai Stable Image Ultra 的每分鐘隨需 InvokeModel 請求 每個受支援的區域:10 對於 Stability.ai Stable Image Ultra,您可以在一分鐘內呼叫 InvokeModel 的次數上限。
InvokeModel Labs Jamba 1.5 Large 的每分鐘隨需 AI21 權杖 每個支援的區域:300,000 Word AI21 Labs Jamba 1.5 Large 在一分鐘內可提交模型推論的權杖數量上限。配額會考慮 Converse 和 InvokeModel 的權杖總和。
InvokeModel Labs Jamba 1.5 Mini 的每分鐘隨需 AI21 字符 每個支援的區域:300,000 您可以為 AI21 Labs Jamba 1.5 Mini 在一分鐘內提交模型推論的字符數量上限。配額會考慮 Converse 和 InvokeModel 的權杖總和。
InvokeModel Labs Jamba Instruct 的每分鐘隨需 AI21 字符 每個支援的區域:300,000 您可以在一分鐘內為 AI21 Labs Jamba Instruct 提交模型推論的字符數量上限。配額會考慮 Converse 和 InvokeModel 的字符加總
InvokeModel Labs Jurassic-2 Mid 的每分鐘隨需 AI21 字符 每個支援的區域:300,000 您可以在一分鐘內為 InvokeModel AI21 Labs Jurassic-2 Mid 提供的字符數量上限。
InvokeModel Labs Jurassic-2 Ultra 的每分鐘隨需 AI21 權杖 每個支援的區域:300,000 您可以在一分鐘內為 InvokeModel AI21 Labs Jurassic-2 Ultra 提供的字符數量上限。
Amazon Titan Image Generator G1 的每分鐘隨需 InvokeModel 字符 每個受支援的區域:2,000 您可以在一分鐘 InvokeModel 內為 Amazon Titan Image Generator G1 提供的字符數量上限。
Amazon Titan Image Generator G1 V2 的每分鐘隨需 InvokeModel 字符 每個受支援的區域:2,000 您可以在一分鐘 InvokeModel 內為 Amazon Titan Image Generator G1 V2 提供的字符數量上限。
Amazon Titan Multimodal Embeddings G1 的每分鐘隨需 InvokeModel 字符 每個支援的區域:300,000 您可以在一分鐘 InvokeModel 內為 Amazon Titan Multimodal Embeddings G1 提供的字符數量上限。
Amazon Titan Text Embeddings 的每分鐘隨需 InvokeModel 字符 每個支援的區域:300,000 您可以在一分鐘 InvokeModel 內為 Amazon Titan Text Embeddings 提供的字符數量上限。
Amazon Titan Text Embeddings V2 的每分鐘隨需 InvokeModel 字符 每個支援的區域:300,000 您可以在一分鐘 InvokeModel 內為 Amazon Titan Text Embeddings V2 提供的字符數量上限。
Amazon Titan Text Express 的每分鐘隨需 InvokeModel 字符 每個支援的區域:300,000 您可以在一分鐘內透過 InvokeModel 和 InvokeModelWithResponseStream 提供的字符數量上限。配額會考慮 Amazon Titan Text Express 的 InvokeModel 和 InvokeModelWithResponseStream 權杖的合併總和。
Amazon Titan Text Lite 的每分鐘隨需 InvokeModel 權杖 每個支援的區域:300,000 您可以在一分鐘內透過 InvokeModel 和 InvokeModelWithResponseStream 提供的字符數量上限。配額會考慮 Amazon Titan Text Lite 的 InvokeModel 和 InvokeModelWithResponseStream 權杖的合併總和。
Amazon Titan Text Premier 的每分鐘隨需 InvokeModel 字符 每個支援的區域:300,000 您可以在一分鐘內透過 InvokeModel 和 InvokeModelWithResponseStream 提供的字符數量上限。配額會考慮 Amazon Titan Text Premier 的 InvokeModel 和 InvokeModelWithResponseStream 權杖的合併總和。
Anthropic Claude 3 Haiku 的每分鐘隨需 InvokeModel 字符

us-east-1:2,000,000

us-west-2:2,000,000

ap-northeast-1:200,000

ap-southeast-1:200,000

每個其他支援的 區域:300,000

您可以在一分鐘內透過 InvokeModel 和 InvokeModelWithResponseStream 提供的字符數量上限。配額會考慮 Anthropic Claude 3 Haiku 的 InvokeModel 和 InvokeModelWithResponseStream 權杖總和。
Anthropic Claude 3 Opus 的每分鐘隨需 InvokeModel 字符 每個支援的區域:400,000 您可以在一分鐘內透過 InvokeModel 和 InvokeModelWithResponseStream 提供的字符數量上限。配額會考量 Anthropic Claude 3 Opus 的 InvokeModel 和 InvokeModelWithResponseStream 權杖總和。
Anthropic Claude 3 Sonnet 的每分鐘隨需 InvokeModel 字符

us-east-1:1,000,000

us-west-2:1,000,000

每個其他支援的 區域:200,000 個

您可以在一分鐘內透過 InvokeModel 和 InvokeModelWithResponseStream 提供的字符數量上限。配額會考慮 Anthropic Claude 3 Sonnet 的 InvokeModel 和 InvokeModelWithResponseStream 權杖總和。
Anthropic Claude 3.5 Haiku 的每分鐘隨需 InvokeModel 字符 每個支援的區域:2,000,000 您可以在一分鐘內透過 InvokeModel 和 InvokeModelWithResponseStream 提供的字符數量上限。配額會考量 Anthropic Claude 3.5 Haiku 的 InvokeModel 和 InvokeModelWithResponseStream 權杖總和。
Anthropic Claude 3.5 Sonnet 的每分鐘隨需 InvokeModel 字符

us-east-1:400,000

us-east-2:400,000

us-west-2:2,000,000

ap-northeast-2:400,000

ap-south-1:400,000

ap-southeast-2:400,000

每個其他支援的 區域:200,000 個

您可以在一分鐘內為 Anthropic Claude 3.5 Sonnet 提交模型推論的字符數量上限。配額會考慮 Converse、 ConverseStream、 InvokeModel 和 InvokeModelWithResponseStream 的加總。
Anthropic Claude 3.5 Sonnet V2 的每分鐘隨需 InvokeModel 字符

us-west-2:2,000,000

每個其他支援的區域:400,000

您可以在一分鐘內為 Anthropic Claude 3.5 Sonnet V2 提交模型推論的權杖數量上限。配額會考慮 Converse、 ConverseStream、 InvokeModel 和 InvokeModelWithResponseStream 的加總。
Anthropic Claude Instant 的每分鐘隨需 InvokeModel 字符

us-east-1:1,000,000

us-west-2:1,000,000

每個其他支援的 區域:300,000

您可以在一分鐘內透過 InvokeModel 和 InvokeModelWithResponseStream 提供的字符數量上限。配額會考慮 Anthropic Claude Instant 的 InvokeModel 和 InvokeModelWithResponseStream 權杖合併總和。
Anthropic Claude V2 的每分鐘隨需 InvokeModel 權杖

us-east-1:500,000

us-west-2:500,000

每個其他支援的 區域:200,000 個

您可以在一分鐘內透過 InvokeModel 和 InvokeModelWithResponseStream 提供的字符數量上限。配額會考慮 Anthropic Claude V2 的 InvokeModel 和 InvokeModelWithResponseStream 權杖的合併總和。
Cohere Command 的每分鐘隨需 InvokeModel 字符 每個支援的區域:300,000 您可以在一分鐘內透過 InvokeModel 和 InvokeModelWithResponseStream 提供的字符數量上限。配額會考慮 Cohere Command 的 InvokeModel 和 InvokeModelWithResponseStream 權杖合併總和。
Cohere Command Light 的每分鐘隨需 InvokeModel 字符 每個支援的區域:300,000 您可以在一分鐘內透過 InvokeModel 為 Cohere Command Light 提供的字符數量上限。
Cohere Command R 的每分鐘隨需 InvokeModel 字符 每個支援的區域:300,000 您可以在一分鐘內透過 InvokeModel 和 InvokeModelWithResponseStream 提供的字符數量上限。配額會考慮 Cohere Command R 128k 的 InvokeModel 和 InvokeModelWithResponseStream 權杖的合併總和。
Cohere Command R Plus 的每分鐘隨需 InvokeModel 權杖 每個支援的區域:300,000 您可以在一分鐘內透過 InvokeModel 和 InvokeModelWithResponseStream 提供的字符數量上限。配額會考慮 Cohere Command R Plus 128k 的 InvokeModel 和 InvokeModelWithResponseStream 權杖的合併總和。
Cohere Embed English 的每分鐘隨需 InvokeModel 字符 每個支援的區域:300,000 您可以在一分鐘內透過 InvokeModel 為 Cohere Embed English 提供的字符數量上限。
Cohere Embed Multilingual 的每分鐘隨需 InvokeModel 字符 每個支援的區域:300,000 您可以在一分鐘內透過 InvokeModel 為 Cohere Embed Multilingual 提供的字符數量上限。
Meta Llama 2 13B 的每分鐘隨需 InvokeModel 字符 每個支援的區域:300,000 您可以在一分鐘內透過 InvokeModel 和 InvokeModelWithResponseStream 提供的字符數量上限。配額會考慮 Meta Llama 2 13B 的 InvokeModel 和 InvokeModelWithResponseStream 權杖的合併總和。
Meta Llama 2 70B 的每分鐘隨需 InvokeModel 字符 每個支援的區域:300,000 您可以在一分鐘內透過 InvokeModel 和 InvokeModelWithResponseStream 提供的字符數量上限。配額會考慮 Meta Llama 2 70B 的 InvokeModel 和 InvokeModelWithResponseStream 權杖的合併總和。
Meta Llama 2 Chat 13B 的每分鐘隨需 InvokeModel 字符 每個支援的區域:300,000 您可以在一分鐘內透過 InvokeModel 和 InvokeModelWithResponseStream 提供的字符數量上限。配額會考慮 Meta Llama 2 Chat 13B 的 InvokeModel 和 InvokeModelWithResponseStream 權杖的合併總和。
Meta Llama 2 Chat 70B 的每分鐘隨需 InvokeModel 字符 每個支援的區域:300,000 您可以在一分鐘內透過 InvokeModel 和 InvokeModelWithResponseStream 提供的字符數量上限。配額會考慮 Meta Llama 2 Chat 70B 的 InvokeModel 和 InvokeModelWithResponseStream 權杖的合併總和。
Meta Llama 3 70B Instruct 的每分鐘隨需 InvokeModel 字符 每個支援的區域:300,000 您可以在一分鐘內透過 InvokeModel 和 InvokeModelWithResponseStream 提供的字符數量上限。配額會考慮 Meta Llama 3 70B Instruct 的 InvokeModel 和 InvokeModelWithResponseStream 權杖的合併總和。
Meta Llama 3 8B 指示的每分鐘隨需 InvokeModel 字符 每個支援的區域:300,000 您可以在一分鐘內透過 InvokeModel 和 InvokeModelWithResponseStream 提供的字符數量上限。配額會考慮 Meta Llama 3 8B Instruct 的 InvokeModel 和 InvokeModelWithResponseStream 權杖的合併總和。
Mistral AI Mistral 7B Instruct 的每分鐘隨需 InvokeModel 權杖 每個支援的區域:300,000 您可以在一分鐘內透過 InvokeModel 和 InvokeModelWithResponseStream 提供的字符數量上限。配額會考量 Mistral AI Mistral 7B Instruct 的 InvokeModel 和 InvokeModelWithResponseStream 權杖的合併總和。
Mistral AI Mistral Large 的每分鐘隨需 InvokeModel 權杖 每個支援的區域:300,000 您可以在一分鐘內透過 InvokeModel 和 InvokeModelWithResponseStream 提供的字符數量上限。配額會考慮 Mistral AI Mistral Large 的 InvokeModel 和 InvokeModelWithResponseStream 權杖的合併總和。
Mistral AI Mistral Small 的每分鐘隨需 InvokeModel 權杖 每個支援的區域:300,000 您可以在一分鐘內透過 InvokeModel 和 InvokeModelWithResponseStream 提供的字符數量上限。配額會考慮 Mistral AI Mistral Small 的 InvokeModel 和 InvokeModelWithResponseStream 權杖的合併總和。
Mistral AI Mixtral 8X7BB 指示的每分鐘隨需 InvokeModel 權杖 每個支援的區域:300,000 您可以在一分鐘內透過 InvokeModel 和 InvokeModelWithResponseStream 提供的字符數量上限。配額會考慮 Mistral mixtral-8x7 InvokeModelWithResponseStream 0 的 InvokeModel 和b-instruct-v 權杖的合併總和。
Meta Llama 3.1 405B 指示的每分鐘隨需模型推論請求 每個受支援的區域:200 Meta Llama 3.1 405B Instruct 在一分鐘內可以呼叫模型推論的次數上限。配額會考慮Word、 InvokeModel、 InvokeModelWithResponseStreamConverse 和 ConverseStream 的請求總和。
Meta Llama 3.1 70B Instruct 的每分鐘隨需模型推論請求 每個支援的區域:400 Meta Llama 3.1 70B Instruct 在一分鐘內可以呼叫模型推論的次數上限。配額會考慮Word、 InvokeModel、 InvokeModelWithResponseStreamConverse 和 ConverseStream 的請求總和。
Meta Llama 3.1 8B Instruct 的每分鐘隨需模型推論請求 每個支援的區域:800 Meta Llama 3.1 8B Instruct 在一分鐘內可以呼叫模型推論的次數上限。配額會考慮Word、 InvokeModel、 InvokeModelWithResponseStreamConverse 和 ConverseStream 的請求總和。
Meta Llama 3.2 11B 指示的每分鐘隨需模型推論請求 每個支援的區域:400 Meta Llama 3.2 11B Instruct 在一分鐘內可以呼叫模型推論的次數上限。配額會考慮Word、 InvokeModel、 InvokeModelWithResponseStreamConverse 和 ConverseStream 的請求總和。
Meta Llama 3.2 1B 指示的每分鐘隨需模型推論請求 每個支援的區域:800 對於 Meta Llama 3.2 1B Instruct,您可以在一分鐘內呼叫模型推論的次數上限。配額會考慮Word、 InvokeModel、 InvokeModelWithResponseStreamConverse 和 ConverseStream 的請求總和。
Meta Llama 3.2 3B Instruct 的每分鐘隨需模型推論請求 每個支援的區域:800 Meta Llama 3.2 3B Instruct 在一分鐘內可以呼叫模型推論的次數上限。配額會考慮Word、 InvokeModel、 InvokeModelWithResponseStreamConverse 和 ConverseStream 的請求總和。
Meta Llama 3.2 90B 指示的每分鐘隨需模型推論請求 每個支援的區域:400 Meta Llama 3.2 90B Instruct 在一分鐘內可以呼叫模型推論的次數上限。配額會考慮Word、 InvokeModel、 InvokeModelWithResponseStreamConverse 和 ConverseStream 的請求總和。
Mistral Large 2407 的每分鐘隨需模型推論請求 每個支援的區域:400 對於 Mistral Large 2407,您可以在一分鐘內呼叫模型推論的次數上限。配額會考慮Word、 InvokeModel InvokeModelWithResponseStream、Converse 和 ConverseStream 的請求總和
Meta Llama 3.1 8B 指示的每分鐘隨需模型推論權杖 每個支援的區域:300,000 您可以在一分鐘內為 Meta Llama 3.1 8B Instruct 提交模型推論的權杖數量上限。配額會考慮Word、 InvokeModel InvokeModelWithResponseStream、Converse 和 ConverseStream 的字符總和。
Meta Llama 3.2 11B 指示的每分鐘隨需模型推論權杖 每個支援的區域:300,000 您可以提交用於 Meta Llama 3.2 11B Instruct 在一分鐘內模型推論的權杖數量上限。配額會考慮Word、 InvokeModel InvokeModelWithResponseStream、Converse 和 ConverseStream 的字符總和。
Meta Llama 3.2 1B 指示的每分鐘隨需模型推論權杖 每個支援的區域:300,000 您可以在一分鐘內為 Meta Llama 3.2 1B Instruct 提交模型推論的權杖數量上限。配額會考慮Word、 InvokeModel InvokeModelWithResponseStream、Converse 和 ConverseStream 的字符總和。
Meta Llama 3.2 3B 指示的每分鐘隨需模型推論權杖 每個支援的區域:300,000 您可以在一分鐘內為 Meta Llama 3.2 3B Instruct 提交模型推論的權杖數量上限。配額會考慮Word、 InvokeModel InvokeModelWithResponseStream、Converse 和 ConverseStream 的字符總和。
Meta Llama 3.2 90B 指示的每分鐘隨需模型推論權杖 每個支援的區域:300,000 您可以在一分鐘內為 Meta Llama 3.2 90B Instruct 提交模型推論的權杖數量上限。配額會考慮Word、 InvokeModel InvokeModelWithResponseStream、Converse 和 ConverseStream 的字符總和。
Mistral Large 2407 的每分鐘隨需模型推論權杖 每個支援的區域:300,000 對於 Mistral Large 2407,您可以在一分鐘內提交模型推論的權杖數量上限。配額會考慮Word、 InvokeModel InvokeModelWithResponseStream、Converse 和 ConverseStream 的字符總和
適用於 Meta Llama 3.1 405B Instruct 的每分鐘隨需模型推論權杖 每個支援的區域:400,000 您可以提交用於 Meta Llama 3.1 405B Instruct 在一分鐘內模型推論的權杖數量上限。配額會考慮Word、 InvokeModel InvokeModelWithResponseStream、Converse 和 ConverseStream 的字符總和。
適用於 Meta Llama 3.1 70B Instruct 的每分鐘隨需模型推論權杖 每個支援的區域:300,000 您可以在一分鐘內為 Meta Llama 3.1 70B Instruct 提交模型推論的權杖數量上限。配額會考慮Word、 InvokeModel InvokeModelWithResponseStream、Converse 和 ConverseStream 的字符總和。
每個流程的輸出節點 每個受支援的區域:10 流程輸出節點的數量上限。
每個函數的參數 每個受支援的區域:5 您可以在動作群組函數中擁有的參數數目上限。
每秒的PrepareAgent 請求數 每個支援的區域:2 每秒 PrepareAgent API 請求數目上限。
每秒的PrepareFlow 請求數 每個支援的區域:2 每秒的 PrepareFlow 請求數目上限。
每個流程的提示節點 每個受支援的區域:10 提示節點的數量上限。
每個帳戶的提示數 每個受支援的區域:50 提示數目上限。
每個批次推論任務的記錄 每個支援的區域:50,000 批次推論任務中所有輸入檔案的記錄數目上限。
每個批次推論任務每個輸入檔案的記錄 每個支援的區域:50,000 批次推論任務中輸入檔案中的記錄數目上限。
敏感資訊篩選條件中的 Regex 實體 每個受支援的區域:10 可以包含在單字政策中的 guardrail 篩選條件 regexe 數目上限
字元的 Regex 長度 每個受支援的區域:500 防護欄篩選條件 regex 的長度上限,以字元為單位
擷取每秒請求 每個受支援的區域:5 每秒擷取 API 請求的數量上限。
每秒的RetrieveAndGenerate 請求數 每個受支援的區域:5 每秒 RetrieveAndGenerate API 請求數目上限。
每個流程的 S3 擷取節點 每個受支援的區域:10 S3 擷取節點的數量上限。
每個流程的 S3 儲存節點 每個受支援的區域:10 S3 儲存節點的數量上限。
排程的自訂任務 每個支援的區域:2 排程自訂任務的數量上限。
提示的大小 每個受支援的區域:4 個別提示的大小上限 (KB) 是自訂提示資料集。
每秒的StartIngestionJob 請求數 每個支援的區域:0.1 每秒 StartIngestionJob API 請求數目上限。
使用基礎模型進行中和提交的批次推論任務總和

eu-south-1:10

每個其他支援的 區域:20

使用基礎模型進行中和提交的批次推論任務數量上限。
使用自訂模型進行中和提交的批次推論任務總和 每個支援的區域:3 使用自訂模型進行中和提交的批次推論任務數量上限
Claude 3 Haiku v1 微調任務的訓練和驗證記錄總和 每個受支援的區域:10,000 Claude 3 Haiku 微調任務允許的訓練和驗證記錄合併數目上限。
Meta Llama 2 13B v1 微調任務的訓練和驗證記錄總和 每個受支援的區域:10,000 Meta Llama 2 13B 微調任務允許的訓練和驗證記錄合併數目上限。
Meta Llama 2 70B v1 微調任務的訓練和驗證記錄總和 每個受支援的區域:10,000 Meta Llama 2 70B 微調任務允許的訓練和驗證記錄合併數目上限。
Meta Llama 3.1 70B 指示 v1 微調任務的訓練和驗證記錄總和 每個受支援的區域:10,000 Meta Llama 3.1 70B 指示微調任務允許的訓練和驗證記錄合併數目上限。
Meta Llama 3.1 8B Instruct v1 微調任務的訓練和驗證記錄總和 每個受支援的區域:10,000 Meta Llama 3.1 8B 指示微調任務允許的訓練和驗證記錄合併數目上限。
Meta Llama 3.2 1B 指示 v1 微調任務的訓練和驗證記錄總和 每個受支援的區域:10,000 Meta Llama 3.2 1B 指示微調任務允許的訓練和驗證記錄合併數目上限。
Meta Llama 3.2 3B 指示 v1 微調任務的訓練和驗證記錄總和 每個受支援的區域:10,000 Meta Llama 3.2 3B 指示微調任務允許的訓練和驗證記錄合併數目上限。
Titan Image Generator G1 V1 微調任務的訓練和驗證記錄總和 每個受支援的區域:10,000 Titan Image Generator 微調工作允許的訓練和驗證記錄合併數目上限。
Titan Image Generator G1 V2 微調任務的訓練和驗證記錄總和 每個受支援的區域:10,000 Titan Image Generator V2 微調工作允許的訓練和驗證記錄合併數目上限。
Titan Multimodal Embeddings G1 v1 微調任務的訓練和驗證記錄總和 每個支援的區域:50,000 Titan Multimodal Embeddings Fine-tuning 任務允許的訓練和驗證記錄合併數目上限。
Titan Text G1 - Express v1 繼續訓練前任務的訓練和驗證記錄總和 每個支援的區域:100,000 Titan Text Express 繼續訓練前任務允許的訓練和驗證記錄合併數目上限。
Titan Text G1 - Express v1 微調任務的訓練和驗證記錄總和 每個受支援的區域:10,000 Titan Text Express 微調任務允許的訓練和驗證記錄合併數目上限。
Titan Text G1 - Lite v1 繼續訓練前任務的訓練和驗證記錄總和 每個支援的區域:100,000 Titan Text Lite 持續訓練前任務允許的訓練和驗證記錄合併數目上限。
Titan Text G1 - Lite v1 微調任務的訓練和驗證記錄總和 每個受支援的區域:10,000 Titan Text Lite 微調任務允許的訓練和驗證記錄合併數目上限。
Titan Text G1 - Premier v1 微調任務的訓練和驗證記錄總和 每個受支援的區域:20,000 Titan Text Premier 微調任務允許的訓練和驗證記錄合併數目上限。
工作者的任務時間 每個受支援的區域:30 工作者完成任務所需的時間長度上限 (以天為單位)。
每個護欄的主題 每個受支援的區域:30 跨防護機制主題政策定義的主題數量上限
每個流程的總節點數 每個受支援的區域:40 流程中節點的數量上限。
每秒的UpdateAgent 請求數 每個受支援的區域:4 每秒 UpdateAgent API 請求數目上限。
每秒的UpdateAgentActionGroup 請求數 每個受支援的區域:6 每秒 UpdateAgentActionGroup API 請求數目上限
每秒的UpdateAgentAlias 請求數 每個支援的區域:2 每秒 UpdateAgentAlias API 請求數目上限。
每秒的UpdateAgentKnowledgeBase 請求數 每個受支援的區域:4 每秒 UpdateAgentKnowledgeBase API 請求數目上限。
每秒的UpdateDataSource 請求數 每個支援的區域:2 每秒 UpdateDataSource API 請求數目上限。
每秒的UpdateFlow 請求數 每個支援的區域:2 每秒的 UpdateFlow 請求數目上限。
每秒的UpdateFlowAlias 請求數 每個支援的區域:2 每秒的 UpdateFlowAlias 請求數目上限。
每秒的UpdateKnowledgeBase 請求數 每個支援的區域:2 每秒 UpdateKnowledgeBase API 請求數目上限。
每秒的UpdatePrompt 請求數 每個支援的區域:2 每秒的 UpdatePrompt 請求數目上限。
使用者查詢大小 每個支援的區域:1,000 使用者查詢的大小上限 (以字元為單位)。
每秒的ValidateFlowDefinition 請求數 每個支援的區域:2 每秒的 ValidateFlowDefinition 請求數目上限。
每個防護機制的版本 每個受支援的區域:20 護欄可擁有的版本數量上限
每個提示的版本 每個受支援的區域:10 每個提示的版本數目上限。
字元的字長度 每個受支援的區域:100 封鎖字清單中單字的長度上限,以字元為單位
每個單字的單字政策 每個受支援的區域:10,000 可包含在封鎖字清單中的字數上限