Amazon Bedrock 端點和配額 - AWS 一般參考

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

Amazon Bedrock 端點和配額

以下是此服務的服務端點和服務配額。若要以程式設計方式連線至 AWS 服務,您可以使用端點。除了標準 AWS 端點之外,某些 AWS 服務還提供特定區域中的FIPS端點。如需詳細資訊,請參閱AWS 服務端點。服務配額也稱為限制,是 AWS 您的帳戶的服務資源或操作數量上限。如需詳細資訊,請參閱AWS 服務配額

注意

AWS 建議您在應用程式中使用區域STS端點,並避免使用全域 (舊版) STS端點。區域STS端點可減少延遲、建置備援,並提高工作階段權杖有效性。如需設定應用程式以使用區域STS端點的詳細資訊,請參閱 AWS SDKs和 工具參考指南 中的AWS STS 區域化端點。如需全域 (舊版) AWS STS 端點的詳細資訊,包括如何監控此端點的使用,請參閱安全部落格中的如何使用區域 AWS STS 端點AWS

服務端點

Amazon Bedrock 控制平面 APIs

下表提供 Amazon Bedrock 支援的區域特定端點清單,用於管理、訓練和部署模型。將這些端點用於 Amazon Bedrock API操作

區域名稱 區域 端點 通訊協定
美國東部 (俄亥俄) us-east-2

bedrock.us-east-2.amazonaws.com

bedrock-fips.us-east-2.amazonaws.com

HTTPS

HTTPS

美國東部 (維吉尼亞北部) us-east-1

bedrock.us-east-1.amazonaws.com

bedrock-fips.us-east-1.amazonaws.com

HTTPS

HTTPS

美國西部 (奧勒岡) us-west-2

bedrock.us-west-2.amazonaws.com

bedrock-fips.us-west-2.amazonaws.com

HTTPS

HTTPS

亞太區域 (孟買) ap-south-1 bedrock.ap-south-1.amazonaws.com HTTPS
亞太區域 (首爾) ap-northeast-2 bedrock.ap-northeast-2.amazonaws.com HTTPS
亞太區域 (新加坡) ap-southeast-1 bedrock.ap-southeast-1.amazonaws.com HTTPS
亞太區域 (悉尼) ap-southeast-2 bedrock.ap-southeast-2.amazonaws.com HTTPS
亞太區域 (東京) ap-northeast-1 bedrock.ap-northeast-1.amazonaws.com HTTPS
加拿大 (中部) ca-central-1

bedrock.ca-central-1.amazonaws.com

bedrock-fips.ca-central-1.amazonaws.com

HTTPS

HTTPS

歐洲 (法蘭克福) eu-central-1 bedrock.eu-central-1.amazonaws.com HTTPS
歐洲 (愛爾蘭) eu-west-1 bedrock.eu-west-1.amazonaws.com HTTPS
歐洲 (倫敦) eu-west-2 bedrock.eu-west-2.amazonaws.com HTTPS
歐洲 (巴黎) eu-west-3 bedrock.eu-west-3.amazonaws.com HTTPS
南美洲 (聖保羅) sa-east-1 bedrock.sa-east-1.amazonaws.com HTTPS
AWS GovCloud (美國西部) us-gov-west-1

bedrock.us-gov-west-1.amazonaws.com

bedrock-fips.us-gov-west-1.amazonaws.com

HTTPS

HTTPS

Amazon Bedrock 執行時間 APIs

下表提供 Amazon Bedrock 支援的區域特定端點清單,用於對 Amazon Bedrock 中託管的模型提出推論請求。將這些端點用於 Amazon Bedrock Runtime API操作

區域名稱 區域 端點 通訊協定
美國東部 (俄亥俄) us-east-2

bedrock-runtime.us-east-2.amazonaws.com

bedrock-runtime-fips.us-east-2.amazonaws.com

HTTPS

HTTPS

美國東部 (維吉尼亞北部) us-east-1

bedrock-runtime.us-east-1.amazonaws.com

bedrock-runtime-fips.us-east-1.amazonaws.com

HTTPS

HTTPS

美國西部 (奧勒岡) us-west-2

bedrock-runtime.us-west-2.amazonaws.com

bedrock-runtime-fips.us-west-2.amazonaws.com

HTTPS

HTTPS

亞太區域 (孟買) ap-south-1 bedrock-runtime.ap-south-1.amazonaws.com HTTPS
亞太區域 (首爾) ap-northeast-2 bedrock-runtime.ap-northeast-2.amazonaws.com HTTPS
亞太區域 (新加坡) ap-southeast-1 bedrock-runtime.ap-southeast-1.amazonaws.com HTTPS
亞太區域 (悉尼) ap-southeast-2 bedrock-runtime.ap-southeast-2.amazonaws.com HTTPS
亞太區域 (東京) ap-northeast-1 bedrock-runtime.ap-northeast-1.amazonaws.com HTTPS
加拿大 (中部) ca-central-1

bedrock-runtime.ca-central-1.amazonaws.com

bedrock-runtime-fips.ca-central-1.amazonaws.com

HTTPS

HTTPS

歐洲 (法蘭克福) eu-central-1 bedrock-runtime.eu-central-1.amazonaws.com HTTPS
歐洲 (愛爾蘭) eu-west-1 bedrock-runtime.eu-west-1.amazonaws.com HTTPS
歐洲 (倫敦) eu-west-2 bedrock-runtime.eu-west-2.amazonaws.com HTTPS
歐洲 (巴黎) eu-west-3 bedrock-runtime.eu-west-3.amazonaws.com HTTPS
南美洲 (聖保羅) sa-east-1 bedrock-runtime.sa-east-1.amazonaws.com HTTPS
AWS GovCloud (美國西部) us-gov-west-1

bedrock-runtime.us-gov-west-1.amazonaws.com

bedrock-runtime-fips.us-gov-west-1.amazonaws.com

HTTPS

HTTPS

Amazon Bedrock 建置時間的代理程式 APIs

下表提供 Amazon Bedrock 代理程式支援的區域特定端點清單,以建立和管理代理程式和知識庫。將這些端點用於 Amazon Bedrock API操作 的代理程式。

區域名稱 區域 端點 通訊協定
美國東部 (維吉尼亞北部) us-east-1 bedrock-agent.us-east-1.amazonaws.com HTTPS
bedrock-agent-fips.us-east-1.amazonaws.com HTTPS
美國西部 (奧勒岡) us-west-2 bedrock-agent.us-west-2.amazonaws.com HTTPS
bedrock-agent-fips.us-west-2.amazonaws.com HTTPS
亞太區域 (新加坡) ap-southeast-1 bedrock-agent.ap-southeast-1.amazonaws.com HTTPS
亞太區域 (悉尼) ap-southeast-2 bedrock-agent.ap-southeast-2.amazonaws.com HTTPS
亞太區域 (東京) ap-northeast-1 bedrock-agent.ap-northeast-1.amazonaws.com HTTPS
加拿大 (中部) ca-central-1 bedrock-agent.ca-central-1.amazonaws.com HTTPS
歐洲 (法蘭克福) eu-central-1 bedrock-agent.eu-central-1.amazonaws.com HTTPS
歐洲 (愛爾蘭) eu-west-1 bedrock-agent.eu-west-1.amazonaws.com HTTPS
歐洲 (倫敦) eu-west-2 bedrock-agent.eu-west-2.amazonaws.com HTTPS
歐洲 (巴黎) eu-west-3 bedrock-agent.eu-west-3.amazonaws.com HTTPS
亞太區域 (孟買) ap-south-1 bedrock-agent.ap-south-1.amazonaws.com HTTPS
南美洲 (聖保羅) sa-east-1 bedrock-agent.sa-east-1.amazonaws.com HTTPS

Amazon Bedrock 執行時間的代理程式 APIs

下表提供 Amazon Bedrock 的代理程式支援叫用代理程式和查詢知識庫的區域特定端點清單。將這些端點用於 Amazon Bedrock Runtime API操作 的代理程式。

區域名稱 區域 端點 通訊協定
美國東部 (維吉尼亞北部) us-east-1 bedrock-agent-runtime.us-east-1.amazonaws.com HTTPS
bedrock-agent-runtime-fips.us-east-1.amazonaws.com HTTPS
美國西部 (奧勒岡) us-west-2 bedrock-agent-runtime.us-west-2.amazonaws.com HTTPS
bedrock-agent-runtime-fips.us-west-2.amazonaws.com HTTPS
亞太區域 (新加坡) ap-southeast-1 bedrock-agent-runtime.ap-southeast-1.amazonaws.com HTTPS
亞太區域 (悉尼) ap-southeast-2 bedrock-agent-runtime.ap-southeast-2.amazonaws.com HTTPS
亞太區域 (東京) ap-northeast-1 bedrock-agent-runtime.ap-northeast-1.amazonaws.com HTTPS
加拿大 (中部) ca-central-1 bedrock-agent-runtime.ca-central-1.amazonaws.com HTTPS
歐洲 (法蘭克福) eu-central-1 bedrock-agent-runtime.eu-central-1.amazonaws.com HTTPS
歐洲 (巴黎) eu-west-3 bedrock-agent-runtime.eu-west-3.amazonaws.com HTTPS
歐洲 (愛爾蘭) eu-west-1 bedrock-agent-runtime.eu-west-1.amazonaws.com HTTPS
歐洲 (倫敦) eu-west-2 bedrock-agent-runtime.eu-west-2.amazonaws.com HTTPS
亞太區域 (孟買) ap-south-1 bedrock-agent-runtime.ap-south-1.amazonaws.com HTTPS
南美洲 (聖保羅) sa-east-1 bedrock-agent-runtime.sa-east-1.amazonaws.com HTTPS

Service Quotas

如需如何請求增加配額的指示,兩者的可調整值都標示為,以及標示為的配額,請參閱請求增加 Amazon Bedrock 配額。下表顯示 Amazon Bedrock 的配額清單:

名稱 預設 可調整 描述
APIs 每個客服人員 每個支援的區域:11 您可以新增至客服人員APIs的 數目上限。
每個代理程式的動作群組 每個受支援的區域:20 您可以新增至客服人員的動作群組數目上限。
每個流程的代理節點 每個受支援的區域:10 代理程式節點的數量上限。
每個帳戶的代理程式 每個受支援的區域:50 一個帳戶中的客服人員數量上限。
AssociateAgentKnowledgeBase 每秒請求數 每個受支援的區域:6 每秒請求數 AssociateAgentKnowledgeBase API上限。
每個客服人員的關聯別名 每個受支援的區域:10 您可以與客服人員建立關聯的別名數量上限。
每個代理程式的關聯知識庫 每個支援的區域:2 您可以與客服人員建立關聯的知識庫數目上限。
批次推論輸入檔案大小 每個支援的區域:1,073,741,824 提交進行批次推論的單一檔案大小上限 (以位元組為單位)。
批次推論任務大小 每個支援的區域:5,368,709,120 批次推論任務中包含的所有輸入檔案 (以位元組為單位) 的最大累積大小。
代理程式指示中的字元數 每個支援的區域:4,000 客服人員指示中的字元數上限。
每個流程的收集器節點 每個受支援的區域:1 收集器節點的數量上限。
每個帳戶的並行擷取任務 每個受支援的區域:5 可在帳戶中同時執行的最大擷取任務數目。
每個資料來源的並行擷取任務 每個受支援的區域:1 可同時為資料來源執行的最大擷取任務數量。
每個知識庫的並行擷取任務 每個受支援的區域:1 對於知識庫,可同時執行的最大擷取任務數量。
並行模型匯入任務 每個受支援的區域:1 同時進行中的模型匯入任務數量上限。
每個流程的條件節點 每個受支援的區域:5 條件節點的數量上限。
每個條件節點的條件 每個受支援的區域:5 每個條件節點的條件數目上限。
文字單位中的內容接地查詢長度 每個受支援的區域:1 內容式接地查詢的長度上限,以文字單位表示
文字單位的文字接地回應長度 每個受支援的區域:5 內容式接地回應的長度上限,以文字單位表示
文字單位中的內容接地來源長度

us-east-1:100

us-west-2:100

每個其他支援的 區域:50 個

用於內容式接地之接地來源的文字單位長度上限
CreateAgent 每秒請求數 每個受支援的區域:6 每秒請求數 CreateAgent API上限。
CreateAgentActionGroup 每秒請求數 每個支援的區域:12 每秒請求數 CreateAgentActionGroup API上限。
CreateAgentAlias 每秒請求數 每個支援的區域:2 每秒請求數 CreateAgentAlias API上限。
CreateDataSource 每秒請求數 每個支援的區域:2 每秒請求數 CreateDataSource API上限。
CreateFlow 每秒請求數 每個支援的區域:2 每秒 CreateFlow 請求數上限。
CreateFlowAlias 每秒請求數 每個支援的區域:2 每秒 CreateFlowAlias 請求數上限。
CreateFlowVersion 每秒請求數 每個支援的區域:2 每秒 CreateFlowVersion 請求數上限。
CreateKnowledgeBase 每秒請求數 每個支援的區域:2 每秒請求數 CreateKnowledgeBase API上限。
CreatePrompt 每秒請求數 每個支援的區域:2 每秒 CreatePrompt 請求數上限。
CreatePromptVersion 每秒請求數 每個支援的區域:2 每秒 CreatePromptVersion 請求數上限。
每個帳戶的自訂模型數 每個受支援的區域:100 帳戶中的自訂模型數量上限。
每個知識庫的資料來源 每個受支援的區域:5 每個知識庫的資料來源數量上限。
DeleteAgent 每秒請求數 每個支援的區域:2 每秒請求數 DeleteAgent API上限。
DeleteAgentActionGroup 每秒請求數 每個支援的區域:2 每秒請求數 DeleteAgentActionGroup API上限。
DeleteAgentAlias 每秒請求數 每個支援的區域:2 每秒請求數 DeleteAgentAlias API上限。
DeleteAgentVersion 每秒請求數 每個支援的區域:2 每秒請求數 DeleteAgentVersion API上限。
DeleteDataSource 每秒請求數 每個支援的區域:2 每秒請求數 DeleteDataSource API上限。
DeleteFlow 每秒請求數 每個支援的區域:2 每秒 DeleteFlow 請求數上限。
DeleteFlowAlias 每秒請求數 每個支援的區域:2 每秒 DeleteFlowAlias 請求數上限。
DeleteFlowVersion 每秒請求數 每個支援的區域:2 每秒 DeleteFlowVersion 請求數上限。
DeleteKnowledgeBase 每秒請求數 每個支援的區域:2 每秒請求數 DeleteKnowledgeBase API上限。
DeletePrompt 每秒請求數 每個支援的區域:2 每秒 DeletePrompt 請求數上限。
DisassociateAgentKnowledgeBase 每秒請求數 每個受支援的區域:4 每秒請求數 DisassociateAgentKnowledgeBase API上限。
每個代理程式已啟用的動作群組 每個支援的區域:11 您可以在客服人員中啟用的動作群組數目上限。
每個推論設定檔的端點 每個受支援的區域:5 推論設定檔中的端點數量上限。端點由模型定義,以及向模型傳送調用請求的區域。
每個主題的範例片語 每個受支援的區域:5 每個主題可以包含的主題範例數量上限
每個擷取任務要新增或更新的檔案 每個支援的區域:5,000,000 每個擷取任務可以擷取的新增和更新檔案數量上限。
每個擷取任務要刪除的檔案 每個支援的區域:5,000,000 每個擷取任務可刪除的檔案數目上限。
每個流程的流程別名 每個受支援的區域:10 流程別名的數量上限。
每個流程的流程版本 每個受支援的區域:10 流程版本的數量上限。
每個帳戶的流量 每個受支援的區域:100 每個帳戶的流程數目上限。
GetAgent 每秒請求數 每個受支援的區域:15 每秒請求數 GetAgent API上限。
GetAgentActionGroup 每秒請求數 每個受支援的區域:20 每秒請求數 GetAgentActionGroup API上限。
GetAgentAlias 每秒請求數 每個受支援的區域:10 每秒請求數 GetAgentAlias API上限。
GetAgentKnowledgeBase 每秒請求數 每個受支援的區域:15 每秒請求數 GetAgentKnowledgeBase API上限。
GetAgentVersion 每秒請求數 每個受支援的區域:10 每秒請求數 GetAgentVersion API上限。
GetDataSource 每秒請求數 每個受支援的區域:10 每秒請求數 GetDataSource API上限。
GetFlow 每秒請求數 每個受支援的區域:10 每秒 GetFlow 請求數上限。
GetFlowAlias 每秒請求數 每個受支援的區域:10 每秒 GetFlowAlias 請求數上限。
GetFlowVersion 每秒請求數 每個受支援的區域:10 每秒 GetFlowVersion 請求數上限。
GetIngestionJob 每秒請求數 每個受支援的區域:10 每秒請求數 GetIngestionJob API上限。
GetKnowledgeBase 每秒請求數 每個受支援的區域:10 每秒請求數 GetKnowledgeBase API上限。
GetPrompt 每秒請求數 每個受支援的區域:10 每秒 GetPrompt 請求數上限。
每個帳戶的 Guardrails 每個受支援的區域:100 帳戶中的護欄數量上限
每個帳戶的匯入模型 每個支援的區域:3 帳戶中匯入模型的數量上限。
每個帳戶的推論設定檔 每個受支援的區域:50 帳戶中推論設定檔的數量上限。
擷取任務檔案大小 每個受支援的區域:50 擷取任務中檔案的大小上限 (以 MB 為單位)。
擷取任務大小 每個受支援的區域:100 擷取任務的大小上限 (以 GB 為單位)。
每個流程的輸入節點 每個受支援的區域:1 流程輸入節點的數量上限。
每個流程的迭代器節點 每個受支援的區域:1 迭代器節點的數量上限。
每個流程的知識庫節點 每個受支援的區域:10 知識庫節點的數量上限。
每個帳戶的知識庫 每個受支援的區域:100 每個帳戶的知識庫數目上限。
每個流程的 Lambda 函數節點 每個受支援的區域:10 Lambda 函數節點的數量上限。
每個流程的 Lex 節點數 每個受支援的區域:5 Lex 節點的數量上限。
ListAgentActionGroups 每秒請求數 每個受支援的區域:10 每秒請求數 ListAgentActionGroups API上限。
ListAgentAliases 每秒請求數 每個受支援的區域:10 每秒請求數 ListAgentAliases API上限。
ListAgentKnowledgeBases 每秒請求數 每個受支援的區域:10 每秒請求數 ListAgentKnowledgeBases API上限。
ListAgentVersions 每秒請求數 每個受支援的區域:10 每秒請求數 ListAgentVersions API上限。
ListAgents 每秒請求數 每個受支援的區域:10 每秒請求數 ListAgents API上限。
ListDataSources 每秒請求數 每個受支援的區域:10 每秒請求數 ListDataSources API上限。
ListFlowAliases 每秒請求數 每個受支援的區域:10 每秒 ListFlowAliases 請求數上限。
ListFlowVersions 每秒請求數 每個受支援的區域:10 每秒 ListFlowVersions 請求數上限。
ListFlows 每秒請求數 每個受支援的區域:10 每秒 ListFlows 請求數上限。
ListIngestionJobs 每秒請求數 每個受支援的區域:10 每秒請求數 ListIngestionJobs API上限。
ListKnowledgeBases 每秒請求數 每個受支援的區域:10 每秒請求數 ListKnowledgeBases API上限。
ListPrompts 每秒請求數 每個受支援的區域:10 每秒 ListPrompts 請求數上限。
基礎模型之間的模型單位無承諾佈建輸送量 每個支援的區域:2 可以分散到基本模型無承諾佈建輸送量的模型單位數量上限
跨自訂模型的模型單位無承諾佈建輸送量 每個支援的區域:2 可在自訂模型的無承諾佈建輸送量中分佈的模型單位數量上限
AI21 實驗室 Jurassic-2 Mid 每個佈建模型的模型單位 每個支援的區域:0 可配置給 AI21 Labs Jurassic-2 Mid 佈建模型的模型單位數量上限。
AI21 實驗室 Jurassic-2 Ultra 每個佈建模型的模型單位 每個支援的區域:0 可配置給 AI21 Labs Jurassic-2 Ultra 佈建模型的模型單位數量上限。
Amazon Titan 內嵌 G1 每個佈建模型的模型單位 - 文字 每個支援的區域:0 可配置給 Amazon Titan Embeddings G1 - Text 佈建模型的模型單位數量上限。
Amazon Titan Image Generator G1 每個佈建模型的模型單位 每個支援的區域:0 可配置給 Amazon Titan Image Generator G1 佈建模型的模型單位數量上限。
Amazon Titan Image Generator G2 每個佈建模型的模型單位 每個支援的區域:0 可配置給 Amazon Titan Image Generator G2 佈建模型的模型單位數量上限。
Amazon Titan Lite V1 4K 每個佈建模型的模型單位 每個支援的區域:0 可配置給 Amazon Titan Text Lite V1 4K 佈建模型的模型單位數量上限。
Amazon Titan 多模式內嵌 G1 每個佈建模型的模型單位 每個支援的區域:0 可配置給 Amazon Titan Multimodal Embeddings G1 佈建模型的模型單位數量上限。
Amazon Titan Text Embeddings V2 每個佈建模型的模型單位 每個支援的區域:0 可配置給 Amazon Titan Text Embeddings V2 佈建模型的模型單位數量上限。
Amazon Titan Text G1 每個佈建模型的模型單位 - Express 8K 每個支援的區域:0 可配置給 Amazon Titan Text G1 - Express 8K 佈建模型的模型單位數量上限。
Amazon Titan Text Premier V1 32K 每個佈建模型的模型單位 每個支援的區域:0 可配置給 Amazon Titan Text Premier V1 32K 佈建模型的模型單位數量上限。
Anthropic Claude 3 Haiku 200K 每個佈建模型的模型單位 每個支援的區域:0 可配置給 Anthropic Claude 3 Haiku 200K 佈建模型的模型單位數量上限。
Anthropic Claude 3 Haiku 48K 每個佈建模型的模型單位 每個支援的區域:0 可配置給 Anthropic Claude 3 Haiku 48K 佈建模型的模型單位數量上限。
Anthropic Claude 3 Sonnet 200K 每個佈建模型的模型單位 每個支援的區域:0 可配置給 Anthropic Claude 3 Sonnet 200K 佈建模型的模型單位數量上限。
Anthropic Claude 3 Sonnet 28K 每個佈建模型的模型單位 每個支援的區域:0 可配置給 Anthropic Claude 3 Sonnet 28K 佈建模型的模型單位數量上限。
Anthropic Claude 3.5 Sonnet 18K 每個佈建模型的模型單位 每個支援的區域:0 可配置給 Anthropic Claude 3.5 Sonnet 18K 佈建模型的模型單位數量上限。
Anthropic Claude 3.5 Sonnet 200K 每個佈建模型的模型單位 每個支援的區域:0 可配置給 Anthropic Claude 3.5 Sonnet 200K 佈建模型的模型單位數量上限。
Anthropic Claude 3.5 Sonnet 51K 每個佈建模型的模型單位 每個支援的區域:0 可配置給 Anthropic Claude 3.5 Sonnet 51K 佈建模型的模型單位數量上限。
Anthropic Claude Instant V1 100K 每個佈建模型的模型單位 每個支援的區域:0 可配置給 Anthropic Claude Instant V1 100K 佈建模型的模型單位數量上限。
Anthropic Claude V2 100K 每個佈建模型的模型單位 每個支援的區域:0 可配置給 Anthropic Claude V2 100K 佈建模型的模型單位數量上限。
Anthropic Claude V2 18K 每個佈建模型的模型單位 每個支援的區域:0 可配置給 Anthropic Claude V2 18K 佈建模型的模型單位數量上限。
Anthropic Claude V2.1 18K 每個佈建模型的模型單位 每個支援的區域:0 可配置給 Anthropic Claude V2.1 18K 佈建模型的模型單位數量上限。
Anthropic Claude V2.1 200K 每個佈建模型的模型單位 每個支援的區域:0 可配置給 Anthropic Claude V2.1 200k 佈建模型的模型單位數量上限。
Cohere Command 每個佈建模型的模型單位 每個支援的區域:0 可配置給 Cohere Command 佈建模型的模型單位數量上限。
Cohere Command Light 每個佈建模型的模型單位 每個支援的區域:0 可配置給 Cohere Command Light 佈建模型的模型單位數量上限。
Cohere Command R 每個佈建模型的模型單位 每個支援的區域:0 可配置給 Cohere Command R 128k 佈建模型的模型單位數量上限。
Cohere Command R Plus 每個佈建模型的模型單位 每個支援的區域:0 可配置給 Cohere Command R Plus 128k 佈建模型的模型單位數量上限。
Cohere Embed English 每個佈建模型的模型單位 每個支援的區域:0 可配置給 Cohere Embed English 佈建模型的模型單位數量上限。
Cohere Embed Multiling 每個佈建模型的模型單位 每個支援的區域:0 可配置給 Cohere Embed Multilingual 佈建模型的模型單位數量上限。
Meta Llama 2 13B 每個佈建模型的模型單位 每個支援的區域:0 可配置給 Meta Llama 2 13B 佈建模型的模型單位數量上限。
Meta Llama 2 70B 每個佈建模型的模型單位 每個支援的區域:0 可配置給 Meta Llama 2 70B 佈建模型的模型單位數量上限。
Meta Llama 2 Chat 13B 每個佈建模型的模型單位 每個支援的區域:0 可配置給 Meta Llama 2 Chat 13B 佈建模型的模型單位數量上限。
Meta Llama 2 Chat 70B 每個佈建模型的模型單位 每個支援的區域:0 可配置給 Meta Llama 2 Chat 70B 佈建模型的模型單位數量上限。
Meta Llama 3 70B 指示的每個佈建模型的模型單位 每個支援的區域:0 可配置給 Meta Llama 3 70B Instruct 佈建模型的模型單位數量上限。
Meta Llama 3 8B 指示的每個佈建模型的模型單位 每個支援的區域:0 可配置給 Meta Llama 3 8B Instruct 佈建模型的模型單位數量上限。
Meta Llama 3.1 70B Instruct 每個佈建模型的模型單位 每個支援的區域:0 可配置給 Meta Llama 3.1 70B Instruct 佈建模型的模型單位數量上限。
Meta Llama 3.1 8B Instruct 每個佈建模型的模型單位 每個支援的區域:0 可配置給 Meta Llama 3.1 8B Instruct 佈建模型的模型單位數量上限。
Mistral Large 2407 每個佈建模型的模型單位 每個支援的區域:0 可配置給 Mistral Large 2407 佈建模型的模型單位數量上限。
Mistral Small 每個佈建模型的模型單位 每個支援的區域:0 可配置給 Mistral Small 佈建模型的模型單位數量上限。
適用於 Stability.ai Stable Diffusion XL 0.8 的每個佈建模型的模型單位 每個支援的區域:0 可配置給 Stability.ai Stable Diffusion XL 0.8 佈建模型的模型單位數量上限
適用於 Stability.ai Stable Diffusion XL 1.0 的每個佈建模型的模型單位 每個支援的區域:0 可配置給 Stability.ai Stable Diffusion XL 1.0 佈建模型的模型單位數量上限。
並行自動模型評估任務的數量 每個受支援的區域:20 您可以在目前區域中的此帳戶中一次指定的自動模型評估任務數量上限。
使用人工工作者的並行模型評估任務數目 每個受支援的區域:10 您可以在目前區域中的此帳戶中一次指定使用人工工作者的模型評估任務數量上限。
自訂指標數量 每個受支援的區域:10 您可以在使用人工的模型評估任務中指定的自訂指標數量上限。
以人工為基礎的模型評估任務中的自訂提示資料集數量 每個受支援的區域:1 您可以在目前區域中此帳戶中的以人為基礎的模型評估任務中指定的自訂提示資料集數量上限。
每個任務的資料集數目 每個受支援的區域:5 您可以在自動化模型評估任務中指定的資料集數量上限。這包括自訂和內建提示資料集。
評估任務數目 每個受支援的區域:5,000 您可以在目前區域中的此帳戶中建立的模型評估任務數目上限。
每個資料集的指標數量 每個支援的區域:3 您可以在自動化模型評估任務中為每個資料集指定的指標數量上限。這包括自訂和內建指標。
模型評估任務中使用人類工作者的模型數量 每個支援的區域:2 您可以在使用人工的模型評估任務中指定的模型數量上限。
自動化模型評估任務中的模型數量 每個受支援的區域:1 您可以在自動化模型評估任務中指定的模型數量上限。
自訂提示資料集中的提示數目 每個支援的區域:1,000 自訂提示資料集可以包含的提示數目上限。
每秒隨需 ApplyGuardrail 內容篩選政策文字單位 每個受支援的區域:25 每秒可為內容篩選政策處理的最大文字單位數
每秒隨需 ApplyGuardrail 拒絕的主題政策文字單位數 每個受支援的區域:25 每秒可針對被拒絕的主題政策處理的最大文字單位數
每秒隨需 ApplyGuardrail 敏感資訊篩選條件政策文字單位 每個受支援的區域:25 每秒可針對敏感資訊篩選條件政策處理的文字單位數目上限
每秒的隨需 ApplyGuardrail Word 篩選條件政策文字單位 每個受支援的區域:25 每秒可針對 Word 篩選條件政策處理的文字單位數目上限。
每秒隨需 ApplyGuardrail 內容接地政策文字單位

us-east-1:106

us-west-2:106

每個其他支援的 區域:53

每秒可為內容接地政策處理的文字單位數目上限
每秒的隨需 ApplyGuardrail 請求數 每個受支援的區域:25 每秒允許的呼叫數量 ApplyGuardrail API上限
AI21 實驗室 Jamba 1.5 的每分鐘隨需 InvokeModel 請求 每個受支援的區域:100 針對 AI21 Labs Jamba 1.5,您可以在一分鐘內呼叫模型推論的次數上限。配額會考慮 Converse 和 的請求加總 InvokeModel
AI21 Labs Jamba Instruct 的每分鐘隨需 InvokeModel 請求 每個受支援的區域:100 您可以呼叫 Labs AI21 Jamba Instruct 在一分鐘內模型推論的次數上限。配額會考慮 Converse 和 的請求加總 InvokeModel
AI21 實驗室 Jamba Large 1.5 的每分鐘隨需 InvokeModel 請求 每個受支援的區域:100 您可以呼叫 AI21 Labs Jamba Large 1.5 在一分鐘內模型推論的次數上限。配額會考慮 Converse 和 的請求加總 InvokeModel
AI21 實驗室 Jurassic-2 Mid 的每分鐘隨需 InvokeModel 請求 每個支援的區域:400 您可以在一分鐘 InvokeModelWithResponseStream 內呼叫 InvokeModel 和 的次數上限。配額會考慮 AI21 Labs Jurassic-2 Mid 的 InvokeModel 和 InvokeModelWithResponseStream 請求的合併總和
AI21 實驗室 Jurassic-2 Ultra 的每分鐘隨需 InvokeModel 請求 每個受支援的區域:100 您可以在一分鐘 InvokeModelWithResponseStream 內呼叫 InvokeModel 和 的次數上限。配額會考量 AI21 Labs Jurassic-2 Ultra 的 InvokeModel 和 InvokeModelWithResponseStream 請求的合併總和
Amazon Titan Image Generator G1 的每分鐘隨需 InvokeModel 請求 每個支援的區域:60 Amazon Titan Image Generator G1 在一分鐘 InvokeModel 內可以呼叫的次數上限。
Amazon Titan Image Generator G1 V2 的每分鐘隨需 InvokeModel 請求 每個支援的區域:60 Amazon Titan Image Generator G V2 在一分鐘 InvokeModel 內可以呼叫的次數上限。
Amazon Titan 多模式內嵌 G1 的每分鐘隨需 InvokeModel 請求 每個受支援的區域:2,000 Amazon Titan 多模式內嵌 G1 在一分鐘 InvokeModel 內可以呼叫的次數上限。
Amazon Titan 文字內嵌的每分鐘隨需 InvokeModel 請求 每個受支援的區域:2,000 您可以在一分鐘 InvokeModel 內為 Amazon Titan Text Embeddings 呼叫的次數上限
Amazon Titan Text Embeddings V2 的每分鐘隨需 InvokeModel 請求 每個受支援的區域:2,000 Amazon Titan Text Embeddings V2 一分鐘 InvokeModel 內可以呼叫的次數上限
Amazon Titan Text Express 每分鐘的隨需 InvokeModel 請求 每個支援的區域:400 您可以在一分鐘 InvokeModelWithResponseStream 內呼叫 InvokeModel 和 的次數上限。配額會考慮 Amazon Titan Text Express 的 InvokeModel 和 InvokeModelWithResponseStream 請求的合併總和
Amazon Titan Text Lite 每分鐘的隨需 InvokeModel 請求 每個支援的區域:800 您可以在一分鐘 InvokeModelWithResponseStream 內呼叫 InvokeModel 和 的次數上限。配額會考慮 Amazon Titan Text Lite 的 InvokeModel 和 InvokeModelWithResponseStream 請求的合併總和
Amazon Titan Text Premier 每分鐘的隨需 InvokeModel 請求 每個受支援的區域:100 您可以在一分鐘 InvokeModelWithResponseStream 內呼叫 InvokeModel 和 的次數上限。配額會考慮 Amazon Titan Text Premier 的 InvokeModel 和 InvokeModelWithResponseStream 請求的合併總和
Anthropic Claude 3 Haiku 每分鐘的隨需 InvokeModel 請求

us-east-1:1,000

us-west-2:1,000

ap-northeast-1:200

ap-southeast-1:200

每個其他支援的 區域:400

您可以在一分鐘 InvokeModelWithResponseStream 內呼叫 InvokeModel 和 的次數上限。配額會考量 Anthropic Claude 3 Haiku 的 InvokeModel 和 InvokeModelWithResponseStream 權杖合併總和。
Anthropic Claude 3 Opus 的每分鐘隨需 InvokeModel 請求 每個受支援的區域:50 您可以在一分鐘 InvokeModelWithResponseStream 內呼叫 InvokeModel 和 的次數上限。配額會考量 Anthropic Claude 3 Opus 的 InvokeModel 和 InvokeModelWithResponseStream 請求合併總和。
Anthropic Claude 3 Sonnet 每分鐘的隨需 InvokeModel 請求

us-east-1:500

us-west-2:500

每個其他支援的 區域:100

您可以在一分鐘 InvokeModelWithResponseStream 內呼叫 InvokeModel 和 的次數上限。配額會考慮 Anthropic Claude 3 Sonnet 的 InvokeModel 和 InvokeModelWithResponseStream 請求的合併總和。
Anthropic Claude 3.5 Sonnet 每分鐘的隨需 InvokeModel 請求

us-east-1:50

us-east-2:50

us-west-2:250

ap-northeast-2:50

ap-southeast-2:50

每個其他支援的 區域:20

Anthropic Claude 3.5 Sonnet 在一分鐘內可以呼叫模型推論的次數上限。配額會考慮 Converse ConverseStream InvokeModel 和 的合併總和 InvokeModelWithResponseStream。
Anthropic Claude 3.5 Sonnet V2 的每分鐘隨需 InvokeModel 請求 每個受支援的區域:250 Anthropic Claude 3.5 Sonnet V2 在一分鐘內可以呼叫模型推論的次數上限。配額會考慮 Converse ConverseStream InvokeModel 和 的合併總和 InvokeModelWithResponseStream。
Anthropic Claude Instant 每分鐘的隨需 InvokeModel 請求

us-east-1:1,000

us-west-2:1,000

每個其他支援的 區域:400

您可以在一分鐘 InvokeModelWithResponseStream 內呼叫 InvokeModel 和 的次數上限。配額會考慮 Anthropic Claude Instant 的 InvokeModel 和 InvokeModelWithResponseStream 請求的合併總和
Anthropic Claude V2 的每分鐘隨需 InvokeModel 請求

us-east-1:500

us-west-2:500

每個其他支援的 區域:100

您可以在一分鐘 InvokeModelWithResponseStream 內呼叫 InvokeModel 和 的次數上限。配額會考量 Anthropic Claude V2 的 InvokeModel 和 InvokeModelWithResponseStream 請求的合併總和
Cohere Command 的每分鐘隨需 InvokeModel 請求 每個支援的區域:400 您可以在一分鐘 InvokeModelWithResponseStream 內呼叫 InvokeModel 和 的次數上限。配額會考慮 Cohere Command 的 InvokeModel 和 InvokeModelWithResponseStream 請求的合併總和。
Cohere Command Light 每分鐘的隨需 InvokeModel 請求 每個支援的區域:800 您可以在一分鐘 InvokeModelWithResponseStream 內呼叫 InvokeModel 和 的次數上限。配額會考慮 Cohere Command Light 的 InvokeModel 和 InvokeModelWithResponseStream 請求的合併總和。
Cohere Command R 的每分鐘隨需 InvokeModel 請求 每個支援的區域:400 您可以在一分鐘 InvokeModelWithResponseStream 內呼叫 InvokeModel 和 的次數上限。配額會考慮 Cohere Command R 128k 的 InvokeModel 和 InvokeModelWithResponseStream 請求的合併總和。
Cohere Command R Plus 的每分鐘隨需 InvokeModel 請求 每個支援的區域:400 您可以在一分鐘 InvokeModelWithResponseStream 內呼叫 InvokeModel 和 的次數上限。配額會考量 Cohere Command R Plus 128k 的 InvokeModel 和 InvokeModelWithResponseStream 請求的合併總和。
Cohere Embed English 的每分鐘隨需 InvokeModel 請求 每個受支援的區域:2,000 Cohere Embed English 在一分鐘 InvokeModel 內可以呼叫的次數上限。
Cohere Embed Multiling 的每分鐘隨需 InvokeModel 請求 每個受支援的區域:2,000 您可以在一分鐘 InvokeModel 內呼叫 Cohere Embed Multilingual 的最大次數。
Meta Llama 2 13B 的每分鐘隨需 InvokeModel 請求 每個支援的區域:800 您可以在一分鐘 InvokeModelWithResponseStream 內呼叫 InvokeModel 和 的次數上限。配額會考量 Meta Llama 2 13B 的 InvokeModel 和 InvokeModelWithResponseStream 請求的合併總和。
Meta Llama 2 70B 的每分鐘隨需 InvokeModel 請求 每個支援的區域:400 您可以在一分鐘 InvokeModelWithResponseStream 內呼叫 InvokeModel 和 的次數上限。配額會考量 Meta Llama 2 70B 的 InvokeModel 和 InvokeModelWithResponseStream 請求的合併總和。
Meta Llama 2 Chat 13B 的每分鐘隨需 InvokeModel 請求 每個支援的區域:800 您可以在一分鐘 InvokeModelWithResponseStream 內呼叫 InvokeModel 和 的次數上限。配額會考量 Meta Llama 2 Chat 13B 的 InvokeModel 和 InvokeModelWithResponseStream 請求的合併總和。
Meta Llama 2 Chat 70B 的每分鐘隨需 InvokeModel 請求 每個支援的區域:400 您可以在一分鐘 InvokeModelWithResponseStream 內呼叫 InvokeModel 和 的次數上限。配額會考量 Meta Llama 2 Chat 70B 的 InvokeModel 和 InvokeModelWithResponseStream 請求的合併總和。
Meta Llama 3 70B 指示的每分鐘隨需 InvokeModel 請求 每個支援的區域:400 您可以在一分鐘 InvokeModelWithResponseStream 內呼叫 InvokeModel 和 的次數上限。配額會考量 Meta Llama 3 70B Instruct 的 InvokeModel 和 InvokeModelWithResponseStream 請求的合併總和。
Meta Llama 3 8B 指示的每分鐘隨需 InvokeModel 請求 每個支援的區域:800 您可以在一分鐘 InvokeModelWithResponseStream 內呼叫 InvokeModel 和 的次數上限。配額會考量 Meta Llama 3 8B Instruct 的 InvokeModel 和 InvokeModelWithResponseStream 請求合併總和。
Mistral 7B Instruct 每分鐘的隨需 InvokeModel 請求 每個支援的區域:800 對於 Mistral Mistral-7b-instruct-v0,一分鐘 InvokeModel 內可以呼叫的次數上限
Mistral AI Mistral Small 每分鐘的隨需 InvokeModel 請求 每個支援的區域:400 對於 Mistral AI Mistral Small,您可以在一分鐘 InvokeModel InvokeModelWithResponseStream 內呼叫的次數上限
Mistral Large 每分鐘的隨需 InvokeModel 請求 每個支援的區域:400 您可以呼叫的次數上限 InvokeModel ,以及 Mistral mistral-large-2402-v1 InvokeModelWithResponseStream 一分鐘內呼叫的次數上限
Mistral Mixtral 8x7b 指示的每分鐘隨需 InvokeModel 請求 每個支援的區域:400 對於 Mistral mixtral-8x7b-v0,一分鐘 InvokeModel 內可以呼叫的次數上限
Stability.ai Stable Diffusion 3 Large 的每分鐘隨需 InvokeModel 請求 每個受支援的區域:15 Stability.ai Stable Diffusion 3 Large 一分鐘 InvokeModel 內可呼叫的次數上限。
Stability.ai Stable Diffusion 3 Medium 的每分鐘隨需 InvokeModel 請求 每個支援的區域:60 Stability.ai Stable Diffusion 3 Medium 在一分鐘 InvokeModel 內可以呼叫的次數上限
Stability.ai Stable Diffusion XL 0.8 的每分鐘隨需 InvokeModel 請求 每個支援的區域:60 Stability.ai Stable Diffusion XL 0.8 在一分鐘 InvokeModel 內可以呼叫的次數上限
Stability.ai Stable Diffusion XL 1.0 的每分鐘隨需 InvokeModel 請求 每個支援的區域:60 Stability.ai Stable Diffusion XL 1.0 在一分鐘 InvokeModel 內可以呼叫的次數上限
Stability.ai Stable Image Core 的每分鐘隨需 InvokeModel 請求 每個支援的區域:90 您可以呼叫 Stability.ai Stable Image Core 在一分鐘 InvokeModel 內的最大次數。
Stability.ai Stable Image Ultra 的每分鐘隨需 InvokeModel 請求 每個受支援的區域:10 Stability.ai Stable Image Ultra 一分鐘 InvokeModel 內可呼叫的次數上限。
AI21 Labs Jamba 1.5 的每分鐘隨需 InvokeModel 權杖數。 每個支援的區域:300,000 您可以在一分鐘內為 AI21 Labs Jamba 1.5 提交模型推論的權杖數量上限。配額會考慮 Converse 和 的權杖組合總和 InvokeModel。
AI21 Labs Jamba Instruct 的每分鐘隨需 InvokeModel 權杖數 每個支援的區域:300,000 一分鐘內可針對 AI21 Labs Jamba Instruct 提交模型推論的權杖數量上限。配額會考慮 Converse 和 的權杖加總 InvokeModel
AI21 Labs Jamba Large 1.5 的每分鐘隨需 InvokeModel 權杖數。 每個支援的區域:300,000 一分鐘內可針對 AI21 Labs Jamba Large 1.5 提交模型推論的權杖數量上限。配額會考慮 Converse 和 的權杖組合總和 InvokeModel。
AI21 Labs Jurassic-2 Mid 的每分鐘隨需 InvokeModel 權杖數 每個支援的區域:300,000 您可以為 AI21 Labs Jurassic-2 Mid 在一分鐘 InvokeModel 內提供的字符數量上限。
AI21 Labs Jurassic-2 Ultra 的每分鐘隨需 InvokeModel 權杖數 每個支援的區域:300,000 您可以在一分鐘 InvokeModel 內為 AI21 Labs Jurassic-2 Ultra 提供的字符數量上限。
Amazon Titan Image Generator G1 的每分鐘隨需 InvokeModel 權杖數量 每個受支援的區域:2,000 您可以在一分鐘 InvokeModel 內為 Amazon Titan Image Generator G1 提供的最大權杖數量。
Amazon Titan Image Generator G1 V2 的每分鐘隨需 InvokeModel 權杖數量 每個受支援的區域:2,000 您可以在一分鐘 InvokeModel 內為 Amazon Titan Image Generator G1 V2 提供的最大權杖數量。
Amazon Titan 多模式內嵌 G1 的每分鐘隨需 InvokeModel 權杖數量 每個支援的區域:300,000 您可以在一分鐘 InvokeModel 內為 Amazon Titan Multimodal Embeddings G1 提供的字符數量上限。
Amazon Titan 文字內嵌的每分鐘隨需 InvokeModel 權杖數 每個支援的區域:300,000 您可以在一分鐘 InvokeModel 內為 Amazon Titan Text Embeddings 提供的字符數量上限。
Amazon Titan Text Embeddings V2 的每分鐘隨需 InvokeModel 權杖數量 每個支援的區域:300,000 您可以在一分鐘 InvokeModel 內為 Amazon Titan Text Embeddings V2 提供的最大字符數量。
Amazon Titan Text Express 的每分鐘隨需 InvokeModel 權杖數量 每個支援的區域:300,000 您可以在一分鐘 InvokeModelWithResponseStream 內透過 InvokeModel 和 提供的權杖數量上限。配額會考慮 Amazon Titan Text Express 的 InvokeModel 和 InvokeModelWithResponseStream 權杖的合併總和。
Amazon Titan Text Lite 的每分鐘隨需 InvokeModel 權杖數量 每個支援的區域:300,000 您可以在一分鐘 InvokeModelWithResponseStream 內透過 InvokeModel 和 提供的權杖數量上限。配額會考量 Amazon Titan Text Lite 的 InvokeModel 和 InvokeModelWithResponseStream 權杖合併總和。
Amazon Titan Text Premier 的每分鐘隨需 InvokeModel 權杖數量 每個支援的區域:300,000 您可以在一分鐘 InvokeModelWithResponseStream 內透過 InvokeModel 和 提供的權杖數量上限。配額會考慮 Amazon Titan Text Premier 的 InvokeModel 和 InvokeModelWithResponseStream 權杖組合總和。
Anthropic Claude 3 Haiku 的每分鐘隨需 InvokeModel 權杖數量

us-east-1:2,000,000

us-west-2:2,000,000

ap-northeast-1:200,000

ap-southeast-1:200,000

每個其他支援的 區域:300,000

您可以在一分鐘 InvokeModelWithResponseStream 內透過 InvokeModel 和 提供的權杖數量上限。配額會考量 Anthropic Claude 3 Haiku 的 InvokeModel 和 InvokeModelWithResponseStream 權杖合併總和。
Anthropic Claude 3 Opus 的每分鐘隨需 InvokeModel 權杖數量 每個支援的區域:400,000 您可以在一分鐘 InvokeModelWithResponseStream 內透過 InvokeModel 和 提供的權杖數量上限。配額會考量 Anthropic Claude 3 Opus 的 InvokeModel 和 InvokeModelWithResponseStream 權杖合併總和。
Anthropic Claude 3 Sonnet 的每分鐘隨需 InvokeModel 權杖數量

us-east-1:1,000,000

us-west-2:1,000,000

每個其他支援的 區域:200,000

您可以在一分鐘 InvokeModelWithResponseStream 內透過 InvokeModel 和 提供的權杖數量上限。配額會考慮 Anthropic Claude 3 Sonnet 的 InvokeModel 和 InvokeModelWithResponseStream 權杖的合併總和。
Anthropic Claude 3.5 Sonnet 的每分鐘隨需 InvokeModel 權杖數量

us-east-1:400,000

us-east-2:400,000

us-west-2:2,000,000

ap-northeast-2:400,000

ap-southeast-2:400,000

每個其他支援的 區域:200,000

您可以在一分鐘內為 Anthropic Claude 3.5 Sonnet 提交模型推論的權杖數量上限。配額會考慮 Converse ConverseStream InvokeModel 和 的合併總和 InvokeModelWithResponseStream。
Anthropic Claude 3.5 Sonnet V2 的每分鐘隨需 InvokeModel 權杖數量

us-west-2:2,000,000

每個其他支援的 區域:400,000

您可以在一分鐘內為 Anthropic Claude 3.5 Sonnet V2 提交模型推論的權杖數量上限。配額會考慮 Converse ConverseStream InvokeModel 和 的合併總和 InvokeModelWithResponseStream。
Anthropic Claude Instant 的每分鐘隨需 InvokeModel 權杖數量

us-east-1:1,000,000

us-west-2:1,000,000

每個其他支援的 區域:300,000

您可以在一分鐘 InvokeModelWithResponseStream 內透過 InvokeModel 和 提供的權杖數量上限。配額會考慮 Anthropic Claude Instant 的 InvokeModel 和 InvokeModelWithResponseStream 權杖的合併總和。
Anthropic Claude V2 的每分鐘隨需 InvokeModel 權杖數量

us-east-1:500,000

us-west-2:500,000

每個其他支援的 區域:200,000

您可以在一分鐘 InvokeModelWithResponseStream 內透過 InvokeModel 和 提供的權杖數量上限。配額會考量 Anthropic Claude V2 的 InvokeModel 和 InvokeModelWithResponseStream 權杖的合併總和。
Cohere Command 的每分鐘隨需 InvokeModel 權杖數 每個支援的區域:300,000 您可以在一分鐘 InvokeModelWithResponseStream 內透過 InvokeModel 和 提供的權杖數量上限。配額會考慮 Cohere Command 的 InvokeModel 和 InvokeModelWithResponseStream 權杖組合總和。
Cohere Command Light 的每分鐘隨需 InvokeModel 權杖數 每個支援的區域:300,000 您可以在一分鐘 InvokeModel 內為 Cohere Command Light 提供的最大字符數量。
Cohere Command R 的每分鐘隨需 InvokeModel 權杖數 每個支援的區域:300,000 您可以在一分鐘 InvokeModelWithResponseStream 內透過 InvokeModel 和 提供的權杖數量上限。配額會考慮 Cohere Command R 128k 的 InvokeModel 和 InvokeModelWithResponseStream 權杖的合併總和。
Cohere Command R Plus 的每分鐘隨需 InvokeModel 權杖數 每個支援的區域:300,000 您可以在一分鐘 InvokeModelWithResponseStream 內透過 InvokeModel 和 提供的權杖數量上限。配額會考慮 Cohere Command R Plus 128k 的 InvokeModel 和 InvokeModelWithResponseStream 權杖的合併總和。
Cohere Embed English 的每分鐘隨需 InvokeModel 權杖數 每個支援的區域:300,000 您可以在一分鐘 InvokeModel 內為 Cohere Embed English 提供的字符數量上限。
Cohere Embed Multilingual 的每分鐘隨需 InvokeModel 權杖數 每個支援的區域:300,000 您可以在一分鐘 InvokeModel 內為 Cohere Embed Multilingual 提供的最大字符數量。
Meta Llama 2 13B 的每分鐘隨需 InvokeModel 權杖數量 每個支援的區域:300,000 您可以在一分鐘 InvokeModelWithResponseStream 內透過 InvokeModel 和 提供的權杖數量上限。配額會考慮 Meta Llama 2 13B 的 InvokeModel 和 InvokeModelWithResponseStream 權杖的合併總和。
Meta Llama 2 70B 的每分鐘隨需 InvokeModel 權杖數量 每個支援的區域:300,000 您可以在一分鐘 InvokeModelWithResponseStream 內透過 InvokeModel 和 提供的權杖數量上限。配額會考量 Meta Llama 2 70B 的 InvokeModel 和 InvokeModelWithResponseStream 權杖的合併總和。
Meta Llama 2 Chat 13B 的每分鐘隨需 InvokeModel 權杖數量 每個支援的區域:300,000 您可以在一分鐘 InvokeModelWithResponseStream 內透過 InvokeModel 和 提供的權杖數量上限。配額會考量 Meta Llama 2 Chat 13B 的 InvokeModel 和權 InvokeModelWithResponseStream 杖合併總和。
Meta Llama 2 Chat 70B 的每分鐘隨需 InvokeModel 權杖數量 每個支援的區域:300,000 您可以在一分鐘 InvokeModelWithResponseStream 內透過 InvokeModel 和 提供的權杖數量上限。配額會考量 Meta Llama 2 Chat 70B 的 InvokeModel 和 InvokeModelWithResponseStream 權杖的合併總和。
Meta Llama 3 70B 指示的每分鐘隨需 InvokeModel 權杖數 每個支援的區域:300,000 您可以在一分鐘 InvokeModelWithResponseStream 內透過 InvokeModel 和 提供的權杖數量上限。配額會考量 Meta Llama 3 70B Instruct 的 InvokeModel 和 InvokeModelWithResponseStream 權杖組合總和。
Meta Llama 3 8B 指示的每分鐘隨需 InvokeModel 權杖數 每個支援的區域:300,000 您可以在一分鐘 InvokeModelWithResponseStream 內透過 InvokeModel 和 提供的權杖數量上限。配額會考量 Meta Llama 3 8B Instruct 的 InvokeModel 和 InvokeModelWithResponseStream 權杖組合總和。
Mistral AI Mistral 7B Instruct 的每分鐘隨需 InvokeModel 權杖數量 每個支援的區域:300,000 您可以在一分鐘 InvokeModelWithResponseStream 內透過 InvokeModel 和 提供的權杖數量上限。配額會考量 Mistral AI Mistral 7B Instruct 的 InvokeModel 和權 InvokeModelWithResponseStream 杖合併總和。
Mistral AI Mistral Large 的每分鐘隨需 InvokeModel 權杖數量 每個支援的區域:300,000 您可以在一分鐘 InvokeModelWithResponseStream 內透過 InvokeModel 和 提供的權杖數量上限。配額會考量 Mistral AI Mistral Large 的 InvokeModel 和 InvokeModelWithResponseStream 權杖合併總和。
Mistral AI Mistral Small 的每分鐘隨需 InvokeModel 權杖 每個支援的區域:300,000 您可以在一分鐘 InvokeModelWithResponseStream 內透過 InvokeModel 和 提供的權杖數量上限。配額會考量 Mistral AI Mistral Small 的 InvokeModel 和 InvokeModelWithResponseStream 權杖合併總和。
Mistral AI Mixtral 8X7BB 指示的每分鐘隨需 InvokeModel 權杖 每個支援的區域:300,000 您可以在一分鐘 InvokeModelWithResponseStream 內透過 InvokeModel 和 提供的權杖數量上限。配額會考慮 Mistral mixtral-8x7b-instruct-v0 的 InvokeModel 和 InvokeModelWithResponseStream 權杖的合併總和。
Meta Llama 3.1 405B 指示的每分鐘隨需模型推論請求 每個受支援的區域:200 Meta Llama 3.1 405B 指示在一分鐘內可以呼叫模型推論的次數上限。配額會考慮 InvokeModel、 InvokeModelWithResponseStream、Converse 和 的請求總和 ConverseStream。
Meta Llama 3.1 70B 指示的每分鐘隨需模型推論請求 每個支援的區域:400 Meta Llama 3.1 70B Instruct 在一分鐘內可以呼叫模型推論的次數上限。配額會考慮 InvokeModel、 InvokeModelWithResponseStream、Converse 和 的請求總和 ConverseStream。
Meta Llama 3.1 8B Instruct 的每分鐘隨需模型推論請求 每個支援的區域:800 對於 Meta Llama 3.1 8B Instruct,您可以在一分鐘內呼叫模型推論的次數上限。配額會考慮 InvokeModel、 InvokeModelWithResponseStream、Converse 和 的請求總和 ConverseStream。
Meta Llama 3.2 11B 指示的每分鐘隨需模型推論請求 每個支援的區域:400 Meta Llama 3.2 11B Instruct 在一分鐘內可以呼叫模型推論的次數上限。配額會考慮 InvokeModel、 InvokeModelWithResponseStream、Converse 和 的請求總和 ConverseStream。
Meta Llama 3.2 1B 指示的每分鐘隨需模型推論請求 每個支援的區域:800 Meta Llama 3.2 1B 指示在一分鐘內可以呼叫模型推論的次數上限。配額會考慮 InvokeModel、 InvokeModelWithResponseStream、Converse 和 的請求總和 ConverseStream。
Meta Llama 3.2 3B 指示的每分鐘隨需模型推論請求 每個支援的區域:800 Meta Llama 3.2 3B Instruct 在一分鐘內可以呼叫模型推論的次數上限。配額會考慮 InvokeModel、 InvokeModelWithResponseStream、Converse 和 的請求總和 ConverseStream。
Meta Llama 3.2 90B 指示的每分鐘隨需模型推論請求 每個支援的區域:400 Meta Llama 3.2 90B Instruct 在一分鐘內可以呼叫模型推論的次數上限。配額會考慮 InvokeModel、 InvokeModelWithResponseStream、Converse 和 的請求總和 ConverseStream。
Mistral Large 2407 的每分鐘隨需模型推論請求 每個支援的區域:400 對於 Mistral Large 2407,您可以在一分鐘內呼叫模型推論的次數上限。配額會考量 InvokeModel、 InvokeModelWithResponseStream、Converse 和 的請求總和 ConverseStream
Meta Llama 3.1 8B 指示的每分鐘隨需模型推論權杖 每個支援的區域:300,000 一分鐘內可以為 Meta Llama 3.1 8B Instruct 提交模型推論的權杖數量上限。配額會考慮 InvokeModel、 InvokeModelWithResponseStream、Converse 和 的權杖總和 ConverseStream。
Meta Llama 3.2 11B 指示的每分鐘隨需模型推論權杖 每個支援的區域:300,000 一分鐘內可以為 Meta Llama 3.2 11B Instruct 提交模型推論的權杖數量上限。配額會考慮 InvokeModel、 InvokeModelWithResponseStream、Converse 和 的權杖總和 ConverseStream。
Meta Llama 3.2 1B 指示的每分鐘隨需模型推論權杖 每個支援的區域:300,000 您可以在一分鐘內為 Meta Llama 3.2 1B Instruct 提交模型推論的權杖數量上限。配額會考慮 InvokeModel、 InvokeModelWithResponseStream、Converse 和 的權杖總和 ConverseStream。
Meta Llama 3.2 3B 指示的每分鐘隨需模型推論權杖 每個支援的區域:300,000 您可以在一分鐘內為 Meta Llama 3.2 3B Instruct 提交模型推論的權杖數量上限。配額會考慮 InvokeModel、 InvokeModelWithResponseStream、Converse 和 的權杖總和 ConverseStream。
Meta Llama 3.2 90B 指示的每分鐘隨需模型推論權杖 每個支援的區域:300,000 您可以在一分鐘內為 Meta Llama 3.2 90B Instruct 提交模型推論的權杖數量上限。配額會考慮 InvokeModel、 InvokeModelWithResponseStream、Converse 和 的權杖總和 ConverseStream。
Mistral Large 2407 的每分鐘隨需模型推論權杖 每個支援的區域:300,000 對於 Mistral Large 2407,您可以在一分鐘內提交模型推論的權杖數量上限。配額會考慮 InvokeModel、 InvokeModelWithResponseStream、Converse 和 的權杖加總 ConverseStream
適用於 Meta Llama 3.1 405B Instruct 的每分鐘隨需模型推論權杖 每個支援的區域:400,000 一分鐘內可以為 Meta Llama 3.1 405B Instruct 提交模型推論的權杖數量上限。配額會考慮 InvokeModel、 InvokeModelWithResponseStream、Converse 和 的權杖總和 ConverseStream。
適用於 Meta Llama 3.1 70B Instruct 的每分鐘隨需模型推論權杖 每個支援的區域:300,000 一分鐘內可以為 Meta Llama 3.1 70B Instruct 提交模型推論的權杖數量上限。配額會考慮 InvokeModel、 InvokeModelWithResponseStream、Converse 和 的權杖總和 ConverseStream。
每個流程的輸出節點 每個受支援的區域:10 流程輸出節點的數量上限。
每個函數的參數 每個受支援的區域:5 您可以在動作群組函數中擁有的參數數目上限。
PrepareAgent 每秒請求數 每個支援的區域:2 每秒請求數 PrepareAgent API上限。
PrepareFlow 每秒請求數 每個支援的區域:2 每秒 PrepareFlow 請求數上限。
每個流程的提示節點 每個受支援的區域:10 提示節點的數量上限。
每個帳戶的提示數 每個受支援的區域:50 提示數目上限。
每個批次推論任務的記錄 每個支援的區域:50,000 批次推論任務中所有輸入檔案的記錄數目上限。
每個批次推論任務每個輸入檔案的記錄 每個支援的區域:50,000 批次推論任務中輸入檔案中的記錄數目上限。
敏感資訊篩選條件中的 Regex 實體 每個受支援的區域:10 可以包含在單字政策中的 guardrail 篩選條件 regexe 數目上限
字元的 Regex 長度 每個受支援的區域:500 防護欄篩選條件 regex 的長度上限,以字元為單位
擷取每秒請求 每個受支援的區域:5 每秒擷取API請求數上限。
RetrieveAndGenerate 每秒請求數 每個受支援的區域:5 每秒請求數 RetrieveAndGenerate API上限。
每個流程的 S3 擷取節點 每個受支援的區域:10 S3 擷取節點的數量上限。
每個流程的 S3 儲存節點 每個受支援的區域:10 S3 儲存節點的數量上限。
排程的自訂任務 每個支援的區域:2 排程自訂任務的數量上限。
提示的大小 每個受支援的區域:4 個別提示的大小上限 (KB) 是自訂提示資料集。
StartIngestionJob 每秒請求數 每個支援的區域:0.1 每秒請求數 StartIngestionJob API上限。
使用基礎模型進行中和提交的批次推論任務總和 每個受支援的區域:10 使用基礎模型進行中和提交的批次推論任務數量上限。
使用自訂模型進行中和提交的批次推論任務總和 每個支援的區域:3 使用自訂模型進行中和提交的批次推論任務數量上限
Claude 3 Haiku v1 微調任務的訓練和驗證記錄總和 每個受支援的區域:10,000 Claude 3 Haiku 微調任務允許的訓練和驗證記錄合併數目上限。
Meta Llama 2 13B v1 微調任務的訓練和驗證記錄總和 每個受支援的區域:10,000 Meta Llama 2 13B 微調任務允許的訓練和驗證記錄合併數目上限。
Meta Llama 2 70B v1 微調任務的訓練和驗證記錄總和 每個受支援的區域:10,000 Meta Llama 2 70B 微調任務允許的訓練和驗證記錄合併數目上限。
Meta Llama 3.1 70B 指示 v1 微調任務的訓練和驗證記錄總和 每個受支援的區域:10,000 Meta Llama 3.1 70B 指示微調任務允許的訓練和驗證記錄合併數目上限。
Meta Llama 3.1 8B 指示 v1 微調任務的訓練和驗證記錄總和 每個受支援的區域:10,000 Meta Llama 3.1 8B 指示微調任務允許的訓練和驗證記錄合併數目上限。
Titan Image Generator G1 V1 微調任務的訓練和驗證記錄總和 每個受支援的區域:10,000 Titan Image Generator 微調工作允許的訓練和驗證記錄合併數目上限。
Titan Image Generator G1 V2 微調任務的訓練和驗證記錄總和 每個受支援的區域:10,000 Titan Image Generator V2 微調工作允許的訓練和驗證記錄合併數目上限。
Titan 多模式內嵌 G1 v1 微調任務的訓練和驗證記錄總和 每個支援的區域:50,000 Titan Multimodal Embeddings Fine-tuning 任務允許的訓練和驗證記錄合併數目上限。
Titan Text G1 - Express v1 繼續訓練前任務的訓練和驗證記錄總和 每個支援的區域:100,000 Titan Text Express 繼續訓練前任務允許的訓練和驗證記錄合併數目上限。
Titan Text G1 - Express v1 微調任務的訓練和驗證記錄總和 每個受支援的區域:10,000 Titan Text Express 微調任務允許的訓練和驗證記錄合併數目上限。
Titan Text G1 - Lite v1 繼續訓練前任務的訓練和驗證記錄總和 每個支援的區域:100,000 Titan Text Lite 持續訓練前任務允許的訓練和驗證記錄合併數目上限。
Titan Text G1 - Lite v1 微調任務的訓練和驗證記錄總和 每個受支援的區域:10,000 Titan Text Lite 微調任務允許的訓練和驗證記錄合併數目上限。
Titan Text G1 - Premier v1 微調任務的訓練和驗證記錄總和 每個受支援的區域:20,000 Titan Text Premier 微調任務允許的訓練和驗證記錄合併數目上限。
工作者的任務時間 每個受支援的區域:30 工作者完成任務所需的時間長度上限 (以天為單位)。
每個護欄的主題 每個受支援的區域:30 跨 Guardrail 主題政策定義的主題數量上限
每個流程的總節點數 每個受支援的區域:40 流程中節點的數量上限。
UpdateAgent 每秒請求數 每個受支援的區域:4 每秒請求數 UpdateAgent API上限。
UpdateAgentActionGroup 每秒請求數 每個受支援的區域:6 每秒請求數 UpdateAgentActionGroup API上限
UpdateAgentAlias 每秒請求數 每個支援的區域:2 每秒請求數 UpdateAgentAlias API上限。
UpdateAgentKnowledgeBase 每秒請求數 每個受支援的區域:4 每秒請求數 UpdateAgentKnowledgeBase API上限。
UpdateDataSource 每秒請求數 每個支援的區域:2 每秒請求數 UpdateDataSource API上限。
UpdateFlow 每秒請求數 每個支援的區域:2 每秒 UpdateFlow 請求數上限。
UpdateFlowAlias 每秒請求數 每個支援的區域:2 每秒 UpdateFlowAlias 請求數上限。
UpdateKnowledgeBase 每秒請求數 每個支援的區域:2 每秒請求數 UpdateKnowledgeBase API上限。
UpdatePrompt 每秒請求數 每個支援的區域:2 每秒 UpdatePrompt 請求數上限。
使用者查詢大小 每個支援的區域:1,000 使用者查詢的大小上限 (以字元為單位)。
ValidateFlowDefinition 每秒請求數 每個支援的區域:2 每秒 ValidateFlowDefinition 請求數上限。
每個護欄的版本 每個受支援的區域:20 護欄可擁有的版本數量上限
每個提示的版本 每個受支援的區域:10 每個提示的版本數量上限。
字元的字長度 每個受支援的區域:100 封鎖字清單中單字的長度上限,以字元表示
每個單字的單字政策 每個受支援的區域:10,000 可以包含在封鎖字清單中的字數上限