Amazon Bedrock 端點和配額

若要以程式設計方式連線至 AWS 服務，您可以使用 endpoint. AWS services，在服務支援的部分或全部 AWS 區域中提供下列端點類型：IPv4 端點、雙堆疊端點和 FIPS 端點。有些服務提供全域端點。如需詳細資訊，請參閱AWS 服務端點。

服務配額也稱為限制，是 AWS 您的帳戶的服務資源或操作數量上限。如需詳細資訊，請參閱AWS 服務配額。

以下是此服務的服務端點和服務配額。

Amazon Bedrock 服務端點

Amazon Bedrock 控制平面 APIs

下表提供 Amazon Bedrock 支援的區域特定端點清單，用於管理、訓練和部署模型。將這些端點用於 Amazon Bedrock API 操作。

區域名稱	區域	端點	通訊協定
美國東部 (俄亥俄)	us-east-2	bedrock.us-east-2.amazonaws.com bedrock-fips.us-east-2.amazonaws.com	HTTPS HTTPS
美國東部 (維吉尼亞北部)	us-east-1	bedrock.us-east-1.amazonaws.com bedrock-fips.us-east-1.amazonaws.com	HTTPS HTTPS
美國西部 (加利佛尼亞北部)	us-west-1	bedrock.us-west-1.amazonaws.com bedrock-fips.us-west-1.amazonaws.com	HTTPS HTTPS
美國西部 (奧勒岡)	us-west-2	bedrock.us-west-2.amazonaws.com bedrock-fips.us-west-2.amazonaws.com	HTTPS HTTPS
Africa (Cape Town)	af-south-1	bedrock.af-south-1.amazonaws.com	HTTPS
亞太區域 (海德拉巴)	ap-south-2	bedrock.ap-south-2.amazonaws.com	HTTPS
亞太區域 (雅加達)	ap-southeast-3	bedrock.ap-southeast-3.amazonaws.com	HTTPS
亞太地區 (馬來西亞)	ap-southeast-5	bedrock.ap-southeast-5.amazonaws.com	HTTPS
亞太區域 (墨爾本)	ap-southeast-4	bedrock.ap-southeast-4.amazonaws.com	HTTPS
亞太區域 (孟買)	ap-south-1	bedrock.ap-south-1.amazonaws.com	HTTPS
亞太區域 (紐西蘭)	ap-southeast-6	bedrock.ap-southeast-6.amazonaws.com	HTTPS
亞太區域 (大阪)	ap-northeast-3	bedrock.ap-northeast-3.amazonaws.com	HTTPS
亞太區域 (首爾)	ap-northeast-2	bedrock.ap-northeast-2.amazonaws.com	HTTPS
亞太區域 (新加坡)	ap-southeast-1	bedrock.ap-southeast-1.amazonaws.com	HTTPS
亞太地區 (悉尼)	ap-southeast-2	bedrock.ap-southeast-2.amazonaws.com	HTTPS
亞太區域 (台北)	ap-east-2	bedrock.ap-east-2.amazonaws.com	HTTPS
亞太區域 (泰國)	ap-southeast-7	bedrock.ap-southeast-7.amazonaws.com	HTTPS
亞太區域 (東京)	ap-northeast-1	bedrock.ap-northeast-1.amazonaws.com	HTTPS
加拿大 (中部)	ca-central-1	bedrock.ca-central-1.amazonaws.com bedrock-fips.ca-central-1.amazonaws.com	HTTPS HTTPS
加拿大西部 (卡加利)	ca-west-1	bedrock.ca-west-1.amazonaws.com bedrock-fips.ca-west-1.amazonaws.com	HTTPS HTTPS
歐洲 (法蘭克福)	eu-central-1	bedrock.eu-central-1.amazonaws.com	HTTPS
歐洲 (愛爾蘭)	eu-west-1	bedrock.eu-west-1.amazonaws.com	HTTPS
歐洲 (倫敦)	eu-west-2	bedrock.eu-west-2.amazonaws.com	HTTPS
歐洲 (米蘭)	eu-south-1	bedrock.eu-south-1.amazonaws.com	HTTPS
歐洲 (巴黎)	eu-west-3	bedrock.eu-west-3.amazonaws.com	HTTPS
歐洲 (西班牙)	eu-south-2	bedrock.eu-south-2.amazonaws.com	HTTPS
歐洲 (斯德哥爾摩)	eu-north-1	bedrock.eu-north-1.amazonaws.com	HTTPS
歐洲 (蘇黎世)	eu-central-2	bedrock.eu-central-2.amazonaws.com	HTTPS
以色列 (特拉維夫)	il-central-1	bedrock.il-central-1.amazonaws.com	HTTPS
墨西哥 (中部)	mx-central-1	bedrock.mx-central-1.amazonaws.com	HTTPS
中東 (巴林)	me-south-1	bedrock.me-south-1.amazonaws.com	HTTPS
中東 (阿拉伯聯合大公國)	me-central-1	bedrock.me-central-1.amazonaws.com	HTTPS
南美洲 (聖保羅)	sa-east-1	bedrock.sa-east-1.amazonaws.com	HTTPS
AWS GovCloud （美國東部）	us-gov-east-1	bedrock.us-gov-east-1.amazonaws.com bedrock-fips.us-gov-east-1.amazonaws.com	HTTPS HTTPS
AWS GovCloud （美國西部）	us-gov-west-1	bedrock.us-gov-west-1.amazonaws.com bedrock-fips.us-gov-west-1.amazonaws.com	HTTPS HTTPS

Amazon Bedrock 執行時間 APIs

下表提供 Amazon Bedrock 支援的區域特定端點清單，用於對 Amazon Bedrock 中託管的模型提出推論請求。將這些端點用於 Amazon Bedrock 執行期 API 操作。

區域名稱	區域	端點	通訊協定
美國東部 (俄亥俄)	us-east-2	bedrock-runtime.us-east-2.amazonaws.com bedrock-runtime-fips.us-east-2.amazonaws.com	HTTPS HTTPS
美國東部 (維吉尼亞北部)	us-east-1	bedrock-runtime.us-east-1.amazonaws.com bedrock-runtime-fips.us-east-1.amazonaws.com	HTTPS HTTPS
美國西部 (奧勒岡)	us-west-2	bedrock-runtime.us-west-2.amazonaws.com bedrock-runtime-fips.us-west-2.amazonaws.com	HTTPS HTTPS
亞太區域 (海德拉巴)	ap-south-2	bedrock-runtime.ap-south-2.amazonaws.com	HTTPS
亞太區域 (孟買)	ap-south-1	bedrock-runtime.ap-south-1.amazonaws.com	HTTPS
亞太區域 (大阪)	ap-northeast-3	bedrock-runtime.ap-northeast-3.amazonaws.com	HTTPS
亞太區域 (首爾)	ap-northeast-2	bedrock-runtime.ap-northeast-2.amazonaws.com	HTTPS
亞太區域 (新加坡)	ap-southeast-1	bedrock-runtime.ap-southeast-1.amazonaws.com	HTTPS
亞太地區 (悉尼)	ap-southeast-2	bedrock-runtime.ap-southeast-2.amazonaws.com	HTTPS
亞太區域 (東京)	ap-northeast-1	bedrock-runtime.ap-northeast-1.amazonaws.com	HTTPS
加拿大 (中部)	ca-central-1	bedrock-runtime.ca-central-1.amazonaws.com bedrock-runtime-fips.ca-central-1.amazonaws.com	HTTPS HTTPS
歐洲 (法蘭克福)	eu-central-1	bedrock-runtime.eu-central-1.amazonaws.com	HTTPS
歐洲 (愛爾蘭)	eu-west-1	bedrock-runtime.eu-west-1.amazonaws.com	HTTPS
歐洲 (倫敦)	eu-west-2	bedrock-runtime.eu-west-2.amazonaws.com	HTTPS
歐洲 (米蘭)	eu-south-1	bedrock-runtime.eu-south-1.amazonaws.com	HTTPS
歐洲 (巴黎)	eu-west-3	bedrock-runtime.eu-west-3.amazonaws.com	HTTPS
歐洲 (西班牙)	eu-south-2	bedrock-runtime.eu-south-2.amazonaws.com	HTTPS
歐洲 (斯德哥爾摩)	eu-north-1	bedrock-runtime.eu-north-1.amazonaws.com	HTTPS
歐洲 (蘇黎世)	eu-central-2	bedrock-runtime.eu-central-2.amazonaws.com	HTTPS
南美洲 (聖保羅)	sa-east-1	bedrock-runtime.sa-east-1.amazonaws.com	HTTPS
AWS GovCloud （美國東部）	us-gov-east-1	bedrock-runtime.us-gov-east-1.amazonaws.com bedrock-runtime-fips.us-gov-east-1.amazonaws.com	HTTPS HTTPS
AWS GovCloud （美國西部）	us-gov-west-1	bedrock-runtime.us-gov-west-1.amazonaws.com bedrock-runtime-fips.us-gov-west-1.amazonaws.com	HTTPS HTTPS

適用於 Amazon Bedrock 的代理程式建置期 API

下表提供 Amazon Bedrock 代理程式支援的區域特定端點清單，用於建立和管理代理程式和知識庫。將這些端點用於 Amazon Bedrock API 操作的代理程式。

區域名稱	區域	端點	通訊協定
美國東部 (維吉尼亞北部)	us-east-1	bedrock-agent.us-east-1.amazonaws.com	HTTPS
美國東部 (維吉尼亞北部)	us-east-1	bedrock-agent-fips.us-east-1.amazonaws.com	HTTPS
美國西部 (奧勒岡)	us-west-2	bedrock-agent.us-west-2.amazonaws.com	HTTPS
美國西部 (奧勒岡)	us-west-2	bedrock-agent-fips.us-west-2.amazonaws.com	HTTPS
亞太區域 (新加坡)	ap-southeast-1	bedrock-agent.ap-southeast-1.amazonaws.com	HTTPS
亞太地區 (悉尼)	ap-southeast-2	bedrock-agent.ap-southeast-2.amazonaws.com	HTTPS
亞太地區 (東京)	ap-northeast-1	bedrock-agent.ap-northeast-1.amazonaws.com	HTTPS
亞太地區 (首爾)	ap-northeast-2	bedrock-agent.ap-northeast-2.amazonaws.com	HTTPS
加拿大 (中部)	ca-central-1	bedrock-agent.ca-central-1.amazonaws.com	HTTPS
歐洲 (法蘭克福)	eu-central-1	bedrock-agent.eu-central-1.amazonaws.com	HTTPS
歐洲 (愛爾蘭)	eu-west-1	bedrock-agent.eu-west-1.amazonaws.com	HTTPS
歐洲 (倫敦)	eu-west-2	bedrock-agent.eu-west-2.amazonaws.com	HTTPS
Europe (Paris)	eu-west-3	bedrock-agent.eu-west-3.amazonaws.com	HTTPS
亞太區域 (孟買)	ap-south-1	bedrock-agent.ap-south-1.amazonaws.com	HTTPS
南美洲 (聖保羅)	sa-east-1	bedrock-agent.sa-east-1.amazonaws.com	HTTPS

適用於 Amazon Bedrock 的代理程式執行期 API

下表提供 Amazon Bedrock 代理程式支援用於呼叫代理程式和查詢知識庫的區域特定端點清單。將這些端點用於 Amazon Bedrock 執行期 API 操作的代理程式。

區域名稱	區域	端點	通訊協定
美國東部 (維吉尼亞北部)	us-east-1	bedrock-agent-runtime.us-east-1.amazonaws.com	HTTPS
美國東部 (維吉尼亞北部)	us-east-1	bedrock-agent-runtime-fips.us-east-1.amazonaws.com	HTTPS
美國西部 (奧勒岡)	us-west-2	bedrock-agent-runtime.us-west-2.amazonaws.com	HTTPS
美國西部 (奧勒岡)	us-west-2	bedrock-agent-runtime-fips.us-west-2.amazonaws.com	HTTPS
亞太區域 (新加坡)	ap-southeast-1	bedrock-agent-runtime.ap-southeast-1.amazonaws.com	HTTPS
亞太地區 (悉尼)	ap-southeast-2	bedrock-agent-runtime.ap-southeast-2.amazonaws.com	HTTPS
亞太地區 (東京)	ap-northeast-1	bedrock-agent-runtime.ap-northeast-1.amazonaws.com	HTTPS
亞太地區 (首爾)	ap-northeast-2	bedrock-agent-runtime.ap-northeast-2.amazonaws.com	HTTPS
加拿大 (中部)	ca-central-1	bedrock-agent-runtime.ca-central-1.amazonaws.com	HTTPS
歐洲 (法蘭克福)	eu-central-1	bedrock-agent-runtime.eu-central-1.amazonaws.com	HTTPS
Europe (Paris)	eu-west-3	bedrock-agent-runtime.eu-west-3.amazonaws.com	HTTPS
歐洲 (愛爾蘭)	eu-west-1	bedrock-agent-runtime.eu-west-1.amazonaws.com	HTTPS
歐洲 (倫敦)	eu-west-2	bedrock-agent-runtime.eu-west-2.amazonaws.com	HTTPS
亞太區域 (孟買)	ap-south-1	bedrock-agent-runtime.ap-south-1.amazonaws.com	HTTPS
南美洲 (聖保羅)	sa-east-1	bedrock-agent-runtime.sa-east-1.amazonaws.com	HTTPS

Amazon Bedrock 資料自動化 APIs

下表提供 Amazon Bedrock 資料自動化支援的區域特定端點清單。使用字詞runtime叫用藍圖和專案從檔案擷取資訊的端點。將這些端點用於 Amazon Bedrock Data Automation 執行期 API 操作。沒有的端點runtime用於建立藍圖和專案，以提供擷取指引。將這些端點用於 Amazon Bedrock Data Automation API 建置時間操作

區域名稱	區域	端點	通訊協定
美國東部 (俄亥俄)	us-east-2	bedrock-data-automation.us-east-2.amazonaws.com bedrock-data-automation-runtime.us-east-2.amazonaws.com bedrock-data-automation-fips.us-east-2.amazonaws.com bedrock-data-automation-runtime-fips.us-east-2.amazonaws.com	HTTPS HTTPS HTTPS HTTPS
美國東部 (維吉尼亞北部)	us-east-1	bedrock-data-automation.us-east-1.amazonaws.com bedrock-data-automation-runtime.us-east-1.api.aws bedrock-data-automation-runtime.us-east-1.amazonaws.com bedrock-data-automation.us-east-1.api.aws bedrock-data-automation-fips.us-east-1.amazonaws.com bedrock-data-automation-runtime-fips.us-east-1.api.aws bedrock-data-automation-runtime-fips.us-east-1.amazonaws.com bedrock-data-automation-fips.us-east-1.api.aws	HTTPS HTTPS HTTPS HTTPS HTTPS HTTPS HTTPS HTTPS
美國西部 (奧勒岡)	us-west-2	bedrock-data-automation.us-west-2.amazonaws.com bedrock-data-automation-runtime.us-west-2.api.aws bedrock-data-automation-runtime.us-west-2.amazonaws.com bedrock-data-automation.us-west-2.api.aws bedrock-data-automation-fips.us-west-2.amazonaws.com bedrock-data-automation-runtime-fips.us-west-2.api.aws bedrock-data-automation-runtime-fips.us-west-2.amazonaws.com bedrock-data-automation-fips.us-west-2.api.aws	HTTPS HTTPS HTTPS HTTPS HTTPS HTTPS HTTPS HTTPS
亞太區域 (孟買)	ap-south-1	bedrock-data-automation.ap-south-1.amazonaws.com bedrock-data-automation-runtime.ap-south-1.amazonaws.com	HTTPS HTTPS
亞太地區 (悉尼)	ap-southeast-2	bedrock-data-automation.ap-southeast-2.amazonaws.com bedrock-data-automation-runtime.ap-southeast-2.amazonaws.com	HTTPS HTTPS
亞太區域 (東京)	ap-northeast-1	bedrock-data-automation.ap-northeast-1.amazonaws.com bedrock-data-automation-runtime.ap-northeast-1.amazonaws.com	HTTPS HTTPS
加拿大 (中部)	ca-central-1	bedrock-data-automation.ca-central-1.amazonaws.com bedrock-data-automation-runtime.ca-central-1.amazonaws.com bedrock-data-automation-fips.ca-central-1.amazonaws.com bedrock-data-automation-runtime-fips.ca-central-1.amazonaws.com	HTTPS HTTPS HTTPS HTTPS
歐洲 (法蘭克福)	eu-central-1	bedrock-data-automation.eu-central-1.amazonaws.com bedrock-data-automation-runtime.eu-central-1.amazonaws.com	HTTPS HTTPS
歐洲 (愛爾蘭)	eu-west-1	bedrock-data-automation.eu-west-1.amazonaws.com bedrock-data-automation-runtime.eu-west-1.amazonaws.com	HTTPS HTTPS
歐洲 (倫敦)	eu-west-2	bedrock-data-automation.eu-west-2.amazonaws.com bedrock-data-automation-runtime.eu-west-2.amazonaws.com	HTTPS HTTPS
歐洲 (西班牙)	eu-south-2	bedrock-data-automation.eu-south-2.amazonaws.com bedrock-data-automation-runtime.eu-south-2.amazonaws.com	HTTPS HTTPS
AWS GovCloud （美國西部）	us-gov-west-1	bedrock-data-automation.us-gov-west-1.amazonaws.com bedrock-data-automation-runtime.us-gov-west-1.amazonaws.com bedrock-data-automation-fips.us-gov-west-1.amazonaws.com bedrock-data-automation-runtime-fips.us-gov-west-1.amazonaws.com	HTTPS HTTPS HTTPS HTTPS

Amazon Bedrock 服務配額

提示

由於 Amazon Bedrock 具有大量配額，我們建議您使用主控台檢視服務配額，而不是使用下表。開啟 Amazon Bedrock 配額。使用搜尋欄位來尋找特定配額。使用齒輪圖示來控制頁面上顯示多少配額。

名稱	預設	可調整	說明
（進階提示最佳化）每個帳戶的作用中任務	每個受支援的區域：20	是	每個帳戶作用中的進階提示最佳化 (APO) 任務數量上限。
（進階提示最佳化）每個帳戶的非作用中任務	每個受支援的區域：5,000	是	每個帳戶的非作用中進階提示最佳化 (APO) 任務數量上限。
（自動化推理）政策中的註釋	每個受支援的區域：10	否	自動化理由政策中的註釋數量上限。
（自動化原因） CancelAutomatedReasoningPolicyBuildWorkflow 每秒請求數	每個受支援的區域：5	是	每秒 CancelAutomatedReasoningPolicyBuildWorkflow API 請求的數量上限。
（自動化推理）每個政策的並行建置	每個受支援的區域：2	否	每個自動合理化政策的並行組建數量上限。
（自動化推理）每個帳戶的並行政策建置	每個受支援的區域：5	否	在一個帳戶中建置並行自動化原因政策的最大數量。
（自動化原因） CreateAutomatedReasoningPolicy 每秒請求數	每個受支援的區域：5	是	每秒 CreateAutomatedReasoningPolicy API 請求的數量上限。
（自動推理） CreateAutomatedReasoningPolicyTestCase 每秒請求數	每個受支援的區域：5	是	每秒 CreateAutomatedReasoningPolicyTestCase API 請求的數量上限。
（自動推理） CreateAutomatedReasoningPolicyVersion 每秒請求數	每個受支援的區域：5	是	每秒 CreateAutomatedReasoningPolicyVersion API 請求的數量上限。
（自動推理） DeleteAutomatedReasoningPolicy 每秒請求數	每個受支援的區域：5	是	每秒 DeleteAutomatedReasoningPolicy API 請求的數量上限。
（自動化原因） DeleteAutomatedReasoningPolicyBuildWorkflow 每秒請求數	每個受支援的區域：5	是	每秒 DeleteAutomatedReasoningPolicyBuildWorkflow API 請求的數量上限。
（自動推理） DeleteAutomatedReasoningPolicyTestCase 每秒請求數	每個受支援的區域：5	是	每秒 DeleteAutomatedReasoningPolicyTestCase API 請求的數量上限。
（自動化原因） ExportAutomatedReasoningPolicyVersion 每秒請求數	每個受支援的區域：5	是	每秒 ExportAutomatedReasoningPolicyVersion API 請求的數量上限。
（自動推理） GetAutomatedReasoningPolicy 每秒請求數	每個受支援的區域：10	是	每秒 GetAutomatedReasoningPolicy API 請求的數量上限。
（自動推理） GetAutomatedReasoningPolicyAnnotations 每秒請求數	每個受支援的區域：10	是	每秒 GetAutomatedReasoningPolicyAnnotations API 請求的數量上限。
（自動化原因）每秒 GetAutomatedReasoningPolicyBuildWorkflow 請求	每個受支援的區域：10	是	每秒 GetAutomatedReasoningPolicyBuildWorkflow API 請求的數量上限。
（自動化原因） GetAutomatedReasoningPolicyBuildWorkflowResultAssets 每秒請求數	每個受支援的區域：10	是	每秒 GetAutomatedReasoningPolicyBuildWorkflowResultAssets API 請求的數量上限。
（自動推理） GetAutomatedReasoningPolicyNextScenario 每秒請求數	每個受支援的區域：10	是	每秒 GetAutomatedReasoningPolicyNextScenario API 請求的數量上限。
（自動化原因） GetAutomatedReasoningPolicyTestCase 每秒請求數	每個受支援的區域：10	是	每秒 GetAutomatedReasoningPolicyTestCase API 請求的數量上限。
（自動化原因） GetAutomatedReasoningPolicyTestResult 每秒請求數	每個受支援的區域：10	是	每秒 GetAutomatedReasoningPolicyTestResult API 請求的數量上限。
（自動化原因） ListAutomatedReasoningPolicies 每秒請求數	每個受支援的區域：5	是	每秒 ListAutomatedReasoningPolicies API 請求的數量上限。
（自動化原因） ListAutomatedReasoningPolicyBuildWorkflows 每秒請求數	每個受支援的區域：5	是	每秒 ListAutomatedReasoningPolicyBuildWorkflows API 請求的數量上限。
（自動化原因） ListAutomatedReasoningPolicyTestCases 每秒請求數	每個受支援的區域：5	是	每秒 ListAutomatedReasoningPolicyTestCases API 請求的數量上限。
（自動化原因） ListAutomatedReasoningPolicyTestResults 每秒請求數	每個受支援的區域：5	是	每秒 ListAutomatedReasoningPolicyTestResults API 請求的數量上限。
（自動化推理）每個帳戶的政策	每個受支援的區域：100	否	一個帳戶中自動推理政策的最大數量。
（自動化推理）政策中的規則	每個受支援的區域：500	否	自動推理政策中的規則數目上限。
（自動化推理）來源文件大小 (MB)	每個受支援的區域：5	否	建立自動化原因政策的來源文件大小上限 (MB)。
（自動化推理）來源文件字符	每個支援的區域：122，880	否	建立自動推理政策時，來源文件中允許的字符數量上限。
（自動化原因） StartAutomatedReasoningPolicyBuildWorkflow 每秒請求數	每個受支援的區域：1	是	每秒 StartAutomatedReasoningPolicyBuildWorkflow API 請求的數量上限。
（自動化原因） StartAutomatedReasoningPolicyTestWorkflow 每秒請求數	每個受支援的區域：1	是	每秒 StartAutomatedReasoningPolicyTestWorkflow API 請求的數量上限。
（自動化推理）每個政策的測試	每個受支援的區域：100	否	每個自動推理政策的測試數量上限。
（自動化原因）每個政策的類型	每個受支援的區域：50	否	自動化理由政策中的類型數量上限。
（自動化原因） UpdateAutomatedReasoningPolicy 每秒請求數	每個受支援的區域：5	是	每秒 UpdateAutomatedReasoningPolicy API 請求的數量上限。
（自動化原因） UpdateAutomatedReasoningPolicyAnnotations 每秒請求數	每個受支援的區域：5	是	每秒 UpdateAutomatedReasoningPolicyAnnotations API 請求的數量上限。
（自動化原因） UpdateAutomatedReasoningPolicyTestCase 每秒請求數	每個受支援的區域：5	是	每秒 UpdateAutomatedReasoningPolicyTestCase API 請求的數量上限。
（自動推理）政策中每種類型的值	每個受支援的區域：50	否	自動化理由政策中每種類型的值數目上限。
政策中的（自動化推理）變數	每個受支援的區域：200	否	自動化理由政策中的變數數量上限。
（自動化推理）每個政策的版本	每個支援的區域：1,000	否	每個自動推理政策的版本數量上限。
（資料自動化）（主控台）文件檔案大小上限 (MB)	每個受支援的區域：200	否	主控台的檔案大小上限
（資料自動化）（主控台）每個文件檔案的頁面數上限	每個受支援的區域：20	否	主控台中每個文件的最大頁數
（資料自動化） CreateBlueprint - 每個帳戶的藍圖數目上限	每個支援的區域：350	是	每個帳戶的藍圖數目上限
（資料自動化） CreateBlueprintVersion - 每個藍圖的藍圖版本數目上限	每個受支援的區域：10	是	每個藍圖的版本數量上限
（資料自動化） CreateDataAutomationLibrary - 每個帳戶的資料自動化程式庫數量上限	每個受支援的區域：10	是	每個帳戶的資料自動化程式庫數量上限
（資料自動化）欄位的描述長度（字元）	每個受支援的區域：300	否	以字元為單位的欄位描述長度上限
（資料自動化） InvokeBlueprintOptimizationAsync - 藍圖最佳化並行任務的數量上限	每個支援的區域：3	是	調用藍圖最佳化非同步開啟任務的數量上限
（資料自動化） InvokeBlueprintOptimizationAsync - 每天藍圖最佳化任務的數量上限	每個受支援的區域：30	否	每天調用藍圖最佳化非同步任務的數量上限
（資料自動化） InvokeDataAutomation(Sync) - 文件 - 請求數量上限	每個支援的區域：60	是	文件模態的每分鐘 InvokeDataAutomation 請求數目上限
（資料自動化） InvokeDataAutomation(Sync) - 映像 - 請求數量上限	us-east-1：200 us-west-2：200 每個其他支援的區域：100	是	影像模態每分鐘的 InvokeDataAutomation 請求數目上限
（資料自動化） InvokeDataAutomationAsync - 音訊 - 並行任務數量上限	us-east-1：20 us-west-2：20 每個其他支援的區域：2	是	調用音訊資料自動化非同步開啟任務的最大數量
（資料自動化） InvokeDataAutomationAsync - 文件 - 並行任務數量上限	ap-south-1：5 ca-central-1：5 eu-south-2：5 eu-west-2：5 每個其他支援的區域：25	是	文件的叫用資料自動化非同步開啟任務數量上限
（資料自動化） InvokeDataAutomationAsync - 影像 - 並行任務的最大數量	us-east-1：20 us-west-2：20 每個其他支援的區域：5	是	為映像調用資料自動化非同步開啟任務的最大數量
（資料自動化） InvokeDataAutomationAsync - 開啟任務的數量上限	每個支援的區域：1，800	否	為映像調用資料自動化非同步開啟任務的最大數量
（資料自動化） InvokeDataAutomationAsync - 影片 - 並行任務的數量上限	us-east-1：20 us-west-2：20 每個其他支援的區域：3	是	為影片調用資料自動化非同步開啟任務的最大數量
（資料自動化）每個程式庫的詞彙片語數目上限	每個受支援的區域：500	是	每個程式庫可設定的自訂詞彙片語數目上限
（資料自動化）最大音訊取樣率 (Hz)	每個支援的區域：48，000	否	最大音訊取樣率
（資料自動化）每個專案的藍圖上限（音訊）	每個受支援的區域：1	否	每個專案的音訊藍圖數目上限
（資料自動化）每個專案的藍圖上限（文件）	每個受支援的區域：40	否	文件每個專案的藍圖數目上限
（資料自動化）每個專案的藍圖上限（映像）	每個受支援的區域：1	否	每個專案的影像藍圖數目上限
（資料自動化）每個專案的藍圖上限（影片）	每個受支援的區域：1	否	每個專案的影片藍圖數量上限
（資料自動化） JSON 藍圖大小上限（字元）	每個受支援的區域：100,000	否	以字元為單位的 JSON 大小上限
（資料自動化）欄位階層的最大層級	每個受支援的區域：1	否	欄位階層的最大數量層級
（資料自動化）每個文件的最大頁數	每個受支援的區域：3,000 個	否	每個文件的最大頁數
（資料自動化）解析度上限	每個支援的區域：8，000	否	影像的最大解析度
（資料自動化）音訊檔案大小上限 (MB)	每個受支援的區域：2048	否	音訊的檔案大小上限
（資料自動化）最大音訊長度（分鐘）	每個支援的區域：240	否	音訊長度上限，以分鐘為單位
（資料自動化）文件檔案大小上限 (MB)	每個受支援的區域：500	否	檔案大小上限
（資料自動化）映像檔案大小上限 (MB)	每個受支援的區域：5	否	影像的檔案大小上限
（資料自動化）音訊藍圖的指令欄位長度上限 - （字元）	每個受支援的區域：500	是	音訊藍圖的指令欄位長度上限，以字元為單位
（資料自動化）每個啟動推論請求的藍圖數目上限（音訊）	每個受支援的區域：1	否	開始推論請求中的內嵌藍圖數目上限
（資料自動化）每個啟動推論請求的藍圖數目上限（文件）	每個受支援的區域：10	否	開始推論請求中的內嵌藍圖數目上限
（資料自動化）每個啟動推論請求的藍圖數目上限（映像）	每個受支援的區域：1	否	開始推論請求中的內嵌藍圖數目上限
（資料自動化）每個啟動推論請求的藍圖數目上限（影片）	每個受支援的區域：1	否	開始推論請求中的內嵌藍圖數目上限
（資料自動化）每個藍圖的清單欄位數目上限	每個受支援的區域：15	否	每個藍圖的清單欄位數目上限
（資料自動化）影片檔案大小上限 (MB)	每個受支援的區域：10,240	否	影片的檔案大小上限
（資料自動化）影片長度上限（分鐘）	每個支援的區域：240	否	影片的長度上限，以分鐘為單位
（資料自動化）最低音訊取樣率 (Hz)	每個支援的區域：8，000	否	最低音訊取樣率
（資料自動化）音訊長度下限（毫秒）	每個受支援的區域：500	否	音訊的最小長度，以毫秒為單位
（評估）並行自動模型評估任務的數量	每個受支援的區域：20	否	您可以在目前區域中，在此帳戶中一次指定的自動模型評估任務數量上限。
（評估）使用人力的並行模型評估任務數量	每個受支援的區域：10	否	您可以在目前區域中，在此帳戶中一次指定的使用人力工作者的模型評估任務數量上限。
（評估）自訂指標的數量	每個受支援的區域：10	否	您可以在使用人力的模型評估任務中指定的自訂指標數目上限。
（評估）以人工為基礎的模型評估任務中的自訂提示資料集數量	每個受支援的區域：1	否	您可以在目前區域中此帳戶中以人工為基礎的模型評估任務中指定的自訂提示資料集數目上限。
（評估）每個任務的資料集數量	每個受支援的區域：5	否	您可以在自動化模型評估任務中指定的資料集數量上限。這包括自訂和內建提示資料集。
（評估）評估任務的數量	每個受支援的區域：5,000	否	您可以在目前區域中在此帳戶中建立的模型評估任務數目上限。
（評估）每個資料集的指標數量	每個支援的區域：3	否	您可以在自動化模型評估任務中為每個資料集指定的指標數量上限。這包括自訂指標和內建指標。
（評估）使用人力的模型評估任務中的模型數量	每個受支援的區域：2	否	您可以在使用人力的模型評估任務中指定的模型數量上限。
（評估）自動化模型評估任務中的模型數量	每個受支援的區域：1	否	您可以在自動化模型評估任務中指定的模型數量上限。
（評估）自訂提示資料集中的提示數目	每個支援的區域：1,000	否	自訂提示資料集可包含的提示數目上限。
（評估）提示的大小	每個受支援的區域：4	否	自訂提示資料集中個別提示的大小上限 (KB)。
（評估）工作者的任務時間	每個受支援的區域：30	否	工作者完成任務所需的時間長度上限（以天為單位）。
（流程）每個流程的代理節點	每個受支援的區域：20	否	代理程式節點的數量上限。
（流程）每個流程的收集器節點	每個受支援的區域：1	否	收集器節點的數量上限。
（流程）每個流程的條件節點	每個受支援的區域：5	否	條件節點的數量上限。
每個條件節點的（流程）條件	每個受支援的區域：5	否	每個條件節點的條件數目上限。
（流程）每秒 CreateFlow 請求數	每個受支援的區域：2	否	每秒 CreateFlow 請求的數量上限。
（流程）每秒 CreateFlowAlias 請求數	每個受支援的區域：2	否	每秒 CreateFlowAlias 請求的數量上限。
（流程）每秒 CreateFlowVersion 請求數	每個受支援的區域：2	否	每秒 CreateFlowVersion 請求的數量上限。
（流程）每秒 DeleteFlow 請求	每個受支援的區域：2	否	每秒 DeleteFlow 請求的數量上限。
（流程） DeleteFlowAlias 每秒請求數	每個受支援的區域：2	否	每秒 DeleteFlowAlias 請求的數量上限。
（流程）每秒 DeleteFlowVersion 請求數	每個受支援的區域：2	否	每秒 DeleteFlowVersion 請求的數量上限。
（流程）每個流程的流程別名	每個受支援的區域：10	否	流程別名的數量上限。
（流程）每個帳戶的流程執行	每個受支援的區域：1,000	是	每個帳戶的流程執行數目上限。
（流程）每個流程的流程版本	每個受支援的區域：10	否	流程版本的數目上限。
每個帳戶的（流程）流程	每個受支援的區域：100	是	每個帳戶的流程數量上限。
（流程）每秒 GetFlow 請求數	每個受支援的區域：10	否	每秒的 GetFlow 請求數目上限。
（流程）每秒 GetFlowAlias 請求數	每個受支援的區域：10	否	每秒 GetFlowAlias 請求的數量上限。
（流程）每秒 GetFlowVersion 請求數	每個受支援的區域：10	否	每秒的 GetFlowVersion 請求數目上限。
（流程）每個流程的內嵌程式碼節點	每個受支援的區域：5	否	每個流程的內嵌程式碼節點數目上限。
（流程）每個流程的輸入節點	每個受支援的區域：1	否	流程輸入節點的數量上限。
（流程）每個流程的迭代器節點	每個受支援的區域：1	否	迭代器節點的數量上限。
（流程）每個流程的知識庫節點	每個受支援的區域：20	否	知識庫節點的數量上限。
（流程）每個流程的 Lambda 函數節點	每個受支援的區域：20	否	Lambda 函數節點的數量上限。
（流程）每個流程的 Lex 節點	每個受支援的區域：5	否	Lex 節點的數量上限。
（流程） ListFlowAliases 每秒請求數	每個受支援的區域：10	否	每秒 ListFlowAliases 請求的數量上限。
（流程） ListFlowVersions 每秒請求數	每個受支援的區域：10	否	每秒 ListFlowVersions 請求的數量上限。
（流程） ListFlows 每秒請求數	每個受支援的區域：10	否	每秒 ListFlows 請求的數量上限。
（流程）每個流程的輸出節點	每個受支援的區域：20	否	流程輸出節點的數量上限。
（流程）每秒的 PrepareFlow 請求	每個受支援的區域：2	否	每秒的 PrepareFlow 請求數目上限。
（流程）每個流程的提示節點	每個受支援的區域：20	是	提示節點的數量上限。
（流程）每個流程的 S3 擷取節點	每個受支援的區域：10	否	S3 擷取節點的數量上限。
每個流程的（流程） S3 儲存節點	每個受支援的區域：10	否	S3 儲存節點的數量上限。
（流程）每個流程的節點總數	每個受支援的區域：40	否	流程中的節點數量上限。
（流程）每秒 UpdateFlow 請求數	每個受支援的區域：2	否	每秒 UpdateFlow 請求的數量上限。
（流程）每秒 UpdateFlowAlias 請求數	每個受支援的區域：2	否	每秒 UpdateFlowAlias 請求的數量上限。
（流程）每秒的 ValidateFlowDefinition 請求數	每個受支援的區域：2	否	每秒的 ValidateFlowDefinition 請求數目上限。
（護欄）每個護欄的自動推理政策	每個受支援的區域：2	否	每個護欄的自動推理政策數量上限。
（護欄）內容政策的最大輸入大小，以文字單位（傳統層）為單位	us-east-1：1，000 us-east-2：1，000 us-west-2：1，000 ap-northeast-1：1，000 ap-northeast-2：1，000 ap-south-1：1，000 ap-southeast-1：1，000 ap-southeast-2：1，000 eu-central-1：1，000 eu-south-1：25 eu-west-3：25 sa-east-1：25 每個其他支援的區域：106	是	輸入文字的大小上限，以文字單位測量，可處理內容篩選條件。雖然此限制適用於傳統層，但我們建議您遷移至標準層，因為其卓越的耐用性、額外功能和多語言支援。
（護欄）內容政策的最大輸入大小，以文字單位表示（標準層 - 建議）	us-east-1：1，000 us-east-2：1，000 us-west-2：1，000 ap-northeast-1：500 ap-northeast-2：1，000 ap-south-1：500 ap-southeast-1：1，000 ap-southeast-2：400 eu-central-1：500 eu-south-1：25 eu-west-3：25 每個其他支援的區域：106	是	輸入文字的大小上限，以文字單位測量，可處理內容篩選條件。這適用於建議的標準方案。
（護欄）文字單位的文字接地政策最大輸入大小	每個支援的區域：106	是	輸入文字的大小上限，以文字單位測量，可由內容接地政策處理
（護欄）文字單位中的內容接地查詢長度	每個受支援的區域：1	否	內容基礎查詢的長度上限，以文字單位表示
（護欄）文字單位的文字接地回應長度	每個受支援的區域：5	否	內容式接地回應的長度上限，以文字單位表示
（護欄）文字單位的文字接地來源長度	us-east-1：100 us-west-2：100 每個其他支援的區域：50	否	內容式接地之接地來源的長度上限，以文字單位表示
（護欄）每個主題的範例片語	每個受支援的區域：5	否	每個主題可包含的主題範例數量上限
（護欄）每個帳戶的護欄	每個受支援的區域：100	否	帳戶中的護欄數量上限
（護欄）隨需 ApplyGuardrail 內容篩選政策文字單位爆量率（傳統層）	us-east-1：1，000 us-east-2：1，000 us-west-2：1，000 ap-northeast-1：1，000 ap-northeast-2：1，000 ap-south-1：1，000 ap-southeast-1：1，000 ap-southeast-2：1，000 eu-central-1：1，000 每個其他支援的區域：25	否	一次爆量中可處理內容篩選條件的文字單位數量上限。雖然此限制適用於傳統層，但我們建議您遷移至標準層，因為其卓越的耐用性、額外功能和多語言支援。
（護欄）隨需 ApplyGuardrail 內容篩選政策文字單位爆量率（標準層 - 建議）	us-east-1：1，000 us-east-2：1，000 us-west-2：1，000 ap-northeast-1：500 ap-northeast-2：1，000 ap-south-1：500 ap-southeast-1：1，000 ap-southeast-2：400 eu-central-1：500 每個其他支援的區域：25	否	一個爆量中可針對內容篩選條件處理的最大文字單位數量。這適用於建議的標準方案。
（護欄）隨需 ApplyGuardrail 內容篩選政策文字單位/秒（傳統層）	us-east-1：200 us-west-2：200 每個其他支援的區域：25	是	每秒可為內容篩選條件處理的最大文字單位數。雖然此限制適用於傳統層，但我們建議您遷移至標準層，因為它具有卓越的耐用性、額外的功能和多語言支援。
（護欄）隨需 ApplyGuardrail 內容篩選政策每秒文字單位（標準層 - 建議）	us-east-1：200 us-east-2：200 us-west-1：200 us-west-2：200 ap-northeast-1：50 ap-northeast-2：100 ap-south-1：50 ap-southeast-1：100 eu-central-1：50 每個其他支援的區域：25	是	每秒可為內容篩選條件處理的最大文字單位數。這適用於建議的標準方案。
（護欄）隨需 ApplyGuardrail 拒絕主題政策文字單位爆量率（傳統層）	us-east-1：200 us-west-2：200 每個其他支援的區域：25	否	一個爆量中可針對遭拒主題處理的最大文字單位數量。雖然此限制適用於傳統層，但我們建議您遷移至標準層，因為它具有卓越的耐用性、額外的功能和多語言支援。
（護欄）隨需 ApplyGuardrail 拒絕主題政策文字單位爆量率（標準層 - 建議）	us-east-1：1，000 us-east-2：1，000 us-west-2：1，000 ap-northeast-1：500 ap-northeast-2：1，000 ap-south-1：500 ap-southeast-1：1，000 ap-southeast-2：400 eu-central-1：500 每個其他支援的區域：25	否	一個爆量中可針對遭拒主題處理的最大文字單位數量。這適用於建議的標準方案。
（護欄）隨需 ApplyGuardrail 拒絕主題政策文字單位/秒（傳統層）	us-east-1：50 us-west-2：50 每個其他支援的區域：25	是	每秒可針對遭拒主題處理的最大文字單位數。雖然此限制適用於傳統層，但我們建議您遷移至標準層，因為它具有卓越的耐用性、額外的功能和多語言支援。
（護欄）隨需 ApplyGuardrail 拒絕主題政策文字單位/秒（標準層 - 建議）	us-east-1：200 us-west-2：200 每個其他支援的區域：25	是	每秒可針對遭拒主題處理的最大文字單位數。這適用於建議的標準方案。
（護欄）隨需 ApplyGuardrail 敏感資訊篩選條件政策文字單位爆量率	us-east-1：1，000 us-east-2：1，000 us-west-2：1，000 ap-northeast-1：1，000 ap-northeast-2：1，000 ap-south-1：1，000 ap-southeast-1：1，000 ap-southeast-2：1，000 eu-central-1：1，000 每個其他支援的區域：25	否	一次爆量中可針對敏感資訊篩選條件處理的文字單位數量上限。
（護欄）隨需 ApplyGuardrail 敏感資訊篩選條件政策文字單位/秒	us-east-1：500 us-east-2：100 us-west-1：50 us-west-2：500 ap-northeast-1：500 ap-northeast-2：100 ap-south-1：200 ap-southeast-1：100 ca-central-1：250 eu-central-1：500 每個其他支援的區域：25	是	每秒可針對敏感資訊篩選條件處理的最大文字單位數。
（護欄）隨需 ApplyGuardrail Word 篩選條件政策文字單位爆量率	us-east-1：1，000 us-east-2：1，000 us-west-2：1，000 ap-northeast-1：1，000 ap-northeast-2：1，000 ap-south-1：1，000 ap-southeast-1：1，000 ap-southeast-2：1，000 eu-central-1：1，000 每個其他支援的區域：25	否	一個爆量中可針對單字篩選條件處理的文字單位數量上限。
（護欄）隨需 ApplyGuardrail 單字篩選政策文字單位/秒	us-east-1：500 us-east-2：500 us-west-1：500 us-west-2：500 ap-northeast-1：500 ap-northeast-2：500 ap-south-1：500 ap-southeast-1：500 eu-central-1：500 每個其他支援的區域：25	是	每秒可處理文字篩選條件的最大文字單位數量。
（護欄）隨需 ApplyGuardrail 內容式接地政策文字單位爆量率	每個支援的區域：106	否	一個爆量中可處理用於內容式接地的文字單位數量上限。
（護欄）隨需 ApplyGuardrail 內容式接地政策文字單位每秒	每個支援的區域：106	是	每秒可處理用於內容式接地的文字單位數目上限。
（護欄）隨需 ApplyGuardrail 請求爆量率	us-east-1：100 us-east-2：100 us-west-1：100 us-west-2：100 ap-northeast-1：100 ap-northeast-2：100 ap-south-1：100 ap-southeast-1：100 eu-central-1：100 每個其他支援的區域：25	否	您可以一次爆量傳送的 ApplyGuardrail API 呼叫數量上限。
（護欄）每秒隨需 ApplyGuardrail 請求	us-east-1：100 us-east-2：100 us-west-1：100 us-west-2：100 ap-northeast-1：100 ap-northeast-2：100 ap-south-1：100 ap-southeast-1：100 eu-central-1：100 每個其他支援的區域：25	是	每秒允許的 ApplyGuardrail API 呼叫數目上限
（護欄）隨需 InvokeGuardrailChecks 請求爆量率	每個支援的區域：1，500	否	您可以一次爆量傳送的 InvokeGuardrailChecks API 呼叫數量上限
（護欄）隨需 InvokeGuardrailChecks 請求/分鐘	每個支援的區域：1，500	是	每分鐘允許的 InvokeGuardrailChecks API 呼叫數目上限
（護欄）敏感資訊篩選條件中的 Regex 實體	每個受支援的區域：30	否	可以包含在敏感資訊政策中的護欄篩選條件 regexe 數目上限
（護欄）字元的 Regex 長度	每個受支援的區域：500	否	護欄篩選條件 regex 的長度上限，以字元為單位
（護欄）敏感資訊政策輸入大小上限，以文字單位為單位	us-east-1：1，000 us-east-2：1，000 us-west-2：1，000 ap-northeast-1：1，000 ap-northeast-2：1，000 ap-south-1：1，000 ap-southeast-1：1，000 ap-southeast-2：1，000 eu-central-1：1，000 每個其他支援的區域：106	是	輸入文字的大小上限，以文字單位測量，可由敏感資訊篩選條件政策處理
（護欄）主題政策的最大輸入大小，以文字單位 (Classic 層）為單位	us-east-1：200 us-west-2：200 ap-southeast-1：25 eu-south-1：25 eu-west-3：25 sa-east-1：25 每個其他支援的區域：106	是	輸入文字的大小上限，以文字單位測量，可處理被拒絕的主題。雖然此限制適用於傳統層，但我們建議您遷移至標準層，因為其卓越的耐用性、額外功能和多語言支援。
（護欄）主題政策的最大輸入大小，以文字單位表示（標準層 - 建議）	us-east-1：1，000 us-east-2：1，000 us-west-2：1，000 ap-northeast-1：500 ap-northeast-2：1，000 ap-south-1：500 ap-southeast-1：1，000 ap-southeast-2：400 eu-central-1：500 eu-south-1：25 eu-west-3：25 每個其他支援的區域：106	是	輸入文字的大小上限，以文字單位測量，可處理被拒絕的主題。這適用於建議的標準方案。
（護欄）每個護欄的主題	每個受支援的區域：30	否	跨護欄主題政策可定義的主題數量上限
（護欄）每個護欄的版本	每個受支援的區域：20	否	護欄可擁有的版本數量上限
（護欄）字元的單字長度	每個受支援的區域：100	否	封鎖字詞清單中字詞的長度上限，以字元為單位
（護欄）文字單位的單字政策最大輸入大小	us-east-1：1，000 us-east-2：1，000 us-west-2：1，000 ap-northeast-1：1，000 ap-northeast-2：1，000 ap-south-1：1，000 ap-southeast-1：1，000 ap-southeast-2：1，000 eu-central-1：1，000 每個其他支援的區域：106	是	輸入文字的大小上限，以文字單位測量，可由 Word 篩選政策處理
（護欄）每個單字政策的單字	每個受支援的區域：10,000	否	可包含在封鎖字清單中的字數上限
（知識庫）每個帳戶的並行 IngestKnowledgeBaseDocuments 和 DeleteKnowledgeBaseDocuments 請求	每個受支援的區域：10	否	可在帳戶中同時執行的 IngestKnowledgeBaseDocuments 和 DeleteKnowledgeBaseDocuments 請求數目上限。
（知識基礎）每個帳戶的並行擷取任務	每個受支援的區域：5	否	可在帳戶中同時執行的最大擷取任務數量。
（知識基礎）每個資料來源的並行擷取任務	每個受支援的區域：1	否	可同時為資料來源執行的擷取任務數量上限。
（知識庫）每個知識庫的並行擷取任務	每個受支援的區域：1	否	知識庫可同時執行的最大擷取任務數量。
（知識基礎）每秒 CreateDataSource 請求	每個受支援的區域：2	否	每秒 CreateDataSource API 請求的數量上限。
（知識基礎）每秒 CreateKnowledgeBase 請求	每個受支援的區域：2	否	每秒 CreateKnowledgeBase API 請求的數量上限。
（知識庫）每個知識庫的資料來源	每個受支援的區域：5	否	每個知識庫的資料來源數量上限。
（知識基礎）每秒 DeleteDataSource 請求	每個受支援的區域：2	否	每秒 DeleteDataSource API 請求的數量上限。
（知識基礎）每秒 DeleteKnowledgeBase 請求	每個受支援的區域：2	否	每秒 DeleteKnowledgeBase API 請求的數量上限。
（知識庫） DeleteKnowledgeBaseDocuments 每秒請求數	每個受支援的區域：5	否	每秒 DeleteKnowledgeBaseDocuments API 請求的數量上限。
（知識基礎）每個擷取任務要新增或更新的檔案	每個支援的區域：5，000，000	否	每個擷取任務可擷取的新增和更新檔案數量上限。
（知識基礎）每個擷取任務要刪除的檔案	每個支援的區域：5，000，000	否	每個擷取任務可刪除的檔案數目上限。
（知識庫）每個 IngestKnowledgeBaseDocuments 任務要擷取的檔案。	每個受支援的區域：25	否	每個 IngestKnowledgeBaseDocuments 請求可擷取的文件數量上限。
（知識基礎）每秒 GenerateQuery 請求	每個受支援的區域：2	否	每秒 GenerateQuery API 請求的數目上限。
（知識基礎）每秒 GetDataSource 請求	每個受支援的區域：10	否	每秒 GetDataSource API 請求的數量上限。
（知識基礎）每秒 GetIngestionJob 請求數	每個受支援的區域：10	否	每秒 GetIngestionJob API 請求的數量上限。
（知識基礎）每秒 GetKnowledgeBase 請求	每個受支援的區域：10	否	每秒 GetKnowledgeBase API 請求的數量上限。
（知識庫） GetKnowledgeBaseDocuments 每秒請求數	每個受支援的區域：5	否	每秒 GetKnowledgeBaseDocuments API 請求的數量上限。
（知識庫） IngestKnowledgeBaseDocuments 每秒請求數	每個受支援的區域：5	否	每秒 IngestKnowledgeBaseDocuments API 請求的數量上限。
（知識庫） IngestKnowledgeBaseDocuments 總承載大小	每個受支援的區域：6	否	IngestKnowledgeBaseDocuments 請求中總承載的大小上限（以 MB 為單位）。
（知識基礎）擷取任務檔案大小與文字內容	每個受支援的區域：50	否	擷取任務中具有文字內容（例如 .txt、.pdf 或 .docx 檔案）的檔案的大小上限（以 MB 為單位）。
（知識基礎）擷取任務大小	每個受支援的區域：100	否	擷取任務的大小上限（以 GB 為單位）。
（知識基礎）每個帳戶的知識庫	每個受支援的區域：100	否	每個帳戶的知識庫數目上限。
（知識基礎） ListDataSources 每秒請求數	每個受支援的區域：10	否	每秒 ListDataSources API 請求的數量上限。
（知識基礎） ListIngestionJobs 每秒請求數	每個受支援的區域：10	否	每秒 ListIngestionJobs API 請求的數量上限。
（知識庫） ListKnowledgeBaseDocuments 每秒請求數	每個受支援的區域：5	否	每秒 ListKnowledgeBaseDocuments API 請求的數量上限。
（知識庫） ListKnowledgeBases 每秒請求數	每個受支援的區域：10	否	每秒 ListKnowledgeBases API 請求的數量上限。
（知識基礎） BDA 剖析器的檔案數目上限	每個支援的區域：1,000	否	可與 Amazon Bedrock Data Automation 搭配使用做為剖析器的檔案數目上限。
（知識基礎） Foundation Models 做為剖析器的檔案數目上限	每個支援的區域：1,000	否	可與 Foundation Models 搭配使用做為剖析器的檔案數量上限。
（知識基礎）每秒重新排名請求	每個受支援的區域：10	否	每秒的重新排名 API 請求數目上限。
（知識基礎）每秒擷取請求	每個受支援的區域：20	否	每秒擷取 API 請求的數量上限。
（知識基礎） RetrieveAndGenerate請求	每個受支援的區域：20	否	每秒的 RetrieveAndGenerate API 請求數目上限。
（知識基礎） RetrieveAndGenerateStream 請求	每個受支援的區域：20	否	每秒的 RetrieveAndGenerateStream API 請求數目上限。
（知識基礎）每秒 StartIngestionJob 請求數	每個支援的區域：0.1	否	每秒的 StartIngestionJob API 請求數目上限。
（知識基礎）每秒的 UpdateDataSource 請求	每個受支援的區域：2	否	每秒 UpdateDataSource API 請求的數量上限。
（知識庫） UpdateKnowledgeBase 每秒請求數	每個受支援的區域：2	否	每秒 UpdateKnowledgeBase API 請求的數量上限。
（知識基礎）使用者查詢大小	每個支援的區域：1,000	否	使用者查詢的大小上限（以字元為單位）。
（受管知識庫）每個帳戶的每秒 AgenticRetrieveStream 請求數	每個受支援的區域：1	否	受管 KBs 的每個帳戶每秒的 AgenticRetrieveStream API 請求數目上限。
（受管知識庫） AgenticRetrieveStream 使用者查詢大小	每個受支援的區域：10,000	否	AgenticRetrieveStream for Managed KBs 的使用者查詢大小上限（以字元為單位）。
（受管知識庫）每個知識庫的並行擷取任務	每個受支援的區域：50	否	每個受管 KB 的並行擷取任務數量上限。
（受管知識庫）每個知識庫的資料來源	每個受支援的區域：200	否	每個受管 KB 的資料來源數量上限。
（受管知識庫） DeleteKnowledgeBaseDocuments 每秒請求數	每個受支援的區域：10	否	受管 KBs 每秒 DeleteKnowledgeBaseDocuments API 請求的數量上限。
（受管知識庫） DeleteResourcePolicy 每秒請求數	每個受支援的區域：5	否	受管 KBs 的每秒 DeleteResourcePolicy API 請求數目上限。
（受管知識庫）每個 IngestKnowledgeBaseDocuments 請求要擷取的檔案	每個受支援的區域：10	否	每個 IngestKnowledgeBaseDocuments API 請求的受管 KBs 要擷取的檔案數量上限。
（受管知識庫）每個帳戶的每秒 GetDocumentContent 請求數	每個受支援的區域：100	否	每個帳戶每秒的 GetDocumentContent API 請求數目上限。
（受管知識庫）每個知識庫每秒的 GetDocumentContent 請求	每個受支援的區域：5	否	每個受管 KB 每秒 GetDocumentContent API 請求的數量上限。
（受管知識庫）每秒 GetResourcePolicy 請求	每個受支援的區域：5	否	受管 KBs 的每秒 GetResourcePolicy API 請求數目上限。
（受管知識庫）個別檔案擷取的文字大小 (MB)	每個受支援的區域：30	否	從受管 KBs 的單一檔案中擷取文字的大小上限（以 MB 為單位）。
（受管知識庫） IngestKnowledgeBaseDocuments 每秒請求數	每個受支援的區域：20	否	受管 KBs 每秒 IngestKnowledgeBaseDocuments API 請求的數量上限。
（受管知識庫）每個帳戶的知識庫	每個支援的區域：1,000	否	每個帳戶的受管 KBs 數目上限。
（受管知識庫） ListKnowledgeBaseDocuments 每秒請求數	每個受支援的區域：10	否	受管 KBs 每秒 ListKnowledgeBaseDocuments API 請求的數量上限。
（受管知識庫） PutResourcePolicy 每秒請求數	每個受支援的區域：5	否	受管 KBs 每秒 PutResourcePolicy API 請求的數量上限。
（受管知識庫）擷取每個帳戶的每秒請求	每個受支援的區域：100	否	受管 KBs 的每個帳戶每秒擷取 API 請求的數量上限。
（受管知識庫）擷取每個知識庫每秒的請求	每個受支援的區域：5	否	每個受管 KB 每秒擷取 API 請求的數量上限。
（受管知識庫）擷取使用者查詢大小	每個受支援的區域：10,000	否	擷取受管 KBs 的使用者查詢大小上限（以字元為單位）。
（受管知識庫）每個知識庫的儲存大小總計 (TB)	每個受支援的區域：10	否	每個受管 KB 的總儲存大小上限（以 TB 為單位）。
（模型自訂）每個帳戶的自訂模型	每個受支援的區域：100	是	帳戶中自訂模型的數量上限。
（模型自訂）進行中自訂模型部署	每個受支援的區域：2	是	進行中的自訂模型部署數量上限
（模型自訂）抽樣自訂任務的輸入檔案大小上限	每個支援的區域：2 GB	否	抽樣自訂任務的輸入檔案大小上限。
（模型自訂）分割自訂任務的行長度上限	每個支援的區域：16 KB	否	抽樣自訂任務的輸入檔案中的最大行長度。
（模型自訂）分割自訂任務的提示數目上限	每個支援的區域：15，000	否	分割自訂任務所需的提示數目上限。
（模型自訂） Amazon Nova Canvas 微調任務的訓練記錄數目上限	每個受支援的區域：10,000	是	Amazon Nova Canvas 微調任務允許的記錄數目上限。
（模型自訂） Amazon Nova Micro V1 分割自訂任務的最大學生模型微調內容長度	每個支援的區域：32，000	否	Amazon Nova Micro V1 抽樣自訂任務的最大學生模型微調內容長度。
（模型自訂） Amazon Nova V1 分割自訂任務的最大學生模型微調內容長度	每個支援的區域：32，000	否	Amazon Nova V1 抽樣自訂任務的最大學生模型微調內容長度。
（模型自訂）適用於 Anthropic Claude 3 haiku 20240307 V1 分割自訂任務的最大學生模型微調內容長度	每個支援的區域：32，000	否	Anthropic Claude 3 haiku 20240307 V1 精算自訂任務的最大學生模型微調內容長度。
（模型自訂） Llama 3.1 70B 指示 V1 分割自訂任務的最大學生模型微調內容長度	每個支援的區域：16，000	否	Llama 3.1 70B 指示 V1 分割自訂任務的最大學生模型微調內容長度。
（模型自訂） Llama 3.1 8B 指示 V1 分割自訂任務的最大學生模型微調內容長度	每個支援的區域：32，000	否	Llama 3.1 8B 指示 V1 分割自訂任務的最大學生模型微調內容長度。
（模型自訂）抽樣自訂任務的提示數下限	每個受支援的區域：100	否	抽樣自訂任務所需的提示數目下限。
（模型自訂）排程自訂任務	每個受支援的區域：10	否	排程自訂任務的數量上限。
（模型自訂） Amazon Nova 2 Lite 每分鐘隨需自訂模型部署請求的總和	每個受支援的區域：2,000	否	每分鐘提交至 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 動作的輸入和輸出隨需自訂模型部署請求總和
（模型自訂） Amazon Nova Lite 每分鐘隨需自訂模型部署請求的總和	每個受支援的區域：2,000	否	每分鐘提交至 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 動作的輸入和輸出隨需自訂模型部署請求總和
（模型自訂） Amazon Nova Micro 每分鐘隨需自訂模型部署請求總和	每個受支援的區域：2,000	否	每分鐘提交至 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 動作的輸入和輸出隨需自訂模型部署請求總和
（模型自訂） Amazon Nova Pro 每分鐘隨需自訂模型部署請求的總和	每個受支援的區域：200	否	每分鐘提交至 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 動作的輸入和輸出隨需自訂模型部署請求總和
（模型自訂） Meta Llama 3.3 70B Instruct 的每分鐘隨需自訂模型部署請求總和	每個支援的區域：400	否	提交至 Meta Llama 3.3 70B Instruct 的 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 動作的每分鐘輸入和輸出隨需自訂模型部署請求總和
（模型自訂） Amazon Nova 2 Lite 每天隨需自訂模型部署字符的總和	每個支援的區域：5，760，000，000	否	每天提交至 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 動作的輸入和輸出隨需自訂模型部署字符總和
（模型自訂） Amazon Nova Lite 每天隨需自訂模型部署字符的總和	每個支援的區域：5，760，000，000	否	每天提交至 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 動作的輸入和輸出隨需自訂模型部署字符總和
（模型自訂） Amazon Nova Micro 每天隨需自訂模型部署權杖的總和	每個支援的區域：5，760，000，000	否	每天提交至 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 動作的輸入和輸出隨需自訂模型部署字符總和
（模型自訂） Amazon Nova Pro 每天隨需自訂模型部署字符的總和	每個支援的區域：1，152，000，000	否	每天提交至 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 動作的輸入和輸出隨需自訂模型部署字符總和
（模型自訂） Meta Llama 3.3 70B Instruct 每天隨需自訂模型部署字符的總和	每個支援的區域：432，000，000	否	每天提交至 Meta Llama 3.3 70B Instruct 的 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 動作的輸入和輸出隨需自訂模型部署字符總和
（模型自訂） Amazon Nova 2 Lite 每分鐘隨需自訂模型部署字符的總和	每個支援的區域：4，000，000	否	每分鐘提交至 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 動作的輸入和輸出隨需自訂模型部署字符總和
（模型自訂） Amazon Nova Lite 每分鐘隨需自訂模型部署字符的總和	每個支援的區域：4，000，000	否	每分鐘提交至 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 動作的輸入和輸出隨需自訂模型部署字符總和
（模型自訂） Amazon Nova Micro 每分鐘隨需自訂模型部署字符的總和	每個支援的區域：4，000，000	否	每分鐘提交至 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 動作的輸入和輸出隨需自訂模型部署字符總和
（模型自訂） Amazon Nova Pro 每分鐘隨需自訂模型部署字符的總和	每個支援的區域：800，000	否	每分鐘提交至 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 動作的輸入和輸出隨需自訂模型部署字符總和
（模型自訂） Meta Llama 3.3 70B Instruct 的每分鐘隨需自訂模型部署字符總和	每個支援的區域：300，000	否	提交至 Meta Llama 3.3 70B Instruct 的 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 動作的每分鐘輸入和輸出隨需自訂模型部署字符總和
（模型自訂） Amazon Nova 2 Lite 微調任務的訓練和驗證記錄總和	每個受支援的區域：20,000	是	Amazon Nova 2 Lite 微調任務允許的訓練和驗證記錄合併數目上限。
（模型自訂） Amazon Nova Lite 微調任務的訓練和驗證記錄總和	每個受支援的區域：20,000	是	Amazon Nova Lite 微調任務允許的訓練和驗證記錄合併數目上限。
（模型自訂） Amazon Nova Micro 微調任務的訓練和驗證記錄總和	每個受支援的區域：20,000	是	Amazon Nova Micro 微調任務允許的訓練和驗證記錄合併數目上限。
（模型自訂） Amazon Nova Pro 微調任務的訓練和驗證記錄總和	每個受支援的區域：20,000	是	Amazon Nova Pro 微調任務允許的訓練和驗證記錄合併數目上限。
（模型自訂） Claude 3 Haiku v1 微調任務的訓練和驗證記錄總和	每個受支援的區域：10,000	是	Claude 3 Haiku 微調任務允許的訓練和驗證記錄合併數目上限。
（模型自訂） Claude 3-5-Haiku v1 微調任務的訓練和驗證記錄總和	每個受支援的區域：10,000	是	Claude 3-5-Haiku 微調任務允許的訓練和驗證記錄合併數目上限。
（模型自訂） Meta Llama 2 13B v1 微調任務的訓練和驗證記錄總和	每個受支援的區域：10,000	是	Meta Llama 2 13B 微調任務允許的訓練和驗證記錄合併數目上限。
（模型自訂） Meta Llama 2 70B v1 微調任務的訓練和驗證記錄總和	每個受支援的區域：10,000	是	Meta Llama 2 70B 微調任務允許的訓練和驗證記錄合併數目上限。
（模型自訂） Meta Llama 3.1 70B 指示 v1 微調任務的訓練和驗證記錄總和	每個受支援的區域：10,000	是	Meta Llama 3.1 70B 指示微調任務允許的訓練和驗證記錄合併數目上限。
（模型自訂） Meta Llama 3.1 8B 指示 v1 微調任務的訓練和驗證記錄總和	每個受支援的區域：10,000	是	Meta Llama 3.1 8B 指示微調任務允許的訓練和驗證記錄合併數目上限。
（模型自訂） Meta Llama 3.2 11B 指示 v1 微調任務的訓練和驗證記錄總和	每個受支援的區域：10,000	是	Meta Llama 3.2 11B 指示微調任務允許的訓練和驗證記錄合併數目上限。
（模型自訂） Meta Llama 3.2 1B 指示 v1 微調任務的訓練和驗證記錄總和	每個受支援的區域：10,000	是	Meta Llama 3.2 1B 指示微調任務允許的訓練和驗證記錄合併數目上限。
（模型自訂） Meta Llama 3.2 3B 指示 v1 微調任務的訓練和驗證記錄總和	每個受支援的區域：10,000	是	Meta Llama 3.2 3B 指示微調任務允許的訓練和驗證記錄合併數目上限。
（模型自訂） Meta Llama 3.2 90B 指示 v1 微調任務的訓練和驗證記錄總和	每個受支援的區域：10,000	是	Meta Llama 3.2 90B 指示微調任務允許的訓練和驗證記錄合併數目上限。
（模型自訂） Meta Llama 3.3 70B 指示 v1 微調任務的訓練和驗證記錄總和	每個受支援的區域：10,000	是	Meta Llama 3.3 70B 指示微調任務允許的訓練和驗證記錄合併數目上限。
（模型自訂） Titan Image Generator G1 V1 微調任務的訓練和驗證記錄總和	每個受支援的區域：10,000	是	Titan Image Generator 微調任務允許的訓練和驗證記錄合併數目上限。
（模型自訂） Titan Image Generator G1 V2 微調任務的訓練和驗證記錄總和	每個受支援的區域：10,000	是	Titan Image Generator V2 微調任務允許的訓練和驗證記錄合併數目上限。
（模型自訂） Titan Multimodal Embeddings G1 v1 微調任務的訓練和驗證記錄總和	每個支援的區域：50，000	是	Titan Multimodal Embeddings Fine-tuning 任務允許的訓練和驗證記錄合併數目上限。
（模型自訂） Titan Text G1 - Express v1 繼續訓練前任務的訓練和驗證記錄總和	每個受支援的區域：100,000	是	Titan Text Express 繼續訓練前任務允許的訓練和驗證記錄合併數目上限。
（模型自訂） Titan Text G1 - Express v1 微調任務的訓練和驗證記錄總和	每個受支援的區域：10,000	是	Titan Text Express 微調任務允許的訓練和驗證記錄合併數目上限。
（模型自訂） Titan Text G1 - Lite v1 繼續訓練前任務的訓練和驗證記錄總和	每個受支援的區域：100,000	是	Titan Text Lite 繼續訓練前任務允許的訓練和驗證記錄合併數目上限。
（模型自訂） Titan Text G1 - Lite v1 微調任務的訓練和驗證記錄總和	每個受支援的區域：10,000	是	Titan Text Lite 微調任務允許的訓練和驗證記錄合併數目上限。
（模型自訂） Titan Text G1 - Premier v1 微調任務的訓練和驗證記錄總和	每個受支援的區域：20,000	是	Titan Text Premier 微調任務允許的訓練和驗證記錄合併數目上限。
（模型自訂）自訂模型部署的總數	每個受支援的區域：10	是	自訂模型部署的總數
（提示管理）每秒 CreatePrompt 請求	每個受支援的區域：2	否	每秒 CreatePrompt 請求的數量上限。
（提示管理）每秒 CreatePromptVersion 請求	每個受支援的區域：2	否	每秒 CreatePromptVersion 請求的數量上限。
（提示管理）每秒 DeletePrompt 請求	每個受支援的區域：2	否	每秒 DeletePrompt 請求的數量上限。
（提示管理）每秒 GetPrompt 請求	每個受支援的區域：10	否	每秒的 GetPrompt 請求數目上限。
（提示管理） ListPrompts 每秒請求數	每個受支援的區域：10	否	ListPrompts 每秒請求數上限。
（提示管理）每個帳戶的提示	每個受支援的區域：500	是	提示數目上限。
（提示管理）每秒 UpdatePrompt 請求	每個受支援的區域：2	否	每秒 UpdatePrompt 請求的數量上限。
（提示管理）每個提示的版本	每個受支援的區域：10	否	每個提示的版本數量上限。
每個代理程式APIs	每個支援的區域：11	是	您可以新增至代理APIs 數量上限。
每個代理程式的動作群組	每個受支援的區域：20	是	您可以新增至代理程式的動作群組數目上限。
每個客服人員的客服人員協作者	每個受支援的區域：1,000	是	您可以新增至客服人員的協作者客服人員數量上限。
每個帳戶的代理程式	每個受支援的區域：1,000	是	一個帳戶中的客服人員數量上限。
每秒 AssociateAgentKnowledgeBase 請求數	每個受支援的區域：6	否	每秒 AssociateAgentKnowledgeBase API 請求的數量上限。
每個代理程式的關聯別名	每個受支援的區域：10	否	您可以與代理程式建立關聯的別名數目上限。
每個代理程式的關聯知識庫	每個受支援的區域：2	是	您可以與代理程式建立關聯的知識庫數目上限。
Amazon Nova 2 多模式內嵌 V1 的批次推論輸入檔案大小（以 GB 為單位）	每個受支援的區域：1	否	為 Amazon Nova 2 多模式內嵌 V1 批次推論提交的單一檔案大小上限（以 GB 為單位）。
Amazon Nova Premier 的批次推論輸入檔案大小（以 GB 為單位）	每個受支援的區域：1	否	為 Amazon Nova Premier 批次推論提交的單一檔案大小上限（以 GB 為單位）。
Claude 3 Haiku 的批次推論輸入檔案大小（以 GB 為單位）	每個受支援的區域：1	否	為 Claude 3 Haiku 批次推論提交的單一檔案大小上限（以 GB 為單位）。
Claude 3 Opus 的批次推論輸入檔案大小（以 GB 為單位）	每個受支援的區域：1	否	為 Claude 3 Opus 批次推論提交的單一檔案大小上限（以 GB 為單位）。
Claude 3 Sonnet 的批次推論輸入檔案大小（以 GB 為單位）	每個受支援的區域：1	否	為 Claude 3 Sonnet 批次推論提交的單一檔案大小上限（以 GB 為單位）。
Claude 3.5 Haiku 的批次推論輸入檔案大小（以 GB 為單位）	每個受支援的區域：1	否	為 Claude 3.5 Haiku 批次推論提交的單一檔案大小上限（以 GB 為單位）。
Claude 3.5 Sonnet 的批次推論輸入檔案大小（以 GB 為單位）	每個受支援的區域：1	否	為 Claude 3.5 Sonnet 批次推論提交的單一檔案大小上限（以 GB 為單位）。
Claude 3.5 Sonnet v2 的批次推論輸入檔案大小（以 GB 為單位）	每個受支援的區域：1	否	為 Claude 3.5 Sonnet v2 批次推論提交的單一檔案大小上限（以 GB 為單位）。
Claude 3.7 Sonnet 的批次推論輸入檔案大小（以 GB 為單位）	每個受支援的區域：1	是	為 Claude 3.7 Sonnet 批次推論提交的單一檔案大小上限（以 GB 為單位）。
Claude Haiku 4.5 的批次推論輸入檔案大小（以 GB 為單位）	每個受支援的區域：1	否	為 Claude Haiku 4.5 批次推論提交的單一檔案大小上限（以 GB 為單位）。
Claude Opus 4.5 的批次推論輸入檔案大小（以 GB 為單位）	每個受支援的區域：1	否	為 Claude Opus 4.5 批次推論提交的單一檔案大小上限（以 GB 為單位）。
Claude Opus 4.6 的批次推論輸入檔案大小（以 GB 為單位）	每個受支援的區域：1	否	為 Claude Opus 4.6 批次推論提交的單一檔案大小上限（以 GB 為單位）。
Claude Sonnet 4 的批次推論輸入檔案大小（以 GB 為單位）	每個受支援的區域：1	是	為 Claude Sonnet 4 批次推論提交的單一檔案大小上限（以 GB 為單位）。
Claude Sonnet 4.5 的批次推論輸入檔案大小（以 GB 為單位）	每個受支援的區域：1	否	為 Claude Sonnet 4.5 批次推論提交的單一檔案大小上限（以 GB 為單位）。
Claude Sonnet 4.6 的批次推論輸入檔案大小（以 GB 為單位）	每個受支援的區域：1	否	為 Claude Sonnet 4.6 批次推論提交的單一檔案大小上限（以 GB 為單位）。
DeepSeek V3.2 的批次推論輸入檔案大小（以 GB 為單位）	每個受支援的區域：1	否	為 DeepSeek V3.2 批次推論提交的單一檔案大小上限（以 GB 為單位）。
DeepSeek v3 的批次推論輸入檔案大小（以 GB 為單位）	每個受支援的區域：1	否	提交用於 DeepSeek v3 批次推論的單一檔案大小上限（以 GB 為單位）。
Devstral 2 123B 的批次推論輸入檔案大小（以 GB 為單位）	每個受支援的區域：1	否	為 Devstral 2 123B 批次推論提交的單一檔案大小上限（以 GB 為單位）。
GLM 4.7 的批次推論輸入檔案大小（以 GB 為單位）	每個受支援的區域：1	否	為 GLM 4.7 批次推論提交的單一檔案大小上限（以 GB 為單位）。
GLM 4.7 Flash 的批次推論輸入檔案大小（以 GB 為單位）	每個受支援的區域：1	否	為 GLM 4.7 Flash 批次推論提交的單一檔案大小上限（以 GB 為單位）。
GLM 5 的批次推論輸入檔案大小（以 GB 為單位）	每個受支援的區域：1	否	為 GLM 5 批次推論提交的單一檔案大小上限（以 GB 為單位）。
Gemma 3 12B 的批次推論輸入檔案大小（以 GB 為單位）	每個受支援的區域：1	否	為 Gemma 3 12B 批次推論提交的單一檔案大小上限（以 GB 為單位）。
Gemma 3 27B 的批次推論輸入檔案大小（以 GB 為單位）	每個受支援的區域：1	否	為 Gemma 3 27B 批次推論提交的單一檔案大小上限（以 GB 為單位）。
Gemma 3 4B 的批次推論輸入檔案大小（以 GB 為單位）	每個受支援的區域：1	否	針對 Gemma 3 4B 批次推論提交的單一檔案大小上限（以 GB 為單位）。
Kimi K2 Thinking 的批次推論輸入檔案大小（以 GB 為單位）	每個受支援的區域：1	否	提交用於批次推論的單一檔案（以 GB 為單位）的大小上限，以供 Kimi K2 Thinking 使用。
Kimi K2.5 的批次推論輸入檔案大小（以 GB 為單位）	每個受支援的區域：1	否	提交用於批次推論的單一檔案（以 GB 為單位）大小上限，適用於 Kimi K2.5。
Llama 3.1 405B Instruct 的批次推論輸入檔案大小（以 GB 為單位）	每個受支援的區域：1	否	為 Llama 3.1 405B Instruct 批次推論提交的單一檔案大小上限（以 GB 為單位）。
Llama 3.1 70B Instruct 的批次推論輸入檔案大小（以 GB 為單位）	每個受支援的區域：1	否	為 Llama 3.1 70B Instruct 批次推論提交的單一檔案大小上限（以 GB 為單位）。
Llama 3.1 8B Instruct 的批次推論輸入檔案大小（以 GB 為單位）	每個受支援的區域：1	否	為 Llama 3.1 8B Instruct 批次推論提交的單一檔案大小上限（以 GB 為單位）。
Llama 3.2 11B Instruct 的批次推論輸入檔案大小（以 GB 為單位）	每個受支援的區域：1	否	為 Llama 3.2 11B Instruct 批次推論提交的單一檔案大小上限（以 GB 為單位）。
Llama 3.2 1B 指示的批次推論輸入檔案大小（以 GB 為單位）	每個受支援的區域：1	否	針對批次推論 Llama 3.2 1B Instruct 提交的單一檔案大小上限（以 GB 為單位）。
Llama 3.2 3B Instruct 的批次推論輸入檔案大小（以 GB 為單位）	每個受支援的區域：1	否	為 Llama 3.2 3B Instruct 批次推論提交的單一檔案大小上限（以 GB 為單位）。
Llama 3.2 90B Instruct 的批次推論輸入檔案大小（以 GB 為單位）	每個受支援的區域：1	否	為 Llama 3.2 90B Instruct 批次推論提交的單一檔案大小上限（以 GB 為單位）。
Llama 3.3 70B Instruct 的批次推論輸入檔案大小（以 GB 為單位）	每個受支援的區域：1	否	為 Llama 3.3 70B Instruct 批次推論提交的單一檔案大小上限（以 GB 為單位）。
Llama 4 Maverick 的批次推論輸入檔案大小（以 GB 為單位）	每個受支援的區域：1	否	為 Llama 4 Maverick 批次推論提交的單一檔案大小上限（以 GB 為單位）。
Llama 4 Scout 的批次推論輸入檔案大小（以 GB 為單位）	每個受支援的區域：1	否	為 Llama 4 Scout 批次推論提交的單一檔案大小上限（以 GB 為單位）。
Magistral Small 2509 的批次推論輸入檔案大小（以 GB 為單位）	每個受支援的區域：1	否	為 Magistral Small 2509 批次推論提交的單一檔案大小上限（以 GB 為單位）。
MiniMax M2 的批次推論輸入檔案大小（以 GB 為單位）	每個受支援的區域：1	否	為 MiniMax M2 批次推論提交的單一檔案大小上限（以 GB 為單位）。
MiniMax M2.1 的批次推論輸入檔案大小（以 GB 為單位）	每個受支援的區域：1	否	為 MiniMax M2.1 批次推論提交的單一檔案大小上限（以 GB 為單位）。
MiniMax M2.5 的批次推論輸入檔案大小（以 GB 為單位）	每個受支援的區域：1	否	為 MiniMax M2.5 批次推論提交的單一檔案大小上限（以 GB 為單位）。
Ministral 3 14B 的批次推論輸入檔案大小（以 GB 為單位）	每個受支援的區域：1	否	針對 Ministral 3 14B 批次推論提交的單一檔案大小上限（以 GB 為單位）。
Ministral 3 8B 的批次推論輸入檔案大小（以 GB 為單位）	每個受支援的區域：1	否	針對 Ministral 3 8B 批次推論提交的單一檔案大小上限（以 GB 為單位）。
Ministral 3B 的批次推論輸入檔案大小（以 GB 為單位）	每個受支援的區域：1	否	針對 Ministral 3B 批次推論提交的單一檔案大小上限（以 GB 為單位）。
Mistral Large 2 (24.07) 的批次推論輸入檔案大小（以 GB 為單位）	每個受支援的區域：1	否	為 Mistral Large 2 (24.07) 批次推論提交的單一檔案大小上限（以 GB 為單位）。
Mistral Large 3 的批次推論輸入檔案大小（以 GB 為單位）	每個受支援的區域：1	否	為 Mistral Large 3 批次推論提交的單一檔案大小上限（以 GB 為單位）。
Mistral Small 的批次推論輸入檔案大小（以 GB 為單位）	每個受支援的區域：1	否	為 Mistral Small 批次推論提交的單一檔案大小上限（以 GB 為單位）。
NVIDIA Nemotron 3 Super 120B A12B 的批次推論輸入檔案大小（以 GB 為單位）	每個受支援的區域：1	否	提交用於 NVIDIA Nemotron 3 Super 120B A12B 批次推論的單一檔案大小上限（以 GB 為單位）。
NVIDIA Nemotron Nano 12B 的批次推論輸入檔案大小（以 GB 為單位）	每個受支援的區域：1	否	提交用於 NVIDIA Nemotron Nano 12B 批次推論的單一檔案大小上限（以 GB 為單位）。
NVIDIA Nemotron Nano 3 30B 的批次推論輸入檔案大小（以 GB 為單位）	每個受支援的區域：1	否	提交用於 NVIDIA Nemotron Nano 3 30B 批次推論的單一檔案大小上限（以 GB 為單位）。
NVIDIA Nemotron Nano 9B 的批次推論輸入檔案大小（以 GB 為單位）	每個受支援的區域：1	否	提交用於 NVIDIA Nemotron Nano 9B 批次推論的單一檔案大小上限（以 GB 為單位）。
Nova 2 Lite 的批次推論輸入檔案大小（以 GB 為單位）	每個受支援的區域：1	否	為 Nova 2 Lite 批次推論提交的單一檔案大小上限（以 GB 為單位）。
Nova Lite V1 的批次推論輸入檔案大小（以 GB 為單位）	每個受支援的區域：1	否	為 Nova Lite V1 批次推論提交的單一檔案大小上限（以 GB 為單位）。
Nova Micro V1 的批次推論輸入檔案大小（以 GB 為單位）	每個受支援的區域：1	否	為 Nova Micro V1 批次推論提交的單一檔案大小上限（以 GB 為單位）。
Nova Pro V1 的批次推論輸入檔案大小（以 GB 為單位）	每個受支援的區域：1	否	為 Nova Pro V1 批次推論提交的單一檔案大小上限（以 GB 為單位）。
OpenAI GPT OSS 120b 的批次推論輸入檔案大小（以 GB 為單位）	每個受支援的區域：1	否	針對 OpenAI GPT OSS 120b 批次推論提交的單一檔案大小上限（以 GB 為單位）。
OpenAI GPT OSS 20b 的批次推論輸入檔案大小（以 GB 為單位）	每個受支援的區域：1	否	針對 OpenAI GPT OSS 20b 批次推論提交的單一檔案大小上限（以 GB 為單位）。
OpenAI GPT OSS Safeguard 120b 的批次推論輸入檔案大小（以 GB 為單位）	每個受支援的區域：1	否	為 OpenAI GPT OSS Safeguard 120b 批次推論提交的單一檔案大小上限（以 GB 為單位）。
OpenAI GPT OSS Safeguard 20b 的批次推論輸入檔案大小（以 GB 為單位）	每個受支援的區域：1	否	為 OpenAI GPT OSS Safeguard 20b 批次推論提交的單一檔案大小上限（以 GB 為單位）。
Qwen3 235B 的批次推論輸入檔案大小（以 GB 為單位）	每個受支援的區域：1	否	為 Qwen3 235B 批次推論提交的單一檔案大小上限（以 GB 為單位）。
Qwen3 32B 的批次推論輸入檔案大小（以 GB 為單位）	每個受支援的區域：1	否	為 Qwen3 32B 批次推論提交的單一檔案大小上限（以 GB 為單位）。
Qwen3 Coder 30B 的批次推論輸入檔案大小（以 GB 為單位）	每個受支援的區域：1	否	為 Qwen3 Coder 30B 批次推論提交的單一檔案大小上限（以 GB 為單位）。
Qwen3 Coder 480B 的批次推論輸入檔案大小（以 GB 為單位）	每個受支援的區域：1	否	為 Qwen3 Coder 480B 批次推論提交的單一檔案大小上限（以 GB 為單位）。
Qwen3 Coder Next 的批次推論輸入檔案大小（以 GB 為單位）	每個受支援的區域：1	否	為 Qwen3 Coder Next 批次推論提交的單一檔案大小上限（以 GB 為單位）。
Qwen3 Next 80B 的批次推論輸入檔案大小（以 GB 為單位）	每個受支援的區域：1	否	為 Qwen3 Next 80B 批次推論提交的單一檔案大小上限（以 GB 為單位）。
Qwen3 VL 235B 的批次推論輸入檔案大小（以 GB 為單位）	每個受支援的區域：1	否	為 Qwen3 VL 235B 批次推論提交的單一檔案大小上限（以 GB 為單位）。
Titan Multimodal Embeddings G1 的批次推論輸入檔案大小（以 GB 為單位）	每個受支援的區域：1	否	為 Titan Multimodal Embeddings G1 批次推論提交的單一檔案大小上限（以 GB 為單位）。
Titan Text Embeddings V2 的批次推論輸入檔案大小（以 GB 為單位）	每個受支援的區域：1	否	為 Titan Text Embeddings V2 批次推論提交的單一檔案大小上限（以 GB 為單位）。
Voxtral Mini 3B 2507 的批次推論輸入檔案大小（以 GB 為單位）	每個受支援的區域：1	否	為 Voxtral Mini 3B 2507 批次推論提交的單一檔案大小上限（以 GB 為單位）。
Voxtral Small 24B 2507 的批次推論輸入檔案大小（以 GB 為單位）	每個受支援的區域：1	否	為 Voxtral Small 24B 2507 批次推論提交的單一檔案大小上限（以 GB 為單位）。
Writer Palmyra Vision 7B 的批次推論輸入檔案大小（以 GB 為單位）	每個受支援的區域：1	否	為寫入器 Palmyra Vision 7B 批次推論提交的單一檔案大小上限（以 GB 為單位）。
Qwen3 Next 80B 的批次推論任務大小（以 GB 為單位）	每個受支援的區域：5	否	Qwen3 Next 80B 批次推論任務中包含的所有輸入檔案（以 GB 為單位）累積大小上限。
Amazon Nova 2 多模式內嵌 V1 的批次推論任務大小（以 GB 為單位）	每個受支援的區域：100	否	Amazon Nova 2 Multimodal Embeddings V1 批次推論任務中包含的所有輸入檔案（以 GB 為單位）的最大累積大小。
Amazon Nova Premier 的批次推論任務大小（以 GB 為單位）	每個受支援的區域：5	否	Amazon Nova Premier 批次推論任務中包含的所有輸入檔案（以 GB 為單位）累積大小上限。
Claude 3 Haiku 的批次推論任務大小（以 GB 為單位）	每個受支援的區域：5	否	Claude 3 Haiku 批次推論任務中包含的所有輸入檔案（以 GB 為單位）累積大小上限。
Claude 3 Opus 的批次推論任務大小（以 GB 為單位）	每個受支援的區域：5	否	Claude 3 Opus 批次推論任務中包含的所有輸入檔案（以 GB 為單位）累積大小上限。
Claude 3 Sonnet 的批次推論任務大小（以 GB 為單位）	每個受支援的區域：5	否	Claude 3 Sonnet 批次推論任務中包含的所有輸入檔案（以 GB 為單位）的累積大小上限。
Claude 3.5 Haiku 的批次推論任務大小（以 GB 為單位）	每個受支援的區域：5	否	Claude 3.5 Haiku 批次推論任務中包含的所有輸入檔案（以 GB 為單位）累積大小上限。
Claude 3.5 Sonnet 的批次推論任務大小（以 GB 為單位）	每個受支援的區域：5	否	Claude 3.5 Sonnet 批次推論任務中包含的所有輸入檔案（以 GB 為單位）累積大小上限。
Claude 3.5 Sonnet v2 的批次推論任務大小（以 GB 為單位）	每個受支援的區域：5	否	Claude 3.5 Sonnet v2 批次推論任務中包含的所有輸入檔案（以 GB 為單位）的最大累積大小。
Claude 3.7 Sonnet 的批次推論任務大小（以 GB 為單位）	每個受支援的區域：5	是	Claude 3.7 Sonnet 批次推論任務中包含的所有輸入檔案（以 GB 為單位）累積大小上限。
Claude Haiku 4.5 的批次推論任務大小（以 GB 為單位）	每個受支援的區域：5	否	Claude Haiku 4.5 批次推論任務中包含的所有輸入檔案（以 GB 為單位）累積大小上限。
Claude Opus 4.5 的批次推論任務大小（以 GB 為單位）	每個受支援的區域：5	否	Claude Opus 4.5 批次推論任務中包含的所有輸入檔案（以 GB 為單位）累積大小上限。
Claude Opus 4.6 的批次推論任務大小（以 GB 為單位）	每個受支援的區域：5	否	Claude Opus 4.6 批次推論任務中包含的所有輸入檔案（以 GB 為單位）累積大小上限。
Claude Sonnet 4 的批次推論任務大小（以 GB 為單位）	每個受支援的區域：5	是	Claude Sonnet 4 批次推論任務中包含的所有輸入檔案（以 GB 為單位）累積大小上限。
Claude Sonnet 4.5 的批次推論任務大小（以 GB 為單位）	每個受支援的區域：5	否	Claude Sonnet 4.5 批次推論任務中包含的所有輸入檔案（以 GB 為單位）累積大小上限。
Claude Sonnet 4.6 的批次推論任務大小（以 GB 為單位）	每個受支援的區域：5	否	Claude Sonnet 4.6 批次推論任務中包含的所有輸入檔案（以 GB 為單位）累積大小上限。
DeepSeek V3.2 的批次推論任務大小（以 GB 為單位）	每個受支援的區域：5	否	DeepSeek V3.2 批次推論任務中包含的所有輸入檔案（以 GB 為單位）累積大小上限。
DeepSeek v3 的批次推論任務大小（以 GB 為單位）	每個受支援的區域：5	否	DeepSeek v3 批次推論任務中包含的所有輸入檔案（以 GB 為單位）累積大小上限。
Devstral 2 123B 的批次推論任務大小（以 GB 為單位）	每個受支援的區域：5	否	Devstral 2 123B 批次推論任務中包含的所有輸入檔案（以 GB 為單位）累積大小上限。
GLM 4.7 的批次推論任務大小（以 GB 為單位）	每個受支援的區域：5	否	GLM 4.7 批次推論任務中包含的所有輸入檔案（以 GB 為單位）累積大小上限。
GLM 4.7 Flash 的批次推論任務大小（以 GB 為單位）	每個受支援的區域：5	否	GLM 4.7 Flash 批次推論任務中包含的所有輸入檔案（以 GB 為單位）累積大小上限。
GLM 5 的批次推論任務大小（以 GB 為單位）	每個受支援的區域：5	否	GLM 5 批次推論任務中包含的所有輸入檔案（以 GB 為單位）累積大小上限。
Gemma 3 12B 的批次推論任務大小（以 GB 為單位）	每個受支援的區域：5	否	Gemma 3 12B 批次推論任務中包含的所有輸入檔案（以 GB 為單位）累積大小上限。
Gemma 3 27B 的批次推論任務大小（以 GB 為單位）	每個受支援的區域：5	否	Gemma 3 27B 批次推論任務中包含的所有輸入檔案（以 GB 為單位）累積大小上限。
Gemma 3 4B 的批次推論任務大小（以 GB 為單位）	每個受支援的區域：5	否	Gemma 3 4B 批次推論任務中包含的所有輸入檔案（以 GB 為單位）累積大小上限。
適用於 Kimi K2 Thinking 的批次推論任務大小（以 GB 為單位）	每個受支援的區域：5	否	批次推論任務中包含的所有輸入檔案（以 GB 為單位）的累積大小上限，適用於 Kimi K2 Thinking。
Kimi K2.5 的批次推論任務大小（以 GB 為單位）	每個受支援的區域：5	否	Kimi K2.5 批次推論任務中包含的所有輸入檔案（以 GB 為單位）的累積大小上限。
Llama 3.1 405B Instruct 的批次推論任務大小（以 GB 為單位）	每個受支援的區域：5	否	Llama 3.1 405B Instruct 批次推論任務中包含的所有輸入檔案（以 GB 為單位）的最大累積大小。
Llama 3.1 70B Instruct 的批次推論任務大小（以 GB 為單位）	每個受支援的區域：5	否	Llama 3.1 70B Instruct 批次推論任務中包含的所有輸入檔案（以 GB 為單位）累積大小上限。
Llama 3.1 8B Instruct 的批次推論任務大小（以 GB 為單位）	每個受支援的區域：5	否	Llama 3.1 8B Instruct 批次推論任務中包含的所有輸入檔案（以 GB 為單位）的最大累積大小。
Llama 3.2 11B Instruct 的批次推論任務大小（以 GB 為單位）	每個受支援的區域：5	否	Llama 3.2 11B Instruct 批次推論任務中包含的所有輸入檔案（以 GB 為單位）累積大小上限。
Llama 3.2 1B Instruct 的批次推論任務大小（以 GB 為單位）	每個受支援的區域：5	否	Llama 3.2 1B Instruct 批次推論任務中包含的所有輸入檔案（以 GB 為單位）的最大累積大小。
Llama 3.2 3B Instruct 的批次推論任務大小（以 GB 為單位）	每個受支援的區域：5	否	Llama 3.2 3B Instruct 批次推論任務中包含的所有輸入檔案（以 GB 為單位）累積大小上限。
Llama 3.2 90B 指示的批次推論任務大小（以 GB 為單位）	每個受支援的區域：5	否	Llama 3.2 90B Instruct 批次推論任務中包含的所有輸入檔案（以 GB 為單位）累積大小上限。
Llama 3.3 70B Instruct 的批次推論任務大小（以 GB 為單位）	每個受支援的區域：5	否	Llama 3.3 70B Instruct 批次推論任務中包含的所有輸入檔案（以 GB 為單位）累積大小上限。
Llama 4 Maverick 的批次推論任務大小（以 GB 為單位）	每個受支援的區域：5	否	Llama 4 Maverick 批次推論任務中包含的所有輸入檔案（以 GB 為單位）累積大小上限。
Llama 4 Scout 的批次推論任務大小（以 GB 為單位）	每個受支援的區域：5	否	Llama 4 Scout 批次推論任務中包含的所有輸入檔案（以 GB 為單位）累積大小上限。
Magistral Small 2509 的批次推論任務大小（以 GB 為單位）	每個受支援的區域：5	否	Magistral Small 2509 批次推論任務中包含的所有輸入檔案（以 GB 為單位）累積大小上限。
MiniMax M2 的批次推論任務大小（以 GB 為單位）	每個受支援的區域：5	否	MiniMax M2 批次推論任務中包含的所有輸入檔案（以 GB 為單位）累積大小上限。
MiniMax M2.1 的批次推論任務大小（以 GB 為單位）	每個受支援的區域：5	否	MiniMax M2.1 批次推論任務中包含的所有輸入檔案（以 GB 為單位）累積大小上限。
MiniMax M2.5 的批次推論任務大小（以 GB 為單位）	每個受支援的區域：5	否	MiniMax M2.5 批次推論任務中包含的所有輸入檔案（以 GB 為單位）的最大累積大小。
Ministral 3 14B 的批次推論任務大小（以 GB 為單位）	每個受支援的區域：5	否	Ministral 3 14B 批次推論任務中包含的所有輸入檔案（以 GB 為單位）的最大累積大小。
Ministral 3 8B 的批次推論任務大小（以 GB 為單位）	每個受支援的區域：5	否	Ministral 3 8B 批次推論任務中包含的所有輸入檔案（以 GB 為單位）的最大累積大小。
Ministral 3B 的批次推論任務大小（以 GB 為單位）	每個受支援的區域：5	否	Ministral 3B 批次推論任務中包含的所有輸入檔案（以 GB 為單位）累積大小上限。
Mistral Large 2 (24.07) 的批次推論任務大小（以 GB 為單位）	每個受支援的區域：5	否	Mistral Large 2 (24.07) 批次推論任務中包含的所有輸入檔案（以 GB 為單位）累積大小上限。
Mistral Large 3 的批次推論任務大小（以 GB 為單位）	每個受支援的區域：5	否	Mistral Large 3 批次推論任務中包含的所有輸入檔案（以 GB 為單位）累積大小上限。
Mistral Small 的批次推論任務大小（以 GB 為單位）	每個受支援的區域：5	否	Mistral Small 批次推論任務中包含的所有輸入檔案（以 GB 為單位）累積大小上限。
NVIDIA Nemotron 3 Super 120B A12B 的批次推論任務大小（以 GB 為單位）	每個受支援的區域：5	否	NVIDIA Nemotron 3 Super 120B A12B 批次推論任務中包含的所有輸入檔案（以 GB 為單位）累積大小上限。
NVIDIA Nemotron Nano 12B 的批次推論任務大小（以 GB 為單位）	每個受支援的區域：5	否	NVIDIA Nemotron Nano 12B 批次推論任務中包含的所有輸入檔案（以 GB 為單位）累積大小上限。
NVIDIA Nemotron Nano 3 30B 的批次推論任務大小（以 GB 為單位）	每個受支援的區域：5	否	NVIDIA Nemotron Nano 3 30B 批次推論任務中包含的所有輸入檔案（以 GB 為單位）累積大小上限。
NVIDIA Nemotron Nano 9B 的批次推論任務大小（以 GB 為單位）	每個受支援的區域：5	否	NVIDIA Nemotron Nano 9B 批次推論任務中包含的所有輸入檔案（以 GB 為單位）累積大小上限。
Nova Lite V1 的批次推論任務大小（以 GB 為單位）	每個受支援的區域：100	否	Nova Lite V1 批次推論任務中包含的所有輸入檔案（以 GB 為單位）累積大小上限。
Nova Micro V1 的批次推論任務大小（以 GB 為單位）	每個受支援的區域：5	否	Nova Micro V1 批次推論任務中包含的所有輸入檔案（以 GB 為單位）累積大小上限。
Nova Pro V1 的批次推論任務大小（以 GB 為單位）	每個受支援的區域：100	否	Nova Pro V1 批次推論任務中包含的所有輸入檔案（以 GB 為單位）累積大小上限。
OpenAI GPT OSS 120b 的批次推論任務大小（以 GB 為單位）	每個受支援的區域：5	否	OpenAI GPT OSS 120b 批次推論任務中包含的所有輸入檔案（以 GB 為單位）的最大累積大小。
OpenAI GPT OSS 20b 的批次推論任務大小（以 GB 為單位）	每個受支援的區域：5	否	OpenAI GPT OSS 20b 批次推論任務中包含的所有輸入檔案（以 GB 為單位）的最大累積大小。
OpenAI GPT OSS Safeguard 120b 的批次推論任務大小（以 GB 為單位）	每個受支援的區域：5	否	OpenAI GPT OSS Safeguard 120b 批次推論任務中包含的所有輸入檔案（以 GB 為單位）的最大累積大小。
OpenAI GPT OSS Safeguard 20b 的批次推論任務大小（以 GB 為單位）	每個受支援的區域：5	否	OpenAI GPT OSS Safeguard 20b 批次推論任務中包含的所有輸入檔案（以 GB 為單位）的最大累積大小。
Qwen3 235B 的批次推論任務大小（以 GB 為單位）	每個受支援的區域：5	否	Qwen3 235B 批次推論任務中包含的所有輸入檔案（以 GB 為單位）累積大小上限。
Qwen3 32B 的批次推論任務大小（以 GB 為單位）	每個受支援的區域：5	否	Qwen3 32B 批次推論任務中包含的所有輸入檔案（以 GB 為單位）累積大小上限。
Qwen3 Coder 30B 的批次推論任務大小（以 GB 為單位）	每個受支援的區域：5	否	Qwen3 Coder 30B 批次推論任務中包含的所有輸入檔案（以 GB 為單位）累積大小上限。
Qwen3 Coder 480B 的批次推論任務大小（以 GB 為單位）	每個受支援的區域：5	否	Qwen3 Coder 480B 批次推論任務中包含的所有輸入檔案（以 GB 為單位）的最大累積大小。
Qwen3 Coder Next 的批次推論任務大小（以 GB 為單位）	每個受支援的區域：5	否	Qwen3 Coder Next 批次推論任務中包含的所有輸入檔案（以 GB 為單位）的累積大小上限。
Qwen3 VL 235B 的批次推論任務大小（以 GB 為單位）	每個受支援的區域：5	否	Qwen3 VL 235B 批次推論任務中包含的所有輸入檔案（以 GB 為單位）累積大小上限。
Titan Multimodal Embeddings G1 的批次推論任務大小（以 GB 為單位）	每個受支援的區域：5	否	Titan Multimodal Embeddings G1 批次推論任務中包含的所有輸入檔案（以 GB 為單位）累積大小上限。
Titan Text Embeddings V2 的批次推論任務大小（以 GB 為單位）	每個受支援的區域：5	否	Titan Text Embeddings V2 批次推論任務中包含的所有輸入檔案（以 GB 為單位）累積大小上限。
Voxtral Mini 3B 2507 的批次推論任務大小（以 GB 為單位）	每個受支援的區域：5	否	Voxtral Mini 3B507 批次推論任務中包含的所有輸入檔案（以 GB 為單位）的最大累積大小。
Voxtral Small 24B 2507 的批次推論任務大小（以 GB 為單位）	每個受支援的區域：5	否	Voxtral Small 24B 2507 批次推論任務中包含的所有輸入檔案（以 GB 為單位）累積大小上限。
Writer Palmyra Vision 7B 的批次推論任務大小（以 GB 為單位）	每個受支援的區域：5	否	Writer Palmyra Vision 7B 批次推論任務中包含的所有輸入檔案（以 GB 為單位）累積大小上限。
代理程式指示中的字元數	每個受支援的區域：20,000	否	客服人員指示中的字元數上限。
並行模型匯入任務	每個受支援的區域：1	否	同時進行中的模型匯入任務數量上限。
每秒 CreateAgent 請求數	每個受支援的區域：6	否	每秒 CreateAgent API 請求的數量上限。
每秒 CreateAgentActionGroup 請求數	每個支援的區域：12	否	每秒 CreateAgentActionGroup API 請求的數量上限。
每秒 CreateAgentAlias 請求數	每個受支援的區域：2	否	每秒 CreateAgentAlias API 請求的數量上限。
Anthropic Claude 3.5 Haiku 每分鐘跨區域模型推論請求	每個受支援的區域：2,000	否	您可以在一分鐘內呼叫 InvokeModel 和 InvokeModelWithResponseStream 的次數上限。配額會考慮 Anthropic Claude 3.5 Haiku 的 InvokeModel 和 InvokeModelWithResponseStream 權杖的合併總和。
Anthropic Claude 3.5 Sonnet V2 的每分鐘跨區域模型推論請求	us-west-2：500 每個其他支援的區域：100	否	Anthropic Claude 3.5 Sonnet V2 在一分鐘內可以呼叫模型推論的次數上限。配額會考慮 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的合併總和。
Anthropic Claude 3.5 Haiku 的每分鐘跨區域模型推論字符	每個支援的區域：4，000，000	是	您可以在一分鐘內提交模型推論的隨需權杖數量上限。配額會考慮對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream for Anthropic Claude 3.5 Haiku 的所有請求的輸入和輸出字符的合併總和。
Anthropic Claude 3.5 Sonnet V2 的每分鐘跨區域模型推論字符	us-west-2：4，000，000 每個其他支援的區域：800，000	是	您可以在一分鐘內為 Anthropic Claude 3.5 Sonnet V2 提交模型推論的字符數量上限。配額會考慮 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的合併總和。
Amazon Nova 2 Lite 的每分鐘跨區域模型推論請求	每個受支援的區域：2,000	否	對於 Amazon Nova 2 Lite，您可以在一分鐘內提交模型推論的跨區域請求數量上限。此配額代表對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 動作的請求總數。
Amazon Nova 2 Omni 的每分鐘跨區域模型推論請求	每個受支援的區域：2,000	否	對於 Amazon Nova 2 Omni，您可以在一分鐘內提交模型推論的跨區域請求數量上限。此配額代表對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 動作的請求總數。
Amazon Nova 2 Pro Preview 的每分鐘跨區域模型推論請求	每個受支援的區域：100	否	您可以在一分鐘內為 Amazon Nova 2 Pro Preview 提交模型推論的跨區域請求數量上限。此配額代表對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 動作的請求總數。
Amazon Nova Lite 每分鐘跨區域模型推論請求	us-east-1：4，000 us-east-2：4，000 us-west-1：4，000 us-west-2：4，000 每個其他支援的區域：400	否	您可以在一分鐘內為 Amazon Nova Lite 提交模型推論的跨區域請求數量上限。此配額代表對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 動作的請求總數。
Amazon Nova Micro 每分鐘跨區域模型推論請求	us-east-1：4，000 us-east-2：4，000 us-west-2：4，000 每個其他支援的區域：400	否	您可以在一分鐘內為 Amazon Nova Micro 提交模型推論的跨區域請求數量上限。此配額代表對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 動作的請求總數。
Amazon Nova Premier V1 的每分鐘跨區域模型推論請求	每個受支援的區域：500	否	對於 Amazon Nova Premier V1，您可以在一分鐘內提交模型推論的跨區域請求數量上限。此配額代表對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 動作的請求總數。
Amazon Nova Pro 的每分鐘跨區域模型推論請求	每個受支援的區域：500	否	您可以為 Amazon Nova Pro 在一分鐘內提交模型推論的跨區域請求數量上限。此配額代表對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 動作的請求總數。
Anthropic Claude 3 Haiku 的每分鐘跨區域模型推論請求	us-east-1：2，000 us-west-2：2，000 ap-northeast-1：400 ap-southeast-1：400 每個其他支援的區域：800	否	您可以在一分鐘內呼叫模型推論的次數上限。配額會考慮 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream for Anthropic Claude 3 Haiku 的合併總和。
Anthropic Claude 3 Opus 的每分鐘跨區域模型推論請求	每個受支援的區域：100	否	針對 Anthropic Claude 3 Opus，您可以在一分鐘內提交模型推論的跨區域請求數量上限。此配額代表對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 動作的請求總數。
Anthropic Claude 3 Sonnet 的每分鐘跨區域模型推論請求	us-east-1：1，000 us-west-2：1，000 每個其他支援的區域：200	否	您可以在一分鐘內呼叫模型推論的次數上限。配額會考慮 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream for Anthropic Claude 3 Sonnet 的合併總和。
Anthropic Claude 3.5 Sonnet 每分鐘跨區域模型推論請求	us-west-2：500 ap-northeast-1：40 ap-southeast-1：40 eu-central-1：40 eu-west-1：40 eu-west-3：40 每個其他支援的區域：100	否	Anthropic Claude 3.5 Sonnet 在一分鐘內可以呼叫模型推論的次數上限。配額會考慮 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的合併總和。
Anthropic Claude 3.7 Sonnet V1 的每分鐘跨區域模型推論請求	us-east-1：250 us-east-2：250 us-west-2：250 eu-central-1：100 eu-north-1：100 eu-west-1：100 eu-west-3：100 每個其他支援的區域：50	否	針對 Anthropic Claude 3.7 Sonnet V1，您可以在一分鐘內提交模型推論的跨區域請求數目上限。此配額代表對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 動作的請求總數。
Anthropic Claude Haiku 4.5 的每分鐘跨區域模型推論請求	每個受支援的區域：10,000	是	對於 Anthropic Claude Haiku 4.5，您可以在一分鐘內提交模型推論的跨區域請求數量上限。此配額代表對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 動作的請求總數。
Anthropic Claude Opus 4 V1 的每分鐘跨區域模型推論請求	每個受支援的區域：200	否	對於 Anthropic Claude Opus 4 V1，您可以在一分鐘內提交模型推論的跨區域請求數量上限。此配額代表對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 動作的請求總數。
Anthropic Claude Opus 4.1 的每分鐘跨區域模型推論請求	每個受支援的區域：50	否	對於 Anthropic Claude Opus 4.1，您可以在一分鐘內提交模型推論的跨區域請求數量上限。此配額代表對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 動作的請求總數。
Anthropic Claude Opus 4.5 的每分鐘跨區域模型推論請求	每個受支援的區域：10,000	是	對於 Anthropic Claude Opus 4.5，您可以在一分鐘內提交模型推論的跨區域請求數量上限。此配額代表對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 動作的請求總數。
Anthropic Claude Opus 4.6 V1 的每分鐘跨區域模型推論請求	每個受支援的區域：10,000	是	針對 Anthropic Claude Opus 4.6 V1，您可以在一分鐘內提交模型推論的跨區域請求數量上限。此配額代表對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 動作的請求總數。
Anthropic Claude Sonnet 4 V1 的每分鐘跨區域模型推論請求	每個受支援的區域：200	是	對於 Anthropic Claude Sonnet 4 V1，您可以在一分鐘內提交模型推論的跨區域請求數量上限。此配額代表對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 動作的請求總數。
Anthropic Claude Sonnet 4 V1 1M 內容長度的每分鐘跨區域模型推論請求	每個受支援的區域：5	是	對於 Anthropic Claude Sonnet 4 V1 1M 內容長度，您可以在一分鐘內提交模型推論的跨區域請求數目上限。此配額代表對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 動作的請求總數。
Anthropic Claude Sonnet 4.5 V1 的每分鐘跨區域模型推論請求	每個受支援的區域：10,000	是	您可以在一分鐘內為 Anthropic Claude Sonnet 4.5 V1 提交模型推論的跨區域請求數量上限。此配額代表對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 動作的請求總數。
Anthropic Claude Sonnet 4.5 V1 1M 內容長度的每分鐘跨區域模型推論請求	每個受支援的區域：1,000	是	針對 Anthropic Claude Sonnet 4.5 V1 1M 內容長度，您可以在一分鐘內提交模型推論的跨區域請求數目上限。此配額代表對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 動作的請求總數。
Anthropic Claude Sonnet 4.6 的每分鐘跨區域模型推論請求	每個受支援的區域：10,000	是	針對 Anthropic Claude Sonnet 4.6，您可以在一分鐘內提交模型推論的跨區域請求數量上限。此配額代表對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 動作的請求總數。
Cohere Embed V4 的每分鐘跨區域模型推論請求	每個受支援的區域：2,000	否	您可以在一分鐘內針對 Cohere Embed V4 提交模型推論的跨區域請求數量上限。此配額代表對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 動作的請求總數。
DeepSeek R1 V1 的每分鐘跨區域模型推論請求	每個受支援的區域：200	否	您可以針對 DeepSeek R1 V1 在一分鐘內提交模型推論的跨區域請求數量上限。此配額代表對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 動作的請求總數。
Meta Llama 3.1 405B Instruct 的每分鐘跨區域模型推論請求	每個支援的區域：400	否	對於 Meta Llama 3.1 405B Instruct，您可以在一分鐘內提交模型推論的跨區域請求數量上限。此配額代表對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 動作的請求總數。
Meta Llama 3.1 70B Instruct 每分鐘跨區域模型推論請求	每個支援的區域：800	否	對於 Meta Llama 3.1 70B Instruct，您可以在一分鐘內提交模型推論的跨區域請求數量上限。此配額代表對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 動作的請求總數。
Meta Llama 3.1 8B Instruct 的每分鐘跨區域模型推論請求	每個支援的區域：1，600	否	對於 Meta Llama 3.1 8B Instruct，您可以在一分鐘內提交模型推論的跨區域請求數量上限。此配額代表對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 動作的請求總數。
Meta Llama 3.2 1B Instruct 的每分鐘跨區域模型推論請求	每個支援的區域：1，600	否	對於 Meta Llama 3.2 1B Instruct，您可以在一分鐘內提交模型推論的跨區域請求數量上限。此配額代表對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 動作的請求總數。
Meta Llama 3.2 3B Instruct 每分鐘跨區域模型推論請求	每個支援的區域：1，600	否	對於 Meta Llama 3.2 3B Instruct，您可以在一分鐘內呼叫模型推論的次數上限。配額會考慮 InvokeModel、InvokeModelWithResponseStream、Converse 和 ConverseStream 的請求總和。
Meta Llama 3.3 70B Instruct 每分鐘跨區域模型推論請求	每個支援的區域：800	否	對於 Meta Llama 3.3 70B Instruct，您可以在一分鐘內提交模型推論的跨區域請求數量上限。此配額代表對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 動作的請求總數。
Meta Llama 4 Maverick V1 的每分鐘跨區域模型推論請求	每個支援的區域：800	否	對於 Meta Llama 4 Maverick V1，您可以在一分鐘內提交模型推論的跨區域請求數量上限。此配額代表對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 動作的請求總數。
Meta Llama 4 定位器 V1 的每分鐘跨區域模型推論請求	每個支援的區域：800	否	針對 Meta Llama 4 Scout V1，您可以在一分鐘內提交模型推論的跨區域請求數量上限。此配額代表對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 動作的請求總數。
Mistral Pixtral Large 25.02 V1 的每分鐘跨區域模型推論請求	每個受支援的區域：10	否	對於 Mistral Pixtral Large 25.02 V1，您可以在一分鐘內提交模型推論的跨區域請求數目上限。此配額代表對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 動作的請求總數。
穩定映像保守擴展的每分鐘跨區域模型推論請求	每個受支援的區域：4	否	針對穩定映像保守擴展，您可以在一分鐘內提交模型推論的跨區域請求數目上限。此配額代表對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 動作的請求總數。
穩定影像控制草圖每分鐘的跨區域模型推論請求	每個受支援的區域：20	否	您可以在一分鐘內針對穩定影像控制草圖提交模型推論的跨區域請求數目上限。此配額代表對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 動作的請求總數。
穩定影像控制結構的每分鐘跨區域模型推論請求	每個受支援的區域：20	否	您可以在一分鐘內針對穩定影像控制結構提交模型推論的跨區域請求數目上限。此配額代表對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 動作的請求總數。
穩定映像 Creative Upscale 的每分鐘跨區域模型推論請求	每個受支援的區域：4	否	您可以為穩定映像 Creative Upscale 在一分鐘內提交模型推論的跨區域請求數量上限。此配額代表對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 動作的請求總數。
穩定映像清除物件的每分鐘跨區域模型推論請求	每個受支援的區域：20	否	針對穩定映像清除物件，您可以在一分鐘內提交模型推論的跨區域請求數目上限。此配額代表對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 動作的請求總數。
穩定映像快速擴展的每分鐘跨區域模型推論請求	每個受支援的區域：20	否	針對穩定映像快速擴展，您可以在一分鐘內提交模型推論的跨區域請求數目上限。此配額代表對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 動作的請求總數。
穩定映像注入的每分鐘跨區域模型推論請求	每個受支援的區域：20	否	針對穩定映像注入，您可以在一分鐘內提交模型推論的跨區域請求數目上限。此配額代表對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 動作的請求總數。
穩定映像 Outpaint 的每分鐘跨區域模型推論請求	每個受支援的區域：4	否	您可以在一分鐘內針對穩定影像傳出項目提交模型推論的跨區域請求數量上限。此配額代表對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 動作的請求總數。
穩定映像移除背景的每分鐘跨區域模型推論請求	每個受支援的區域：20	否	針對穩定影像移除背景，您可以在一分鐘內提交模型推論的跨區域請求數目上限。此配額代表對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 動作的請求總數。
穩定影像搜尋和重新著色的每分鐘跨區域模型推論請求	每個受支援的區域：20	否	針對穩定影像搜尋和重新著色，您可以在一分鐘內提交模型推論的跨區域請求數量上限。此配額代表對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 動作的請求總數。
穩定影像搜尋和取代的每分鐘跨區域模型推論請求	每個受支援的區域：20	否	針對穩定影像搜尋和取代，您可以在一分鐘內提交模型推論的跨區域請求數目上限。此配額代表對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 動作的請求總數。
穩定映像樣式指南的每分鐘跨區域模型推論請求	每個受支援的區域：20	否	針對穩定映像樣式指南，您可以在一分鐘內提交模型推論的跨區域請求數目上限。此配額代表對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 動作的請求總數。
穩定影像樣式傳輸的每分鐘跨區域模型推論請求	每個受支援的區域：20	否	您可以在一分鐘內為穩定影像樣式傳輸提交模型推論的跨區域請求數量上限。此配額代表對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 動作的請求總數。
十二個實驗室 Marengo 每分鐘跨區域模型推論請求	每個受支援的區域：200	否	對於十二個實驗室 Marengo，您可以在一分鐘內提交模型推論的跨區域請求數量上限。此配額代表對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 動作的請求總數。
適用於十二個 Labs Pegasus 的每分鐘跨區域模型推論請求	每個支援的區域：120	是	對於 12 個 Labs Pegasus，您可以在一分鐘內提交模型推論的跨區域請求數量上限。配額會考慮 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的合併總和。
TwelveLabs Marengo Embed 3.0 每分鐘跨區域模型推論請求	每個受支援的區域：1,000	是	對於 TwelveLabs Marengo Embed 3.0，您可以在一分鐘內提交模型推論的跨區域請求數量上限。此配額代表對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 動作的請求總數。
寫入器 AI Palmyra X4 V1 的每分鐘跨區域模型推論請求	每個受支援的區域：10	否	對於 Writer AI Palmyra X4 V1，您可以在一分鐘內提交模型推論的跨區域請求數量上限。此配額代表對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 動作的請求總數。
寫入器 AI Palmyra X5 V1 的每分鐘跨區域模型推論請求	每個受支援的區域：10	否	對於 Writer AI Palmyra X5 V1，您可以在一分鐘內提交模型推論的跨區域請求數量上限。此配額代表對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 動作的請求總數。
Amazon Nova 2 Lite 的每分鐘跨區域模型推論字符	每個支援的區域：8，000，000	是	對於 Amazon Nova 2 Lite，您可以在一分鐘內提交模型推論的跨區域字符數量上限。配額會考慮對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符總和。
Amazon Nova 2 Omni 的每分鐘跨區域模型推論字符	每個支援的區域：8，000，000	是	對於 Amazon Nova 2 Omni，您可以在一分鐘內提交模型推論的跨區域字符數量上限。配額會考慮對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符總和。
Amazon Nova 2 Pro Preview 的每分鐘跨區域模型推論權杖	每個受支援的區域：1,000,000	是	您可以在一分鐘內為 Amazon Nova 2 Pro Preview 提交模型推論的跨區域字符數量上限。配額會考慮對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符總和。
Amazon Nova Lite 的每分鐘跨區域模型推論字符	us-east-1：8，000，000 us-east-2：8，000，000 us-west-1：8，000，000 us-west-2：8，000，000 每個其他支援的區域：400，000	是	您可以在一分鐘內為 Amazon Nova Lite 提交模型推論的跨區域字符數量上限。配額會考慮對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符總和。
Amazon Nova Micro 的每分鐘跨區域模型推論權杖	us-east-1：8，000，000 us-east-2：8，000，000 us-west-2：8，000，000 每個其他支援的區域：400，000	是	您可以在一分鐘內為 Amazon Nova Micro 提交模型推論的跨區域字符數量上限。配額會考慮對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符總和。
Amazon Nova Premier V1 的每分鐘跨區域模型推論字符	每個支援的區域：2，000，000	是	對於 Amazon Nova Premier V1，您可以在一分鐘內提交模型推論的跨區域字符數量上限。配額會考慮對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符總和。
Amazon Nova Pro 的每分鐘跨區域模型推論字符	每個支援的區域：2，000，000	是	您可以在一分鐘內為 Amazon Nova Pro 提交模型推論的跨區域字符數量上限。配額會考慮對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符總和。
Anthropic Claude 3 Haiku 的每分鐘跨區域模型推論字符	us-east-1：4，000，000 us-west-2：4，000，000 ap-northeast-1：400，000 ap-southeast-1：400，000 每個其他支援的區域：600，000	是	您可以在一分鐘內提交模型推論的隨需權杖數量上限。配額會考慮對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream for Anthropic Claude 3 Haiku 的所有請求的輸入和輸出字符總和。
Anthropic Claude 3 Opus 的每分鐘跨區域模型推論字符	每個支援的區域：800，000	是	對於 Anthropic Claude 3 Opus，您可以在一分鐘內提交模型推論的跨區域字符數量上限。配額會考慮對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符的合併總和。
Anthropic Claude 3 Sonnet 的每分鐘跨區域模型推論字符	us-east-1：2，000，000 us-west-2：2，000，000 每個其他支援的區域：400，000	是	您可以在一分鐘內提交以進行模型推論的隨需權杖數量上限。配額會考慮對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream for Anthropic Claude 3 Sonnet 的所有請求的輸入和輸出字符總和。
Anthropic Claude 3.5 Sonnet 的每分鐘跨區域模型推論字符	us-west-2：4，000，000 ap-northeast-1：400，000 ap-southeast-1：400，000 eu-central-1：400，000 eu-west-1：400，000 eu-west-3：400，000 每個其他支援的區域：800，000	是	您可以在一分鐘內為 Anthropic Claude 3.5 Sonnet 提交模型推論的字符數量上限。配額會考慮 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的合併總和。
Anthropic Claude 3.7 Sonnet V1 的每分鐘跨區域模型推論權杖	us-east-1：1，000，000 us-east-2：1，000，000 us-west-2：1，000，000 eu-central-1：100，000 eu-north-1：100，000 eu-west-1：100，000 eu-west-3：100，000 每個其他支援的區域：50，000	是	對於 Anthropic Claude 3.7 Sonnet V1，您可以在一分鐘內提交模型推論的跨區域字符數量上限。配額會考慮對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符的合併總和。
Anthropic Claude Fable 5 的每分鐘跨區域模型推論權杖	每個支援的區域：200，000	是	對於 Anthropic Claude Fable 5，您可以在一分鐘內提交模型推論的跨區域字符數量上限。配額會考慮對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符的合併總和。
Anthropic Claude Haiku 4.5 的每分鐘跨區域模型推論字符	每個支援的區域：5，000，000	是	對於 Anthropic Claude Haiku 4.5，您可以在一分鐘內提交模型推論的跨區域字符數量上限。配額會考慮對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符的合併總和。
Anthropic Claude Opus 4 V1 的每分鐘跨區域模型推論權杖	每個支援的區域：200，000	是	對於 Anthropic Claude Opus 4 V1，您可以在一分鐘內提交模型推論的跨區域字符數量上限。配額會考慮對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符的合併總和。
Anthropic Claude Opus 4.1 的每分鐘跨區域模型推論字符	每個受支援的區域：50 萬個	是	對於 Anthropic Claude Opus 4.1，您可以在一分鐘內提交模型推論的跨區域字符數量上限。配額會考慮對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符的合併總和。
Anthropic Claude Opus 4.5 的每分鐘跨區域模型推論字符	每個支援的區域：2，000，000	是	對於 Anthropic Claude Opus 4.5，您可以在一分鐘內提交模型推論的跨區域字符數量上限。配額會考慮對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符的合併總和。
Anthropic Claude Opus 4.6 V1 的每分鐘跨區域模型推論字符	每個支援的區域：3，000，000	是	針對 Anthropic Claude Opus 4.6 V1，您可以在一分鐘內提交模型推論的跨區域字符數量上限。配額會考慮對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符的合併總和。
Anthropic Claude Opus 4.7 的每分鐘跨區域模型推論字符	每個支援的區域：10，000，000	是	對於 Anthropic Claude Opus 4.7，您可以在一分鐘內提交模型推論的跨區域字符數量上限。配額會考慮對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符的合併總和。
Anthropic Claude Opus 4.8 的每分鐘跨區域模型推論字符	每個支援的區域：30，000，000	是	對於 Anthropic Claude Opus 4.8，您可以在一分鐘內提交模型推論的跨區域字符數量上限。配額會考慮對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符的合併總和。
Anthropic Claude Sonnet 4 V1 的每分鐘跨區域模型推論字符	每個支援的區域：200，000	是	針對 Anthropic Claude Sonnet 4 V1，您可以在一分鐘內提交模型推論的跨區域字符數量上限。配額會考慮對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符的合併總和。
Anthropic Claude Sonnet 4 V1 1M 內容長度的每分鐘跨區域模型推論權杖	每個受支援的區域：1,000,000	是	對於 Anthropic Claude Sonnet 4 V1 1M 內容長度，您可以在一分鐘內提交模型推論的跨區域字符數量上限。配額會考慮對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符的合併總和。
Anthropic Claude Sonnet 4.5 V1 的每分鐘跨區域模型推論字符	每個支援的區域：5，000，000	是	針對 Anthropic Claude Sonnet 4.5 V1，您可以在一分鐘內提交模型推論的跨區域字符數量上限。配額會考慮對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符的合併總和。
Anthropic Claude Sonnet 4.5 V1 1M 內容長度的每分鐘跨區域模型推論字符	每個受支援的區域：1,000,000	是	對於 Anthropic Claude Sonnet 4.5 V1 1M Context Length，您可以在一分鐘內提交模型推論的跨區域字符數量上限。配額會考慮對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符的合併總和。
Anthropic Claude Sonnet 4.6 的每分鐘跨區域模型推論權杖	每個支援的區域：6，000，000	是	對於 Anthropic Claude Sonnet 4.6，您可以在一分鐘內提交模型推論的跨區域字符數量上限。配額會考慮對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符的合併總和。
Anthropic Claude Sonnet 5 的每分鐘跨區域模型推論字符	每個支援的區域：6，000，000	是	您可以在一分鐘內為 Anthropic Claude Sonnet 5 提交模型推論的跨區域字符數量上限。配額會考慮對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符的合併總和。
Cohere Embed V4 的每分鐘跨區域模型推論權杖	每個支援的區域：300，000	是	您可以在一分鐘內為 Cohere Embed V4 提交模型推論的跨區域字符數量上限。配額會考慮對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符的合併總和。
DeepSeek R1 V1 的每分鐘跨區域模型推論權杖	每個支援的區域：200，000	是	您可以在一分鐘內為 DeepSeek R1 V1 的模型推論提交的跨區域字符數量上限。配額會考慮對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符的合併總和。
Meta Llama 3.1 405B Instruct 的每分鐘跨區域模型推論字符	每個支援的區域：800，000	是	對於 Meta Llama 3.1 405B Instruct，您可以在一分鐘內提交模型推論的跨區域字符數量上限。配額會考慮對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符的合併總和。
Meta Llama 3.1 70B Instruct 的每分鐘跨區域模型推論字符	每個支援的區域：600，000	是	對於 Meta Llama 3.1 70B Instruct，您可以在一分鐘內提交模型推論的跨區域字符數量上限。配額會考慮對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符的合併總和。
Meta Llama 3.1 8B Instruct 的每分鐘跨區域模型推論權杖	每個支援的區域：600，000	是	對於 Meta Llama 3.1 8B Instruct，您可以在一分鐘內提交模型推論的跨區域字符數量上限。配額會考慮對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符總和。
Meta Llama 3.2 1B Instruct 的每分鐘跨區域模型推論字符	每個支援的區域：600，000	是	對於 Meta Llama 3.2 1B Instruct，您可以在一分鐘內提交模型推論的跨區域字符數量上限。配額會考慮對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符總和。
Meta Llama 3.2 3B Instruct 的每分鐘跨區域模型推論字符	每個支援的區域：600，000	是	對於 Meta Llama 3.2 3B Instruct，您可以在一分鐘內提交模型推論的字符數量上限。配額會考慮 InvokeModel、InvokeModelWithResponseStream、Converse 和 ConverseStream 的字符總和。
Meta Llama 3.3 70B Instruct 的每分鐘跨區域模型推論字符	每個支援的區域：600，000	是	對於 Meta Llama 3.3 70B Instruct，您可以在一分鐘內提交模型推論的跨區域字符數量上限。配額會考慮對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符總和。
Meta Llama 4 Maverick V1 的每分鐘跨區域模型推論字符	每個支援的區域：600，000	是	對於 Meta Llama 4 Maverick V1，您可以在一分鐘內提交以進行模型推論的跨區域字符數量上限。配額會考慮對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符總和。
Meta Llama 4 Scout V1 的每分鐘跨區域模型推論權杖	每個支援的區域：600，000	是	針對 Meta Llama 4 Scout V1，您可以在一分鐘內提交模型推論的跨區域字符數量上限。配額會考慮對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符總和。
Mistral Pixtral Large 25.02 V1 的每分鐘跨區域模型推論權杖	每個支援的區域：80，000	是	對於 Mistral Pixtral Large 25.02 V1，您可以在一分鐘內提交模型推論的跨區域字符數量上限。配額會考慮對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符總和。
Writer AI Palmyra X4 V1 的每分鐘跨區域模型推論字符	每個支援的區域：150，000	是	對於 Writer AI Palmyra X4 V1，您可以在一分鐘內提交模型推論的跨區域字符數量上限。配額會考慮對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符總和。
Writer AI Palmyra X5 V1 的每分鐘跨區域模型推論字符	每個支援的區域：150，000	是	對於 Writer AI Palmyra X5 V1，您可以在一分鐘內提交模型推論的跨區域字符數量上限。配額會考慮對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符總和。
每個帳戶具有建立狀態的自訂模型	每個受支援的區域：2	是	具有建立狀態的自訂模型數量上限。
每秒 DeleteAgent 請求數	每個受支援的區域：2	否	每秒 DeleteAgent API 請求的數量上限。
每秒 DeleteAgentActionGroup 請求數	每個受支援的區域：2	否	每秒 DeleteAgentActionGroup API 請求的數量上限。
DeleteAgentAlias 每秒請求數	每個受支援的區域：2	否	每秒 DeleteAgentAlias API 請求的數量上限。
每秒 DeleteAgentVersion 請求數	每個受支援的區域：2	否	每秒 DeleteAgentVersion API 請求的數量上限。
每秒 DisassociateAgentKnowledgeBase 請求數	每個受支援的區域：4	否	每秒 DisassociateAgentKnowledgeBase API 請求的數量上限。
每個代理程式已啟用的動作群組	每個受支援的區域：15	是	您可以在代理程式中啟用的動作群組數量上限。
每個推論描述檔的端點數	每個受支援的區域：5	否	推論設定檔中的端點數量上限。端點是由模型和向模型傳送調用請求的區域所定義。
每秒 GetAgent 請求數	每個受支援的區域：15	否	每秒 GetAgent API 請求的數量上限。
每秒 GetAgentActionGroup 請求數	每個受支援的區域：20	否	每秒 GetAgentActionGroup API 請求的數量上限。
每秒 GetAgentAlias 請求數	每個受支援的區域：10	否	每秒 GetAgentAlias API 請求的數量上限。
每秒 GetAgentKnowledgeBase 請求數	每個受支援的區域：15	否	每秒 GetAgentKnowledgeBase API 請求的數量上限。
每秒 GetAgentVersion 請求數	每個受支援的區域：10	否	每秒 GetAgentVersion API 請求的數量上限。
Amazon Nova 2 Lite 的每分鐘全域跨區域模型推論請求	每個受支援的區域：2,000	是	對於 Amazon Nova 2 Lite，您可以在一分鐘內提交模型推論的全域跨區域請求數量上限。此配額代表對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 動作的請求總數。
Amazon Nova 2 Omni 的每分鐘全域跨區域模型推論請求	每個受支援的區域：2,000	是	對於 Amazon Nova 2 Omni，您可以在一分鐘內提交模型推論的全域跨區域請求數量上限。此配額代表對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 動作的請求總數。
Amazon Nova 2 Pro Preview 的每分鐘全域跨區域模型推論請求	每個受支援的區域：100	是	您可以在一分鐘內為 Amazon Nova 2 Pro Preview 提交模型推論的全域跨區域請求數量上限。此配額代表對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 動作的請求總數。
Anthropic Claude Haiku 4.5 每分鐘全域跨區域模型推論請求	每個受支援的區域：10,000	是	您可以在一分鐘內為 Anthropic Claude Haiku 4.5 提交模型推論的全域跨區域請求數量上限。此配額代表對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 動作的請求總數。
Anthropic Claude Opus 4.5 的每分鐘全域跨區域模型推論請求	每個受支援的區域：10,000	是	對於 Anthropic Claude Opus 4.5，您可以在一分鐘內提交模型推論的全域跨區域請求數量上限。此配額代表對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 動作的請求總數。
Anthropic Claude Opus 4.6 V1 的每分鐘全域跨區域模型推論請求	每個受支援的區域：10,000	是	對於 Anthropic Claude Opus 4.6 V1，您可以在一分鐘內提交模型推論的全域跨區域請求數量上限。此配額代表對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 動作的請求總數。
Anthropic Claude Sonnet 4 V1 的每分鐘全域跨區域模型推論請求	每個受支援的區域：200	是	您可以在一分鐘內為 Anthropic Claude Sonnet 4 V1 提交模型推論的全域跨區域請求數量上限。此配額代表對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 動作的請求總數。
Anthropic Claude Sonnet 4.5 V1 的每分鐘全域跨區域模型推論請求	每個受支援的區域：10,000	是	您可以在一分鐘內針對 Anthropic Claude Sonnet 4.5 V1 提交以進行模型推論的全域跨區域請求數目上限。此配額代表對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 動作的請求總數。
Anthropic Claude Sonnet 4.5 V1 1M 內容長度的每分鐘全域跨區域模型推論請求	每個受支援的區域：1,000	是	針對 Anthropic Claude Sonnet 4.5 V1 1M Context Length，您可以在一分鐘內提交以進行模型推論的全域跨區域請求數目上限。此配額代表對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 動作的請求總數。
Anthropic Claude Sonnet 4.6 的每分鐘全域跨區域模型推論請求	每個受支援的區域：10,000	是	針對 Anthropic Claude Sonnet 4.6，您可以在一分鐘內提交模型推論的全域跨區域請求數目上限。此配額代表對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 動作的請求總數。
Cohere Embed V4 的每分鐘全域跨區域模型推論請求	每個受支援的區域：2,000	是	您可以在一分鐘內針對 Cohere Embed V4 提交以進行模型推論的全域跨區域請求數目上限。此配額代表對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 動作的請求總數。
Amazon Nova 2 Lite 每天全域跨區域模型推論權杖	每個支援的區域：11，520，000，000	否	您可以在一天內為 Amazon Nova 2 Lite 提交模型推論的全域跨區域字符數量上限。配額會考慮對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符總和。
Amazon Nova 2 Omni 每天全域跨區域模型推論字符	每個支援的區域：11，520，000，000	否	對於 Amazon Nova 2 Omni，您可以在一天內提交以進行模型推論的全域跨區域字符數量上限。配額會考慮對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符總和。
Amazon Nova 2 Pro Preview 每天全域跨區域模型推論權杖	每個支援的區域：1，440，000，000	否	對於 Amazon Nova 2 Pro Preview，您可以在一天內提交以進行模型推論的全域跨區域字符數量上限。配額會考慮對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符總和。
Anthropic Claude Fable 5 每天全域跨區域模型推論權杖	每個支援的區域：720，000，000	否	您可以在一天內針對 Anthropic Claude Fable 5 提交以進行模型推論的全域跨區域字符數量上限。配額會考慮對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符總和。
Anthropic Claude Haiku 4.5 每天全域跨區域模型推論權杖	每個支援的區域：7，200，000，000	否	對於 Anthropic Claude Haiku 4.5，您可以在一天內提交以進行模型推論的全域跨區域字符數量上限。配額會考慮對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符總和。
Anthropic Claude Opus 4.5 每天全域跨區域模型推論字符	每個支援的區域：2，880，000，000	否	對於 Anthropic Claude Opus 4.5，您可以在一天內提交以進行模型推論的全域跨區域字符數量上限。配額會考慮對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符總和。
Anthropic Claude Opus 4.6 V1 每天全域跨區域模型推論權杖	每個支援的區域：4，320，000，000	否	對於 Anthropic Claude Opus 4.6 V1，您可以在一天內提交以進行模型推論的全域跨區域字符數量上限。配額會考慮對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符總和。
Anthropic Claude Opus 4.7 每天全域跨區域模型推論權杖	每個支援的區域：14，400，000，000	否	您可以在一天內針對 Anthropic Claude Opus 4.7 提交以進行模型推論的全域跨區域字符數量上限。配額會考慮對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符總和。
Anthropic Claude Opus 4.8 每天全域跨區域模型推論字符	每個支援的區域：43，200，000，000	否	對於 Anthropic Claude Opus 4.8，您可以在一天內提交以進行模型推論的全域跨區域字符數量上限。配額會考慮對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符總和。
Anthropic Claude Sonnet 4 V1 每天全域跨區域模型推論權杖	每個支援的區域：288，000，000	否	您可以在一天內為 Anthropic Claude Sonnet 4 V1 提交以進行模型推論的全域跨區域字符數量上限。配額會考慮對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符總和。
Anthropic Claude Sonnet 4.5 V1 每天全域跨區域模型推論權杖	每個支援的區域：7，200，000，000	否	對於 Anthropic Claude Sonnet 4.5 V1，您可以在一天內提交以進行模型推論的全域跨區域字符數量上限。配額會考慮對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符總和。
Anthropic Claude Sonnet 4.5 V1 1M 內容長度每天全域跨區域模型推論字符	每個支援的區域：1，440，000，000	否	對於 Anthropic Claude Sonnet 4.5 V1 1M 內容長度，您可以在一天內提交以進行模型推論的全域跨區域字符數量上限。配額會考慮對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符總和。
Anthropic Claude Sonnet 4.6 每天全域跨區域模型推論權杖	每個支援的區域：8，640，000，000	否	對於 Anthropic Claude Sonnet 4.6，您可以在一天內提交以進行模型推論的全域跨區域字符數量上限。配額會考慮對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符總和。
Anthropic Claude Sonnet 5 每天全域跨區域模型推論權杖	每個支援的區域：8，640，000，000	否	您可以在一天內為 Anthropic Claude Sonnet 5 提交以進行模型推論的全域跨區域字符數量上限。配額會考慮對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符總和。
Cohere Embed V4 每天全域跨區域模型推論權杖	每個支援的區域：432，000，000	否	您可以在一天內針對 Cohere Embed V4 提交以進行模型推論的全域跨區域字符數量上限。配額會考慮對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符總和。
Amazon Nova 2 Lite 的每分鐘全域跨區域模型推論字符	每個支援的區域：8，000，000	是	對於 Amazon Nova 2 Lite，您可以在一分鐘內提交模型推論的全域跨區域字符數量上限。配額會考慮對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符總和。
Amazon Nova 2 Omni 的每分鐘全域跨區域模型推論字符	每個支援的區域：8，000，000	是	對於 Amazon Nova 2 Omni，您可以在一分鐘內提交模型推論的全域跨區域字符數量上限。配額會考慮對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符總和。
Amazon Nova 2 Pro Preview 的每分鐘全域跨區域模型推論權杖	每個受支援的區域：1,000,000	是	對於 Amazon Nova 2 Pro Preview，您可以在一分鐘內提交模型推論的全域跨區域字符數量上限。配額會考慮對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符總和。
Anthropic Claude Fable 5 的每分鐘全域跨區域模型推論權杖	每個受支援的區域：50 萬個	是	對於 Anthropic Claude Fable 5，您可以在一分鐘內提交模型推論的全域跨區域字符數量上限。配額會考慮對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符總和。
Anthropic Claude Haiku 4.5 的每分鐘全域跨區域模型推論權杖	每個支援的區域：5，000，000	是	對於 Anthropic Claude Haiku 4.5，您可以在一分鐘內提交模型推論的全域跨區域字符數量上限。配額會考慮對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符總和。
Anthropic Claude Opus 4.5 的每分鐘全域跨區域模型推論字符	每個支援的區域：2，000，000	是	對於 Anthropic Claude Opus 4.5，您可以在一分鐘內提交模型推論的全域跨區域字符數量上限。配額會考慮對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符總和。
Anthropic Claude Opus 4.6 V1 的每分鐘全域跨區域模型推論字符	每個支援的區域：3，000，000	是	針對 Anthropic Claude Opus 4.6 V1，您可以在一分鐘內提交模型推論的全域跨區域字符數量上限。配額會考慮對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符總和。
Anthropic Claude Opus 4.7 的每分鐘全域跨區域模型推論權杖	每個支援的區域：10，000，000	是	對於 Anthropic Claude Opus 4.7，您可以在一分鐘內提交模型推論的全域跨區域字符數量上限。配額會考慮對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符總和。
Anthropic Claude Opus 4.8 的每分鐘全域跨區域模型推論字符	每個支援的區域：30，000，000	是	針對 Anthropic Claude Opus 4.8，您可以在一分鐘內提交模型推論的全域跨區域字符數量上限。配額會考慮對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符總和。
Anthropic Claude Sonnet 4 V1 的每分鐘全域跨區域模型推論字符	每個支援的區域：200，000	是	對於 Anthropic Claude Sonnet 4 V1，您可以在一分鐘內提交模型推論的全域跨區域字符數量上限。配額會考慮對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符總和。
Anthropic Claude Sonnet 4.5 V1 的每分鐘全域跨區域模型推論字符	每個支援的區域：5，000，000	是	針對 Anthropic Claude Sonnet 4.5 V1，您可以在一分鐘內提交模型推論的全域跨區域字符數量上限。配額會考慮對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符總和。
Anthropic Claude Sonnet 4.5 V1 1M 內容長度的每分鐘全域跨區域模型推論字符	每個受支援的區域：1,000,000	是	對於 Anthropic Claude Sonnet 4.5 V1 1M 內容長度，您可以在一分鐘內提交以進行模型推論的全域跨區域字符數量上限。配額會考慮對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符的合併總和。
Anthropic Claude Sonnet 4.6 的每分鐘全域跨區域模型推論字符	每個支援的區域：6，000，000	是	對於 Anthropic Claude Sonnet 4.6，您可以在一分鐘內提交模型推論的全域跨區域字符數量上限。配額會考慮對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符的合併總和。
Anthropic Claude Sonnet 5 的每分鐘全域跨區域模型推論字符	每個支援的區域：6，000，000	是	您可以在一分鐘內為 Anthropic Claude Sonnet 5 提交模型推論的全域跨區域字符數量上限。配額會考慮對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符的合併總和。
Cohere Embed V4 的每分鐘全域跨區域模型推論字符	每個支援的區域：300，000	是	對於 Cohere Embed V4，您可以在一分鐘內提交模型推論的全域跨區域字符數量上限。配額會考慮對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符的合併總和。
每個帳戶的匯入模型	每個支援的區域：3	是	帳戶中匯入模型的數量上限。
每個帳戶的推論設定檔	每個受支援的區域：1,000	是	帳戶中推論設定檔的數量上限。
ListAgentActionGroups 每秒請求數	每個受支援的區域：10	否	每秒 ListAgentActionGroups API 請求的數量上限。
ListAgentAliases 每秒請求數	每個受支援的區域：10	否	每秒 ListAgentAliases API 請求的數量上限。
ListAgentKnowledgeBases 每秒請求數	每個受支援的區域：10	否	每秒 ListAgentKnowledgeBases API 請求的數量上限。
ListAgentVersions 每秒請求數	每個受支援的區域：10	否	每秒 ListAgentVersions API 請求的數量上限。
每秒 ListAgents 請求數	每個受支援的區域：10	否	每秒 ListAgents API 請求的數量上限。
Amazon Nova 2 多模式內嵌 V1 每個批次推論任務的記錄數下限	每個受支援的區域：100	否	Amazon Nova 2 多模態內嵌 V1 批次推論任務中所有輸入檔案的記錄數目下限。
Amazon Nova Premier 每個批次推論任務的記錄數下限	每個受支援的區域：100	否	Amazon Nova Premier 批次推論任務中所有輸入檔案的記錄數目下限。
Claude 3 Haiku 每個批次推論任務的記錄數下限	每個受支援的區域：100	否	Claude 3 Haiku 批次推論任務中所有輸入檔案的記錄數目下限。
Claude 3 Opus 每個批次推論任務的記錄數目下限	每個受支援的區域：100	否	Claude 3 Opus 批次推論任務中所有輸入檔案的記錄數目下限。
Claude 3 Sonnet 每個批次推論任務的記錄數下限	每個受支援的區域：100	否	Claude 3 Sonnet 批次推論任務中所有輸入檔案的記錄數目下限。
Claude 3.5 Haiku 每個批次推論任務的記錄數下限	每個受支援的區域：100	否	Claude 3.5 Haiku 批次推論任務中所有輸入檔案的記錄數目下限。
Claude 3.5 Sonnet 每個批次推論任務的記錄數下限	每個受支援的區域：100	否	Claude 3.5 Sonnet 批次推論任務中所有輸入檔案的記錄數目下限。
Claude 3.5 Sonnet v2 每個批次推論任務的記錄數下限	每個受支援的區域：100	否	Claude 3.5 Sonnet v2 批次推論任務中所有輸入檔案的記錄數目下限。
Claude 3.7 Sonnet 每個批次推論任務的記錄數下限	每個受支援的區域：100	是	Claude 3.7 Sonnet 批次推論任務中所有輸入檔案的記錄數目下限。
Claude Haiku 4.5 每個批次推論任務的記錄數下限	每個受支援的區域：100	否	Claude Haiku 4.5 批次推論任務中所有輸入檔案的記錄數目下限。
Claude Opus 4.5 每個批次推論任務的記錄數下限	每個受支援的區域：100	否	Claude Opus 4.5 批次推論任務中所有輸入檔案的記錄數目下限。
Claude Opus 4.6 每個批次推論任務的記錄數目下限	每個受支援的區域：100	否	Claude Opus 4.6 批次推論任務中所有輸入檔案的記錄數目下限。
Claude Sonnet 4 每個批次推論任務的記錄數下限	每個受支援的區域：100	是	Claude Sonnet 4 批次推論任務中所有輸入檔案的記錄數目下限。
Claude Sonnet 4.5 每個批次推論任務的記錄數下限。	每個受支援的區域：100	否	Claude Sonnet 4.5 批次推論任務中所有輸入檔案的記錄數量下限。
Claude Sonnet 4.6 每個批次推論任務的記錄數下限	每個受支援的區域：100	否	Claude Sonnet 4.6 批次推論任務中所有輸入檔案的記錄數目下限。
DeepSeek V3.2 每個批次推論任務的記錄數下限	每個受支援的區域：100	否	DeepSeek V3.2 批次推論任務中所有輸入檔案的記錄數量下限。
DeepSeek v3 每個批次推論任務的記錄數下限	每個受支援的區域：100	否	DeepSeek v3 批次推論任務中所有輸入檔案的記錄數量下限。
Devstral 2 123B 每個批次推論任務的記錄數下限	每個受支援的區域：100	否	Devstral 2 123B 批次推論任務中所有輸入檔案的記錄數目下限。
GLM 4.7 每個批次推論任務的記錄數下限	每個受支援的區域：100	否	GLM 4.7 批次推論任務中所有輸入檔案的記錄數量下限。
GLM 4.7 Flash 每個批次推論任務的記錄數下限	每個受支援的區域：100	否	GLM 4.7 Flash 批次推論任務中所有輸入檔案的記錄數量下限。
GLM 5 每個批次推論任務的記錄數下限	每個受支援的區域：100	否	GLM 5 批次推論任務中所有輸入檔案的記錄數量下限。
Gemma 3 12B 每個批次推論任務的記錄數下限	每個受支援的區域：100	否	Gemma 3 12B 批次推論任務中所有輸入檔案的記錄數量下限。
Gemma 3 27B 每個批次推論任務的記錄數下限	每個受支援的區域：100	否	Gemma 3 27B 批次推論任務中所有輸入檔案的記錄數量下限。
Gemma 3 4B 每個批次推論任務的記錄數下限	每個受支援的區域：100	否	Gemma 3 4B 批次推論任務中所有輸入檔案的記錄數量下限。
Kimi K2 Thinking 每個批次推論任務的記錄數下限	每個受支援的區域：100	否	批次推論任務中，Kimi K2 Thinking 所有輸入檔案的記錄數目下限。
Kimi K2.5 每個批次推論任務的記錄數下限	每個受支援的區域：100	否	批次推論任務中，Kimi K2.5 所有輸入檔案的記錄數目下限。
Llama 3.1 405B Instruct 每個批次推論任務的記錄數下限	每個受支援的區域：100	否	Llama 3.1 405B Instruct 批次推論任務中所有輸入檔案的記錄數量下限。
Llama 3.1 70B Instruct 每個批次推論任務的記錄數下限	每個受支援的區域：100	否	Llama 3.1 70B Instruct 批次推論任務中所有輸入檔案的記錄數目下限。
Llama 3.1 8B Instruct 每個批次推論任務的記錄數下限	每個受支援的區域：100	否	Llama 3.1 8B Instruct 批次推論任務中所有輸入檔案的記錄數目下限。
Llama 3.2 11B Instruct 每個批次推論任務的記錄數下限	每個受支援的區域：100	否	Llama 3.2 11B Instruct 批次推論任務中所有輸入檔案的記錄數目下限。
Llama 3.2 1B Instruct 每個批次推論任務的記錄數下限	每個受支援的區域：100	否	批次推論任務 Llama 3.2 1B Instruct 中所有輸入檔案的記錄數目下限。
Llama 3.2 3B Instruct 每個批次推論任務的記錄數下限	每個受支援的區域：100	否	Llama 3.2 3B Instruct 批次推論任務中所有輸入檔案的記錄數量下限。
Llama 3.2 90B Instruct 每個批次推論任務的記錄數下限	每個受支援的區域：100	否	Llama 3.2 90B Instruct 批次推論任務中所有輸入檔案的記錄數量下限。
Llama 3.3 70B Instruct 每個批次推論任務的記錄數下限	每個受支援的區域：100	否	Llama 3.3 70B Instruct 批次推論任務中所有輸入檔案的記錄數量下限。
Llama 4 Maverick 每個批次推論任務的記錄數下限	每個受支援的區域：100	否	Llama 4 Maverick 批次推論任務中所有輸入檔案的記錄數目下限。
Llama 4 Scout 每個批次推論任務的記錄數下限	每個受支援的區域：100	否	Llama 4 Scout 批次推論任務中所有輸入檔案的記錄數量下限。
Magistral Small 2509 每個批次推論任務的記錄數目下限	每個受支援的區域：100	否	Magistral Small 2509 批次推論任務中所有輸入檔案的記錄數量下限。
MiniMax M2 每個批次推論任務的記錄數下限	每個受支援的區域：100	否	MiniMax M2 批次推論任務中所有輸入檔案的記錄數目下限。
MiniMax M2.1 每個批次推論任務的記錄數下限	每個受支援的區域：100	否	MiniMax M2.1 批次推論任務中所有輸入檔案的記錄數目下限。
MiniMax M2.5 每個批次推論任務的記錄數下限	每個受支援的區域：100	否	MiniMax M2.5 批次推論任務中所有輸入檔案的記錄數量下限。
Ministral 3 14B 每個批次推論任務的記錄數下限	每個受支援的區域：100	否	Ministral 3 14B 批次推論任務中所有輸入檔案的記錄數目下限。
Ministral 3 8B 每個批次推論任務的記錄數目下限	每個受支援的區域：100	否	Ministral 3 8B 批次推論任務中所有輸入檔案的記錄數目下限。
Ministral 3B 每個批次推論任務的記錄數下限	每個受支援的區域：100	否	Ministral 3B 批次推論任務中所有輸入檔案的記錄數目下限。
Mistral Large 2 (24.07) 每個批次推論任務的記錄數下限	每個受支援的區域：100	否	Mistral Large 2 (24.07) 批次推論任務中所有輸入檔案的記錄數目下限。
Mistral Large 3 每個批次推論任務的記錄數目下限	每個受支援的區域：100	否	Mistral Large 3 批次推論任務中所有輸入檔案的記錄數目下限。
Mistral Small 每個批次推論任務的記錄數目下限	每個受支援的區域：100	否	Mistral Small 批次推論任務中所有輸入檔案的記錄數目下限。
NVIDIA Nemotron 3 Super 120B A12B 每個批次推論任務的記錄數下限	每個受支援的區域：100	否	NVIDIA Nemotron 3 Super 120B A12B 批次推論任務中所有輸入檔案的記錄數量下限。
NVIDIA Nemotron Nano 12B 每個批次推論任務的記錄數下限	每個受支援的區域：100	否	NVIDIA Nemotron Nano 12B 批次推論任務中所有輸入檔案的記錄數量下限。
NVIDIA Nemotron Nano 3 30B 每個批次推論任務的記錄數下限	每個受支援的區域：100	否	NVIDIA Nemotron Nano 3 30B 批次推論任務中所有輸入檔案的記錄數量下限。
NVIDIA Nemotron Nano 9B 每個批次推論任務的記錄數下限	每個受支援的區域：100	否	NVIDIA Nemotron Nano 9B 批次推論任務中所有輸入檔案的記錄數量下限。
Nova 2 Lite 每個批次推論任務的記錄數下限	每個受支援的區域：100	否	Nova 2 Lite 批次推論任務中所有輸入檔案的記錄數目下限。
Nova Lite V1 每個批次推論任務的記錄數下限	每個受支援的區域：100	否	Nova Lite V1 批次推論任務中所有輸入檔案的記錄數量下限。
Nova Micro V1 每個批次推論任務的記錄數下限	每個受支援的區域：100	否	Nova Micro V1 批次推論任務中所有輸入檔案的記錄數量下限。
Nova Pro V1 每個批次推論任務的記錄數下限	每個受支援的區域：100	否	Nova Pro V1 批次推論任務中所有輸入檔案的記錄數目下限。
OpenAI GPT OSS 120b 每個批次推論任務的記錄數下限	每個受支援的區域：100	否	OpenAI GPT OSS 120b 批次推論任務中所有輸入檔案的記錄數目下限。
OpenAI GPT OSS 20b 每個批次推論任務的記錄數下限	每個受支援的區域：100	否	OpenAI GPT OSS 20b 批次推論任務中所有輸入檔案的記錄數量下限。
OpenAI GPT OSS Safeguard 120b 每個批次推論任務的記錄數下限	每個受支援的區域：100	否	OpenAI GPT OSS Safeguard 120b 批次推論任務中所有輸入檔案的記錄數量下限。
OpenAI GPT OSS Safeguard 20b 每個批次推論任務的記錄數下限	每個受支援的區域：100	否	OpenAI GPT OSS Safeguard 20b 批次推論任務中所有輸入檔案的記錄數目下限。
Qwen3 235B 每個批次推論任務的記錄數下限	每個受支援的區域：100	否	Qwen3 235B 批次推論任務中所有輸入檔案的記錄數量下限。
Qwen3 32B 每個批次推論任務的記錄數下限	每個受支援的區域：100	否	Qwen3 32B 批次推論任務中所有輸入檔案的記錄數目下限。
Qwen3 Coder 30B 每個批次推論任務的記錄數下限	每個受支援的區域：100	否	Qwen3 Coder 30B 批次推論任務中所有輸入檔案的記錄數目下限。
Qwen3 Coder 480B 每個批次推論任務的記錄數下限	每個受支援的區域：100	否	Qwen3 Coder 480B 批次推論任務中所有輸入檔案的記錄數目下限。
Qwen3 Coder Next 每個批次推論任務的記錄數下限	每個受支援的區域：100	否	Qwen3 Coder Next 批次推論任務中所有輸入檔案的記錄數目下限。
Qwen3 Next 80B 每個批次推論任務的記錄數下限	每個受支援的區域：100	否	Qwen3 Next 80B 批次推論任務中所有輸入檔案的記錄數目下限。
Qwen3 VL 235B 每個批次推論任務的記錄數下限	每個受支援的區域：100	否	Qwen3 VL 235B 批次推論任務中所有輸入檔案的記錄數量下限。
Titan Multimodal Embeddings G1 每個批次推論任務的記錄數下限	每個受支援的區域：100	否	Titan Multimodal Embeddings G1 批次推論任務中所有輸入檔案的記錄數目下限。
Titan Text Embeddings V2 每個批次推論任務的記錄數下限	每個受支援的區域：100	否	Titan Text Embeddings V2 批次推論任務中所有輸入檔案的記錄數量下限。
Voxtral Mini 3B507 每個批次推論任務的記錄數目下限	每個受支援的區域：100	否	Voxtral Mini 3B 2507 批次推論任務中所有輸入檔案的記錄數目下限。
Voxtral Small 24B 2507 每個批次推論任務的記錄數下限	每個受支援的區域：100	否	Voxtral Small 24B 2507 批次推論任務中所有輸入檔案的記錄數目下限。
Writer Palmyra Vision 7B 每個批次推論任務的記錄數下限	每個受支援的區域：100	否	Writer Palmyra Vision 7B 批次推論任務中所有輸入檔案的記錄數目下限。
Amazon Nova Pro V1 每天模型調用最大延遲最佳化權杖	每個支援的區域：57，600，000	否	您可以在一天內為 Amazon Nova Pro V1 的延遲最佳化模型推論提交的字符數量上限。配額會考慮對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符的合併總和。
AI21 Labs Jamba 1.5 Large 的模型調用每日權杖上限（跨區域呼叫加倍）	每個支援的區域：432，000，000	否	AI21 Labs Jamba 1.5 Large 模型推論的每日最大字符數。結合對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符總和。跨區域呼叫加倍；如果已核准的 TPM 增加，則不適用。
AI21 Labs Jamba 1.5 Mini 每天模型調用權杖上限（跨區域呼叫加倍）	每個支援的區域：432，000，000	否	AI21 Labs Jamba 1.5 Mini 模型推論的每日最大字符數。結合對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符總和。跨區域呼叫加倍；如果已核准的 TPM 增加，則不適用。
Amazon Nova 2 Lite 的模型調用每日權杖上限（跨區域呼叫加倍）	每個支援的區域：5，760，000，000	否	Amazon Nova 2 Lite 模型推論的每日最大權杖數。結合對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符總和。跨區域呼叫加倍；如果已核准的 TPM 增加，則不適用。
Amazon Nova 2 Omni 的模型調用每日權杖上限（跨區域呼叫加倍）	每個支援的區域：5，760，000，000	否	Amazon Nova 2 Omni 模型推論的每日最大字符數。結合對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符總和。跨區域呼叫加倍；如果已核准的 TPM 增加，則不適用。
Amazon Nova 2 Pro Preview 每天模型調用權杖上限（跨區域呼叫加倍）	每個支援的區域：720，000，000	否	Amazon Nova 2 Pro Preview 模型推論的每日最大權杖數。結合對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符總和。跨區域呼叫加倍；如果已核准的 TPM 增加，則不適用。
Amazon Nova Lite 每日模型調用權杖上限（跨區域呼叫加倍）	每個支援的區域：5，760，000，000	否	Amazon Nova Lite 模型推論的每日最大權杖數。結合對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符總和。跨區域呼叫加倍；如果已核准的 TPM 增加，則不適用。
Amazon Nova Micro 每天模型調用權杖上限（跨區域呼叫加倍）	每個支援的區域：5，760，000，000	否	Amazon Nova Micro 模型推論的每日最大權杖數。結合對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符總和。跨區域呼叫加倍；如果已核准的 TPM 增加，則不適用。
Amazon Nova Premier V1 的模型調用每日權杖上限（跨區域呼叫加倍）	每個支援的區域：1，440，000，000	否	Amazon Nova Premier V1 模型推論的每日最大權杖數。結合對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符總和。跨區域呼叫加倍；如果已核准的 TPM 增加，則不適用。
Amazon Nova Pro 每天模型調用權杖上限（跨區域呼叫加倍）	每個支援的區域：1，440，000，000	否	Amazon Nova Pro 模型推論的每日權杖上限。結合對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符總和。跨區域呼叫加倍；如果已核准的 TPM 增加，則不適用。
Anthropic Claude 3 Haiku 每天模型調用權杖上限（跨區域呼叫加倍）	us-east-1：2，880，000，000 us-west-2：2，880，000，000 ap-northeast-1：288，000，000 ap-southeast-1：288，000，000 每個其他支援的區域：432，000，000	否	Anthropic Claude 3 Haiku 模型推論的每日權杖上限。結合對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符總和。跨區域呼叫加倍；如果已核准的 TPM 增加，則不適用。
Anthropic Claude 3.5 Haiku 每天模型調用權杖上限（跨區域呼叫加倍）	每個支援的區域：2，880，000，000	否	Anthropic Claude 3.5 Haiku 模型推論的每日權杖上限。結合對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符總和。跨區域呼叫加倍；如果已核准的 TPM 增加，則不適用。
Anthropic Claude 3.5 Sonnet V1 的模型調用每日權杖上限（跨區域呼叫加倍）	每個支援的區域：2，880，000，000	否	Anthropic Claude 3.5 Sonnet V1 模型推論的每日最大字符數。結合對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符總和。跨區域呼叫加倍；如果已核准的 TPM 增加，則不適用。
Anthropic Claude 3.5 Sonnet V2 的模型調用每日權杖上限（跨區域呼叫加倍）	us-east-1：2，880，000，000 us-west-2：2，880，000，000 每個其他支援的區域：576，000，000	否	Anthropic Claude 3.5 Sonnet V2 模型推論的每日最大字符數。結合對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符總和。跨區域呼叫加倍；如果已核准的 TPM 增加，則不適用。
Anthropic Claude 3.7 Sonnet V1 的模型調用每日權杖上限（跨區域呼叫加倍）	每個支援的區域：720，000，000	否	Anthropic Claude 3.7 Sonnet V1 模型推論的每日最大字符數。結合對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符總和。跨區域呼叫加倍；如果已核准的 TPM 增加，則不適用。
Anthropic Claude Fable 5 每天模型調用權杖上限（跨區域呼叫加倍）	每個支援的區域：144，000，000	否	Anthropic Claude Fable 5 模型推論的每日最大字符數。結合對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符總和。跨區域呼叫加倍；如果已核准的 TPM 增加，則不適用。
Anthropic Claude Haiku 4.5 的模型調用每日權杖上限（跨區域呼叫加倍）	每個支援的區域：3，600，000，000	否	Anthropic Claude Haiku 4.5 模型推論的每日權杖上限。結合對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符總和。跨區域呼叫加倍；如果已核准的 TPM 增加，則不適用。
Anthropic Claude Opus 4 V1 的模型調用每日權杖上限（跨區域呼叫加倍）	每個支援的區域：144，000，000	否	Anthropic Claude Opus 4 V1 模型推論的每日最大權杖。結合對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符總和。跨區域呼叫加倍；如果已核准的 TPM 增加，則不適用。
Anthropic Claude Opus 4.1 的模型調用每日權杖上限（跨區域呼叫加倍）	每個支援的區域：360，000，000	否	Anthropic Claude Opus 4.1 模型推論的每日權杖上限。結合對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符總和。跨區域呼叫加倍；如果已核准的 TPM 增加，則不適用。
Anthropic Claude Opus 4.5 的模型調用每日權杖上限（跨區域呼叫加倍）	每個支援的區域：1，440，000，000	否	Anthropic Claude Opus 4.5 模型推論的每日權杖上限。結合對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符總和。跨區域呼叫加倍；如果已核准的 TPM 增加，則不適用。
Anthropic Claude Opus 4.6 V1 的模型調用每日權杖上限（跨區域呼叫加倍）	每個支援的區域：2，160，000，000	否	Anthropic Claude Opus 4.6 V1 模型推論的每日最大權杖。結合對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符總和。跨區域呼叫加倍；如果已核准的 TPM 增加，則不適用。
Anthropic Claude Opus 4.7 的模型調用每日權杖上限（跨區域呼叫加倍）	每個支援的區域：7，200，000，000	否	Anthropic Claude Opus 4.7 模型推論的每日權杖上限。結合對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符總和。跨區域呼叫加倍；如果已核准的 TPM 增加，則不適用。
Anthropic Claude Opus 4.8 的模型調用每日權杖上限（跨區域呼叫加倍）	每個支援的區域：21，600，000，000	否	Anthropic Claude Opus 4.8 模型推論的每日最大字符數。結合對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符總和。跨區域呼叫加倍；如果已核准的 TPM 增加，則不適用。
Anthropic Claude Sonnet 4 V1 每天模型調用權杖上限（跨區域呼叫加倍）	每個支援的區域：144，000，000	否	Anthropic Claude Sonnet 4 V1 模型推論的每日最大字符數。結合對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符總和。跨區域呼叫加倍；如果已核准的 TPM 增加，則不適用。
Anthropic Claude Sonnet 4 V1 1M 內容長度的模型調用每日權杖上限（跨區域呼叫加倍）	每個支援的區域：720，000，000	否	Anthropic Claude Sonnet 4 V1 1M 內容長度的模型推論每日最大字符數。結合對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符總和。跨區域呼叫加倍；如果已核准的 TPM 增加，則不適用。
Anthropic Claude Sonnet 4.5 V1 的模型調用每日權杖上限（跨區域呼叫加倍）	每個支援的區域：3，600，000，000	否	Anthropic Claude Sonnet 4.5 V1 模型推論的每日最大字符數。結合對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符總和。跨區域呼叫加倍；如果已核准的 TPM 增加，則不適用。
Anthropic Claude Sonnet 4.5 V1 1M 內容長度的模型調用每日權杖上限（跨區域呼叫加倍）	每個支援的區域：720，000，000	否	Anthropic Claude Sonnet 4.5 V1 1M 內容長度的模型推論每日最大權杖。結合對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符總和。跨區域呼叫加倍；如果已核准的 TPM 增加，則不適用。
Anthropic Claude Sonnet 4.6 每天模型調用權杖上限（跨區域呼叫加倍）	每個支援的區域：4，320，000，000	否	Anthropic Claude Sonnet 4.6 模型推論的每日最大字符數。結合對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符總和。跨區域呼叫加倍；如果已核准的 TPM 增加，則不適用。
Anthropic Claude Sonnet 5 每天模型調用權杖上限（跨區域呼叫加倍）	每個支援的區域：4，320，000，000	否	Anthropic Claude Sonnet 5 模型推論的每日權杖上限。結合對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符總和。跨區域呼叫加倍；如果已核准的 TPM 增加，則不適用。
Cohere Embed V4 每天模型調用權杖上限（跨區域呼叫加倍）	每個支援的區域：216，000，000	否	Cohere Embed V4 模型推論的每日最大權杖數。結合對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符總和。跨區域呼叫加倍；如果已核准的 TPM 增加，則不適用。
DeepSeek R1 V1 每天模型調用權杖上限（跨區域呼叫加倍）	每個支援的區域：144，000，000	否	DeepSeek R1 V1 模型推論的每日最大字符數。結合對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符總和。跨區域呼叫加倍；如果已核准的 TPM 增加，則不適用。
DeepSeek V3 V1 每天模型調用權杖上限（跨區域呼叫加倍）	每個支援的區域：144，000，000，000	否	DeepSeek V3 V1 模型推論的每日最大權杖數。結合對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符總和。跨區域呼叫加倍；如果已核准的 TPM 增加，則不適用。
DeepSeek V3.2 每天模型調用權杖上限（跨區域呼叫加倍）	每個支援的區域：144，000，000，000	否	DeepSeek V3.2 模型推論的每日最大權杖數。結合對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符總和。跨區域呼叫加倍；如果已核准的 TPM 增加，則不適用。
GPT OSS Safeguard 120B 的模型調用每日權杖上限（跨區域呼叫加倍）	每個支援的區域：144，000，000，000	否	GPT OSS Safeguard 120B 模型推論的每日最大字符數。結合對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符總和。跨區域呼叫加倍；如果已核准的 TPM 增加，則不適用。
GPT OSS Safeguard 20B 的模型調用每日權杖上限（跨區域呼叫加倍）	每個支援的區域：144，000，000，000	否	GPT OSS Safeguard 20B 模型推論的每日最大字符數。結合對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符總和。跨區域呼叫加倍；如果已核准的 TPM 增加，則不適用。
Gemma 3 12B 的模型調用每日權杖上限（跨區域呼叫加倍）	每個支援的區域：144，000，000，000	否	Gemma 3 12B 模型推論的每日最大字符數。結合對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符總和。跨區域呼叫加倍；如果已核准的 TPM 增加，則不適用。
Gemma 3 27B 的模型調用每日權杖上限（跨區域呼叫加倍）	每個支援的區域：144，000，000，000	否	Gemma 3 27B 模型推論的每日最大字符數。結合對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符總和。跨區域呼叫加倍；如果已核准的 TPM 增加，則不適用。
Gemma 3 4B 的模型調用每日權杖上限（跨區域呼叫加倍）	每個支援的區域：144，000，000，000	否	Gemma 3 4B 模型推論的每日最大字符數。結合對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符總和。跨區域呼叫加倍；如果已核准的 TPM 增加，則不適用。
Kimi K2 Thinking 的模型調用每日權杖上限（跨區域呼叫加倍）	每個支援的區域：144，000，000，000	否	Kimi K2 Thinking 模型推論的每日最大權杖數。結合對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符總和。跨區域呼叫加倍；如果已核准的 TPM 增加，則不適用。
Magistral Small 1.2 的模型調用每日權杖上限（跨區域呼叫加倍）	每個支援的區域：144，000，000，000	否	Magistral Small 1.2 模型推論的每日最大權杖。結合對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符總和。跨區域呼叫加倍；如果已核准的 TPM 增加，則不適用。
Meta Llama 3.2 11B Instruct 的模型調用每日權杖上限（跨區域呼叫加倍）	每個支援的區域：432，000，000	否	Meta Llama 3.2 11B Instruct 模型推論的每日權杖上限。結合對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符總和。跨區域呼叫加倍；如果已核准的 TPM 增加，則不適用。
Meta Llama 3.2 1B Instruct 的模型調用每日權杖上限（跨區域呼叫加倍）	每個支援的區域：432，000，000	否	Meta Llama 3.2 1B Instruct 模型推論的每日權杖上限。結合對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符總和。跨區域呼叫加倍；如果已核准的 TPM 增加，則不適用。
Meta Llama 3.2 3B Instruct 的模型調用每日權杖上限（跨區域呼叫加倍）	每個支援的區域：432，000，000	否	Meta Llama 3.2 3B Instruct 模型推論的每日最大字符數。結合對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符總和。跨區域呼叫加倍；如果已核准的 TPM 增加，則不適用。
Meta Llama 3.2 90B Instruct 的模型調用每日權杖上限（跨區域呼叫加倍）	每個支援的區域：432，000，000	否	Meta Llama 3.2 90B Instruct 模型推論的每日權杖上限。結合對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符總和。跨區域呼叫加倍；如果已核准的 TPM 增加，則不適用。
Meta Llama 4 Maverick V1 的模型調用每日權杖上限（跨區域呼叫加倍）	每個支援的區域：432，000，000	否	Meta Llama 4 Maverick V1 模型推論的每日最大字符數。結合對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符總和。跨區域呼叫加倍；如果已核准的 TPM 增加，則不適用。
Meta Llama 4 Scout V1 的模型調用每日權杖上限（跨區域呼叫加倍）	每個支援的區域：432，000，000	否	Meta Llama 4 Scout V1 模型推論的每日最大字符數。結合對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符總和。跨區域呼叫加倍；如果已核准的 TPM 增加，則不適用。
MiniMax M2.5 每天模型調用權杖上限（跨區域呼叫加倍）	每個支援的區域：144，000，000，000	否	MiniMax M2.5 模型推論的每日最大字符數。結合對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符總和。跨區域呼叫加倍；如果已核准的 TPM 增加，則不適用。
Minimax M2 的模型調用每日權杖上限（跨區域呼叫加倍）	每個支援的區域：144，000，000，000	否	Minimax M2 模型推論的每日最大字符數。結合對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符總和。跨區域呼叫加倍；如果已核准的 TPM 增加，則不適用。
Minimax M2.1 每天模型調用權杖上限（跨區域呼叫加倍）	每個支援的區域：144，000，000，000	否	Minimax M2.1 模型推論的每日最大字符數。結合對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符總和。跨區域呼叫加倍；如果已核准的 TPM 增加，則不適用。
Ministral 14B 3.0 的模型調用每日權杖上限（跨區域呼叫加倍）	每個支援的區域：144，000，000，000	否	Ministral 14B 3.0 模型推論的每日最大字符數。結合對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符總和。跨區域呼叫加倍；如果已核准的 TPM 增加，則不適用。
Ministral 3B 3.0 的模型調用每日權杖上限（跨區域呼叫加倍）	每個支援的區域：144，000，000，000	否	Ministral 3B 3.0 模型推論的每日最大字符數。結合對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符總和。跨區域呼叫加倍；如果已核准的 TPM 增加，則不適用。
Ministral 8B 3.0 每天模型調用權杖上限（跨區域呼叫加倍）	每個支援的區域：144，000，000，000	否	Ministral 8B 3.0 模型推論的每日最大字符數。結合對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符總和。跨區域呼叫加倍；如果已核准的 TPM 增加，則不適用。
Mistral AI Mistral 7B Instruct 每天模型調用權杖上限（跨區域呼叫加倍）	每個支援的區域：432，000，000	否	Mistral AI Mistral 7B Instruct 模型推論的每日最大權杖。結合對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符總和。跨區域呼叫加倍；如果已核准的 TPM 增加，則不適用。
Mistral AI Mistral Large 每天模型調用權杖上限（跨區域呼叫加倍）	每個支援的區域：432，000，000	否	Mistral AI Mistral Large 模型推論的每日最大權杖數。結合對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符總和。跨區域呼叫加倍；如果已核准的 TPM 增加，則不適用。
Mistral AI Mistral Small 每天模型調用權杖上限（跨區域呼叫加倍）	每個支援的區域：432，000，000	否	Mistral AI Mistral Small 模型推論的每日最大字符數。結合對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符總和。跨區域呼叫加倍；如果已核准的 TPM 增加，則不適用。
Mistral AI Mixtral 8X7B Instruct 的模型調用每日權杖上限（跨區域呼叫加倍）	每個支援的區域：432，000，000	否	Mistral AI Mixtral 8X7B Instruct 模型推論的每日最大字符數。結合對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符總和。跨區域呼叫加倍；如果已核准的 TPM 增加，則不適用。
Mistral Devstral 2 123b 的模型調用每日權杖上限（跨區域呼叫加倍）	每個支援的區域：144，000，000，000	否	Mistral Devstral 2 123b 模型推論的每日權杖上限。結合對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符總和。跨區域呼叫加倍；如果已核准的 TPM 增加，則不適用。
Mistral Large 3 每天模型調用權杖上限（跨區域呼叫加倍）	每個支援的區域：144，000，000，000	否	Mistral Large 3 模型推論的每日最大字符數。結合對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符總和。跨區域呼叫加倍；如果已核准的 TPM 增加，則不適用。
Mistral Pixtral Large 25.02 V1 的模型調用每日權杖上限（跨區域呼叫加倍）	每個支援的區域：57，600，000	否	Mistral Pixtral Large 25.02 V1 模型推論的每日權杖上限。結合對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符總和。跨區域呼叫加倍；如果已核准的 TPM 增加，則不適用。
Moonshot AI Kimi K2.5 每天模型調用權杖上限（跨區域呼叫加倍）	每個支援的區域：144，000，000，000	否	Moonshot AI Kimi K2.5 模型推論的每日最大字符數。結合對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符總和。跨區域呼叫加倍；如果已核准的 TPM 增加，則不適用。
NVIDIA Nemotron 3 Super 120B A12B 的模型調用每日權杖上限（跨區域呼叫加倍）	每個支援的區域：144，000，000，000	否	NVIDIA Nemotron 3 Super 120B A12B 模型推論的每日最大字符數。結合對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符總和。跨區域呼叫加倍；如果已核准的 TPM 增加，則不適用。
NVIDIA Nemotron Nano 2 每天模型調用權杖上限（跨區域呼叫加倍）	每個支援的區域：144，000，000，000	否	NVIDIA Nemotron Nano 2 模型推論的每日最大字符數。結合對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符總和。跨區域呼叫加倍；如果已核准的 TPM 增加，則不適用。
NVIDIA Nemotron Nano 2 VL 的模型調用每日權杖上限（跨區域呼叫加倍）	每個支援的區域：144，000，000，000	否	NVIDIA Nemotron Nano 2 VL 模型推論的每日最大字符數。結合對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符總和。跨區域呼叫加倍；如果已核准的 TPM 增加，則不適用。
Nemotron Nano 3 30B 的模型調用每日權杖上限（跨區域呼叫加倍）	每個支援的區域：144，000，000，000	否	Nemotron Nano 3 30B 模型推論的每日最大字符數。結合對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符總和。跨區域呼叫加倍；如果已核准的 TPM 增加，則不適用。
OpenAI GPT OSS 120B 的模型調用每日權杖上限（跨區域呼叫加倍）	每個支援的區域：144，000，000，000	否	OpenAI GPT OSS 120B 模型推論的每日最大字符數。結合對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符總和。跨區域呼叫加倍；如果已核准的 TPM 增加，則不適用。
OpenAI GPT OSS 20B 的模型調用每日權杖上限（跨區域呼叫加倍）	每個支援的區域：144，000，000，000	否	OpenAI GPT OSS 20B 模型推論的每日最大字符數。結合對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符總和。跨區域呼叫加倍；如果已核准的 TPM 增加，則不適用。
Qwen3 235B a22b 2507 V1 的模型調用每日權杖上限（跨區域呼叫加倍）	每個支援的區域：144，000，000，000	否	Qwen3 235B a22b 2507 V1 模型推論的每日權杖上限。結合對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符總和。跨區域呼叫加倍；如果已核准的 TPM 增加，則不適用。
Qwen3 32B V1 的模型調用每日權杖上限（跨區域呼叫加倍）	每個支援的區域：144，000，000，000	否	Qwen3 32B V1 模型推論的每日最大字符數。結合對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符總和。跨區域呼叫加倍；如果已核准的 TPM 增加，則不適用。
Qwen3 Coder 30B a3b V1 的模型調用每日權杖上限（跨區域呼叫加倍）	每個支援的區域：144，000，000，000	否	Qwen3 Coder 30B a3b V1 模型推論的每日最大字符數。結合對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符總和。跨區域呼叫加倍；如果已核准的 TPM 增加，則不適用。
Qwen3 Coder 480B a35b V1 的模型調用每日權杖上限（跨區域呼叫加倍）	每個支援的區域：144，000，000，000	否	Qwen3 Coder 480B a35b V1 模型推論的每日最大字符數。結合對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符總和。跨區域呼叫加倍；如果已核准的 TPM 增加，則不適用。
Qwen3 Coder Next 每天模型調用權杖上限（跨區域呼叫加倍）	每個支援的區域：144，000，000，000	否	Qwen3 Coder Next 模型推論的每日最大字符數。結合對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符總和。跨區域呼叫加倍；如果已核准的 TPM 增加，則不適用。
Qwen3 Next 80B A3B 每日模型調用權杖上限（跨區域呼叫加倍）	每個支援的區域：144，000，000，000	否	Qwen3 Next 80B A3B 模型推論的每日權杖上限。結合對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符總和。跨區域呼叫加倍；如果已核准的 TPM 增加，則不適用。
Qwen3 VL 235B A22B 的模型調用每日權杖上限（跨區域呼叫加倍）	每個支援的區域：144，000，000，000	否	Qwen3 VL 235B A22B 模型推論的每日最大字符數。結合對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符總和。跨區域呼叫加倍；如果已核准的 TPM 增加，則不適用。
Voxtral Mini 1.0 每天模型調用權杖上限（跨區域呼叫加倍）	每個支援的區域：144，000，000，000	否	Voxtral Mini 1.0 模型推論的每日權杖上限。結合對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符總和。跨區域呼叫加倍；如果已核准的 TPM 增加，則不適用。
Voxtral Small 1.0 的模型調用每日權杖上限（跨區域呼叫加倍）	每個支援的區域：144，000，000，000	否	Voxtral Small 1.0 模型推論的每日權杖上限。結合對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符總和。跨區域呼叫加倍；如果已核准的 TPM 增加，則不適用。
寫入器 AI Palmyra X4 V1 的模型調用每日權杖上限（跨區域呼叫加倍）	每個支援的區域：108，000，000	否	寫入器 AI Palmyra X4 V1 模型推論的每日最大字符數。結合對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符總和。跨區域呼叫加倍；如果已核准的 TPM 增加，則不適用。
寫入器 AI Palmyra X5 V1 的模型調用每日權杖上限（跨區域呼叫加倍）	每個支援的區域：108，000，000	否	寫入器 AI Palmyra X5 V1 模型推論的每日最大字符數。結合對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符總和。跨區域呼叫加倍；如果已核准的 TPM 增加，則不適用。
Writer Palmyra Vision 7B 每日模型調用權杖上限（跨區域呼叫加倍）	每個支援的區域：144，000，000，000	否	寫入器 Palmyra Vision 7B 模型推論的每日最大字符數。結合對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符總和。跨區域呼叫加倍；如果已核准的 TPM 增加，則不適用。
Z.ai GLM 5 的模型調用每日權杖上限（跨區域呼叫加倍）	每個支援的區域：144，000，000，000	否	Z.ai GLM 5 模型推論的每日最大字符數。結合對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符總和。跨區域呼叫加倍；如果已核准的 TPM 增加，則不適用。
Z.ai GLM-4.7 的模型調用每日權杖上限（跨區域呼叫加倍）	每個支援的區域：144，000，000，000	否	Z.ai GLM-4.7 模型推論的每日最大字符數。結合對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符總和。跨區域呼叫加倍；如果已核准的 TPM 增加，則不適用。
Z.ai GLM-4.7 Flash 的模型調用每日權杖上限（跨區域呼叫加倍）	每個支援的區域：144，000，000，000	否	Z.ai GLM-4.7 Flash 模型推論的每日最大字符數。結合對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符總和。跨區域呼叫加倍；如果已核准的 TPM 增加，則不適用。
基礎模型之間的模型單位無遞交佈建輸送量	每個支援的區域：0	是	可以分散到基本模型無遞交佈建輸送量的模型單位數量上限
跨自訂模型的模型單位無遞交佈建輸送量	每個支援的區域：0	是	可分散到自訂模型無遞交佈建輸送量的模型單位數量上限
AI21 Labs Jurassic-2 Mid 每個佈建模型的模型單位	每個支援的區域：0	是	可配置給 AI21 實驗室 Jurassic-2 Mid 佈建模型的模型單位數量上限。
AI21 Labs Jurassic-2 Ultra 每個佈建模型的模型單位	每個支援的區域：0	是	可配置給 AI21 Labs Jurassic-2 Ultra 佈建模型的模型單位數量上限。
Amazon Nova 2 Lite V1.0 256K 每個佈建模型的模型單位	每個支援的區域：0	是	可配置給 Amazon Nova 2 Lite V1.0 256K 佈建模型的模型單位數量上限。
Amazon Nova Canvas 每個佈建模型的模型單位	每個支援的區域：0	是	可配置給 Amazon Nova Canvas 佈建模型的模型單位數量上限。
Amazon Titan Embeddings G1 - Text 每個佈建模型的模型單位	每個支援的區域：0	是	可配置給 Amazon Titan Embeddings G1 - Text 佈建模型的模型單位數量上限。
Amazon Titan Image Generator G1 每個佈建模型的模型單位	每個支援的區域：0	是	可配置給 Amazon Titan Image Generator G1 佈建模型的模型單位數目上限。
Amazon Titan Image Generator G2 每個佈建模型的模型單位	每個支援的區域：0	是	可配置給 Amazon Titan Image Generator G2 佈建模型的模型單位數量上限。
Amazon Titan Lite V1 4K 每個佈建模型的模型單位	每個支援的區域：0	是	可配置給 Amazon Titan Text Lite V1 4K 佈建模型的模型單位數量上限。
Amazon Titan Multimodal Embeddings G1 每個佈建模型的模型單位	每個支援的區域：0	是	可配置給 Amazon Titan Multimodal Embeddings G1 佈建模型的模型單位數量上限。
Amazon Titan Text Embeddings V2 每個佈建模型的模型單位	每個支援的區域：0	是	可配置給 Amazon Titan Text Embeddings V2 佈建模型的模型單位數量上限。
Amazon Titan Text G1 - Express 8K 每個佈建模型的模型單位	每個支援的區域：0	是	可配置給 Amazon Titan Text G1 - Express 8K 佈建模型的模型單位數量上限。
Amazon Titan Text Premier V1 32K 每個佈建模型的模型單位	每個支援的區域：0	是	可配置給 Amazon Titan Text Premier V1 32K 佈建模型的模型單位數量上限。
Anthropic Claude 3 Haiku 200K 每個佈建模型的模型單位	每個支援的區域：0	是	可配置給 Anthropic Claude 3 Haiku 200K 佈建模型的模型單位數量上限。
Anthropic Claude 3 Haiku 48K 每個佈建模型的模型單位	每個支援的區域：0	是	可配置給 Anthropic Claude 3 Haiku 48K 佈建模型的模型單位數量上限。
Anthropic Claude 3 Sonnet 200K 每個佈建模型的模型單位	每個支援的區域：0	是	可配置給 Anthropic Claude 3 Sonnet 200K 佈建模型的模型單位數量上限。
Anthropic Claude 3 Sonnet 28K 的每個佈建模型的模型單位	每個支援的區域：0	是	可配置給 Anthropic Claude 3 Sonnet 28K 佈建模型的模型單位數目上限。
Anthropic Claude 3.5 Haiku 16K 每個佈建模型的模型單位	每個支援的區域：0	是	可配置給 Anthropic Claude 3.5 Haiku 16K 佈建模型的模型單位數量上限。
Anthropic Claude 3.5 Haiku 200K 每個佈建模型的模型單位	每個支援的區域：0	是	可配置給 Anthropic Claude 3.5 Haiku 200K 佈建模型的模型單位數量上限。
Anthropic Claude 3.5 Haiku 64K 每個佈建模型的模型單位	每個支援的區域：0	是	可配置給 Anthropic Claude 3.5 Haiku 64K 佈建模型的模型單位數量上限。
Anthropic Claude 3.5 Sonnet 18K 每個佈建模型的模型單位	每個支援的區域：0	是	可配置給 Anthropic Claude 3.5 Sonnet 18K 佈建模型的模型單位數目上限。
Anthropic Claude 3.5 Sonnet 200K 每個佈建模型的模型單位	每個支援的區域：0	是	可配置給 Anthropic Claude 3.5 Sonnet 200K 佈建模型的模型單位數量上限。
Anthropic Claude 3.5 Sonnet 51K 的每個佈建模型的模型單位	每個支援的區域：0	是	可配置給 Anthropic Claude 3.5 Sonnet 51K 佈建模型的模型單位數量上限。
Anthropic Claude 3.5 Sonnet V2 18K 每個佈建模型的模型單位	每個支援的區域：0	是	可配置給 Anthropic Claude 3.5 Sonnet V2 18K 佈建模型的模型單位數量上限。
Anthropic Claude 3.5 Sonnet V2 200K 每個佈建模型的模型單位	每個支援的區域：0	是	可配置給 Anthropic Claude 3.5 Sonnet V2 200K 佈建模型的模型單位數量上限。
Anthropic Claude 3.5 Sonnet V2 51K 每個佈建模型的模型單位	每個支援的區域：0	是	可配置給 Anthropic Claude 3.5 Sonnet V2 51K 佈建模型的模型單位數量上限。
Anthropic Claude 3.7 V1.0 Sonnet 18K 的每個佈建模型的模型單位	每個支援的區域：0	是	可配置給 Anthropic Claude 3.7 V1.0 Sonnet 18K 佈建模型的模型單位數量上限。
Anthropic Claude 3.7 V1.0 Sonnet 200K 的每個佈建模型的模型單位	每個支援的區域：0	是	可配置給 Anthropic Claude 3.7 V1.0 Sonnet 200K 佈建模型的模型單位數量上限。
Anthropic Claude 3.7 V1.0 Sonnet 51K 的每個佈建模型的模型單位	每個支援的區域：0	是	可配置給 Anthropic Claude 3.7 V1.0 Sonnet 51K 佈建模型的模型單位數量上限。
Anthropic Claude Instant V1 100K 每個佈建模型的模型單位	每個支援的區域：0	是	可配置給 Anthropic Claude Instant V1 100K 佈建模型的模型單位數量上限。
Anthropic Claude V2 100K 每個佈建模型的模型單位	每個支援的區域：0	是	可配置給 Anthropic Claude V2 100K 佈建模型的模型單位數量上限。
Anthropic Claude V2 18K 每個佈建模型的模型單位	每個支援的區域：0	是	可配置給 Anthropic Claude V2 18K 佈建模型的模型單位數量上限。
Anthropic Claude V2.1 18K 每個佈建模型的模型單位	每個支援的區域：0	是	可配置給 Anthropic Claude V2.1 18K 佈建模型的模型單位數量上限。
Anthropic Claude V2.1 200K 每個佈建模型的模型單位	每個支援的區域：0	是	可配置給 Anthropic Claude V2.1 200K 佈建模型的模型單位數量上限。
Cohere Command 每個佈建模型的模型單位	每個支援的區域：0	是	可配置給 Cohere Command 佈建模型的模型單位數目上限。
Cohere Command Light 每個佈建模型的模型單位	每個支援的區域：0	是	可配置給 Cohere Command Light 佈建模型的模型單位數目上限。
Cohere Command R 每個佈建模型的模型單位	每個支援的區域：0	是	可配置給 Cohere Command R 128k 佈建模型的模型單位數目上限。
Cohere Command R Plus 每個佈建模型的模型單位	每個支援的區域：0	是	可配置給 Cohere Command R Plus 128k 佈建模型的模型單位數目上限。
Cohere Embed English 每個佈建模型的模型單位	每個支援的區域：0	是	可配置給 Cohere Embed English 佈建模型的模型單位數量上限。
Cohere Embed Multiling 每個佈建模型的模型單位	每個支援的區域：0	是	可配置給 Cohere Embed Multilingual 佈建模型的模型單位數量上限。
Meta Llama 2 13B 每個佈建模型的模型單位	每個支援的區域：0	是	可配置給 Meta Llama 2 13B 佈建模型的模型單位數量上限。
Meta Llama 2 70B 每個佈建模型的模型單位	每個支援的區域：0	是	可配置給 Meta Llama 2 70B 佈建模型的模型單位數量上限。
Meta Llama 2 Chat 13B 每個佈建模型的模型單位	每個支援的區域：0	是	可配置給 Meta Llama 2 Chat 13B 佈建模型的模型單位數量上限。
Meta Llama 2 Chat 70B 每個佈建模型的模型單位	每個支援的區域：0	是	可配置給 Meta Llama 2 Chat 70B 佈建模型的模型單位數量上限。
Meta Llama 3 70B 指示的每個佈建模型的模型單位	每個支援的區域：0	是	可配置給 Meta Llama 3 70B Instruct 佈建模型的模型單位數量上限。
Meta Llama 3 8B 指示的每個佈建模型的模型單位	每個支援的區域：0	是	可配置給 Meta Llama 3 8B Instruct 佈建模型的模型單位數量上限。
Meta Llama 3.1 70B Instruct 每個佈建模型的模型單位	每個支援的區域：0	是	可配置給 Meta Llama 3.1 70B Instruct 佈建模型的模型單位數量上限。
Meta Llama 3.1 8B Instruct 每個佈建模型的模型單位	每個支援的區域：0	是	可配置給 Meta Llama 3.1 8B Instruct 佈建模型的模型單位數量上限。
Meta Llama 3.2 11B Instruct 每個佈建模型的模型單位	每個支援的區域：0	是	可配置給 Meta Llama 3.2 11B Instruct 佈建模型的模型單位數量上限。
Meta Llama 3.2 1B Instruct 每個佈建模型的模型單位	每個支援的區域：0	是	可配置給 Meta Llama 3.2 1B Instruct 佈建模型的模型單位數量上限。
Meta Llama 3.2 3B Instruct 每個佈建模型的模型單位	每個支援的區域：0	是	可配置給 Meta Llama 3.2 3B Instruct 佈建模型的模型單位數量上限。
Meta Llama 3.2 90B Instruct 每個佈建模型的模型單位	每個支援的區域：0	是	可配置給 Meta Llama 3.2 90B Instruct 佈建模型的模型單位數量上限。
Mistral Large 2407 每個佈建模型的模型單位	每個支援的區域：0	是	可配置給 Mistral Large 2407 佈建模型的模型單位數目上限。
Mistral Small 每個佈建模型的模型單位	每個支援的區域：0	是	可配置給 Mistral Small 佈建模型的模型單位數目上限。
適用於 Stability.ai Stable Diffusion XL 0.8 的每個佈建模型的模型單位	每個支援的區域：0	是	可配置給 Stability.ai Stable Diffusion XL 0.8 佈建模型的模型單位數量上限
適用於 Stability.ai Stable Diffusion XL 1.0 的每個佈建模型的模型單位	每個支援的區域：0	是	可配置給 Stability.ai Stable Diffusion XL 1.0 佈建模型的模型單位數量上限。
適用於 Amazon Nova Micro 的 128k 內容長度變體的每個佈建模型的模型單位	每個支援的區域：0	是	針對 Amazon Nova Micro 的 128k 內容長度變體，可配置給佈建模型的模型單位數量上限
Amazon Nova Lite 24k 內容長度變體的每個佈建模型的模型單位	每個支援的區域：0	是	針對 Amazon Nova Lite 的 24k 內容長度變體，可配置給佈建模型的模型單位數量上限
Amazon Nova Micro 24k 內容長度變體的每個佈建模型的模型單位	每個支援的區域：0	是	針對 Amazon Nova Micro 的 24k 內容長度變體，可配置給佈建模型的模型單位數量上限
Amazon Nova Pro 的 24k 內容長度變體的每個佈建模型的模型單位	每個支援的區域：0	是	針對 Amazon Nova Pro 的 24k 內容長度變體，可配置給佈建模型的模型單位數量上限
Amazon Nova Lite 300k 內容長度變體的每個佈建模型的模型單位	每個支援的區域：0	是	針對 Amazon Nova Lite 的 300k 內容長度變體，可配置給佈建模型的模型單位數量上限
Amazon Nova Pro 的 300k 內容長度變體的每個佈建模型的模型單位	每個支援的區域：0	是	針對 Amazon Nova Pro 的 300k 內容長度變體，可配置給佈建模型的模型單位數量上限。
具有承諾的模型單位，適用於為 Meta Llama 4 Scout 17B 建立的佈建全文指示 10M	每個支援的區域：0	是	可配置給為 Meta Llama 4 Scout 17B 建立的佈建輸送量的最大模型單位數量指示 10M，並承諾。
具有承諾的模型單位，適用於為 Meta Llama 4 Scout 17B 建立的 Provisioned Through Instruct 128K	每個支援的區域：0	是	可配置給為 Meta Llama 4 Scout 17B Instruct 128K 建立的佈建輸送量的最大模型單位數量，並承諾。
針對為 Meta Maverick 4 Scout 17B Instruct 128K 建立的全佈建模型單位與承諾	每個支援的區域：0	是	可配置給為 Meta Llama 4 Maverick 17B Instruct 128K 建立之佈建輸送量的模型單位數量上限，並承諾。
具有承諾的模型單位，適用於為 Meta Maverick 4 Scout 17B 建立的佈建全文指示 1M	每個支援的區域：0	是	可配置給為 Meta Llama 4 Maverick 17B 建立之佈建輸送量的模型單位數量上限指示 1M，並承諾。
為基礎模型 Amazon Nova 2 Lite V1.0 256K 建立的佈建輸送量無遞交模型單位	每個支援的區域：0	否	可配置給為基本模型 Amazon Nova 2 Lite V1.0 256K 建立的佈建輸送量的最大模型單位數量，無需任何承諾
為自訂模型 Amazon Nova 2 Lite V1.0 256K 建立的佈建輸送量無遞交模型單位	每個支援的區域：0	否	可配置給為自訂模型 Amazon Nova 2 Lite V1.0 256K 建立之佈建輸送量的模型單位數量上限，無需任何承諾。
每個帳戶的自訂提示路由器數量	每個受支援的區域：500	否	每個區域每個帳戶可建立的自訂提示路由器數量上限。
Amazon Nova Pro V1 的每分鐘隨需、延遲最佳化模型推論請求	每個受支援的區域：10	否	您可以在一分鐘內為 Amazon Nova Pro V1 的模型推論提交的隨需延遲最佳化請求數量上限。配額會考慮 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的合併總和。
Meta Llama 3.1 405B Instruct 的每分鐘隨需延遲最佳化模型推論請求	每個受支援的區域：100	否	針對 Meta Llama 3.1 405B Instruct，您可以在一分鐘內提交模型推論的隨需延遲最佳化請求數量上限。配額會考慮 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的合併總和。
Meta Llama 3.1 70B Instruct 的每分鐘隨需延遲最佳化模型推論請求	每個受支援的區域：100	否	針對 Meta Llama 3.1 70B Instruct，您可以在一分鐘內提交模型推論的隨需延遲最佳化請求數量上限。配額會考慮 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的合併總和。
Amazon Nova Pro V1 的每分鐘隨需延遲最佳化模型推論字符	每個支援的區域：40，000	否	您可以為 Amazon Nova Pro V1 在一分鐘內提交模型推論的隨需延遲最佳化權杖數量上限。配額會考慮對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符的合併總和。
Meta Llama 3.1 405B Instruct 的每分鐘隨需延遲最佳化模型推論字符	每個支援的區域：40，000	否	對於 Meta Llama 3.1 405B Instruct，您可以在一分鐘內提交模型推論的隨需延遲最佳化權杖數量上限。配額會考慮對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符的合併總和。
Meta Llama 3.1 70B Instruct 的每分鐘隨需延遲最佳化模型推論字符	每個支援的區域：40，000	否	針對 Meta Llama 3.1 70B Instruct，您可以在一分鐘內提交模型推論的隨需延遲最佳化權杖數量上限。配額會考慮對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符的合併總和。
Amazon Nova 2 多模式內嵌 V1 的隨需 InvokeModel 非同步並行請求	每個受支援的區域：30	否	您可以為 Amazon Nova 2 多模態內嵌 V1 提交的非同步並行模型推論請求數目上限。配額會考慮 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的合併總和。
TwelveLabs Marengo Embed 3.0 的隨需 InvokeModel 非同步並行請求	每個受支援的區域：10	是	您可以針對 TwelveLabs Marengo Embed 3.0 提交的非同步並行模型推論請求數目上限。配額會考慮 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的合併總和。
Amazon Nova 2 Sonic 的隨需 InvokeModel 並行請求	每個受支援的區域：20	否	您可以為 Amazon Nova 2 Sonic 提交的並行模型推論請求數量上限。配額會考慮 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的合併總和。
Amazon Nova Reel1.0 的隨需 InvokeModel 並行請求	每個受支援的區域：10	否	您可以為 Amazon Nova Reel 1.0 提交的並行模型推論請求數量上限。配額會考慮 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的合併總和。
Amazon Nova Reel1.1 的隨需 InvokeModel 並行請求	每個支援的區域：3	否	您可以為 Amazon Nova Reel 1.1 提交的並行模型推論請求數量上限。配額會考慮 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的合併總和。
Amazon Nova Sonic 的隨需 InvokeModel 並行請求	每個受支援的區域：20	否	您可以為 Amazon Nova Sonic 的模型推論提交的並行請求數量上限。
十二個實驗室 Marengo 的隨需 InvokeModel 並行請求	每個受支援的區域：30	否	您可以為 12 個實驗室 Marengo 的模型推論提交的並行 InvokeModel 請求數量上限。
十二個 Labs Pegasus 的隨需 InvokeModel 並行請求	每個受支援的區域：30	是	您可以為 12 個 Labs Pegasus 的模型推論提交的並行 InvokeModel 請求數目上限。
Anthropic Claude 3.5 Haiku 的每分鐘隨需延遲最佳化模型推論請求	每個受支援的區域：100	否	您可以在一分鐘內呼叫模型推論的次數上限。如果設定了延遲最佳化，配額會考慮 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream for Anthropic Claude 3.5 Haiku 的合併總和。
Anthropic Claude 3.5 Haiku 的每分鐘隨需延遲最佳化模型推論字符	每個受支援的區域：50 萬個	否	您可以在一分鐘內提交以進行模型推論的隨需權杖數量上限。如果設定了延遲最佳化，配額會考慮 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream for Anthropic Claude 3.5 Haiku 的所有請求的輸入和輸出字符的合併總和。
Luma Ray V2 的隨需模型推論並行請求	每個受支援的區域：1	否	您可以為 Luma Ray V2 的模型推論提交的並行請求數量上限。配額會考慮 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的合併總和。
AI21 Labs Jamba 1.5 Large 的每分鐘隨需模型推論請求	每個受支援的區域：100	否	AI21 Labs Jamba 1.5 Large 在一分鐘內可以呼叫模型推論的次數上限。配額會考慮 Converse 和 InvokeModel 的請求總和
AI21 Labs Jamba 1.5 Mini 的每分鐘隨需模型推論請求	每個受支援的區域：100	否	AI21 Labs Jamba 1.5 Mini 在一分鐘內可以呼叫模型推論的次數上限。配額會考慮 Converse 和 InvokeModel 的請求總和
Amazon Nova 2 多模式內嵌 V1 的每分鐘隨需模型推論請求	每個受支援的區域：2,000	否	對於 Amazon Nova 2 多模態內嵌 V1，您可以在一分鐘內提交模型推論的隨需請求數量上限。此配額代表對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 動作的請求總數。
Amazon Nova Canvas 的每分鐘隨需模型推論請求	每個受支援的區域：100	否	您可以在一分鐘內為 Amazon Nova Canvas 提交模型推論的請求數量上限。配額會考慮 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的合併總和。
Amazon Nova Lite 的每分鐘隨需模型推論請求	us-east-1：2，000 eu-west-2：2，000 每個其他支援的區域：200	否	您可以為 Amazon Nova Lite 在一分鐘內提交模型推論的隨需請求數量上限。此配額代表對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 動作的請求總數。
Amazon Nova Micro 的每分鐘隨需模型推論請求	us-east-1：2，000 eu-west-2：2，000 每個其他支援的區域：200	否	您可以為 Amazon Nova Micro 在一分鐘內提交模型推論的隨需請求數量上限。此配額代表對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 動作的請求總數。
Amazon Nova Pro 的每分鐘隨需模型推論請求	每個受支援的區域：250	否	您可以為 Amazon Nova Pro 在一分鐘內提交模型推論的隨需請求數量上限。此配額代表對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 動作的請求總數。
Amazon Rerank 1.0 的每分鐘隨需模型推論請求	每個受支援的區域：200	否	對於 Amazon Rerank 1.0，您可以在一分鐘內呼叫 InvokeModel 的次數上限。
Amazon Titan Image Generator G1 的每分鐘隨需模型推論請求	每個支援的區域：60	否	對於 Amazon Titan Image Generator G1，您可以在一分鐘內呼叫 InvokeModel 的次數上限。
Amazon Titan Image Generator G1 V2 的每分鐘隨需模型推論請求	每個支援的區域：60	否	您可以為 Amazon Titan Image Generator G1 V2 在一分鐘內提交模型推論的隨需請求數量上限。此配額代表對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 動作的請求總數。
Amazon Titan Multimodal Embeddings G1 的每分鐘隨需模型推論請求	每個受支援的區域：2,000	否	對於 Amazon Titan Multimodal Embeddings G1，您可以在一分鐘內呼叫 InvokeModel 的次數上限。
Amazon Titan Text Embeddings 的每分鐘隨需模型推論請求	每個受支援的區域：2,000	否	對於 Amazon Titan Text Embeddings，您可以在一分鐘內呼叫 InvokeModel 的次數上限
Amazon Titan Text Embeddings V2 的每分鐘隨需模型推論請求	每個支援的區域：6，000	否	對於 Amazon Titan Text Embeddings V2，您可以在一分鐘內呼叫 InvokeModel 的次數上限
Amazon Titan Text Express 的每分鐘隨需模型推論請求	每個支援的區域：400	否	您可以在一分鐘內呼叫模型推論的次數上限。配額考慮 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream for Amazon Titan Text Express 的合併總和
Amazon Titan Text Premier 的每分鐘隨需模型推論請求	每個受支援的區域：100	否	您可以在一分鐘內呼叫模型推論的次數上限。配額會考慮 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream for Amazon Titan Text Premier 的合併總和
Anthropic Claude 3 Haiku 的每分鐘隨需模型推論請求	us-east-1：1，000 us-west-2：1，000 ap-northeast-1：200 ap-southeast-1：200 每個其他支援的區域：400	否	您可以在一分鐘內呼叫模型推論的次數上限。配額會考慮 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream for Anthropic Claude 3 Haiku 的合併總和。
Anthropic Claude 3 Opus 的每分鐘隨需模型推論請求	每個受支援的區域：50	否	您可以在一分鐘內為 Anthropic Claude 3 Opus 提交模型推論的隨需請求數量上限。此配額代表對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 動作的請求總數。
Anthropic Claude 3 Sonnet 的每分鐘隨需模型推論請求	us-east-1：500 us-west-2：500 每個其他支援的區域：100	否	您可以在一分鐘內呼叫模型推論的次數上限。配額會考慮 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream for Anthropic Claude 3 Sonnet 的合併總和。
Anthropic Claude 3.5 Haiku 的每分鐘隨需模型推論請求	us-west-1：400 每個其他支援的區域：1，000	否	您可以在一分鐘內為 Anthropic Claude 3.5 Haiku 提交模型推論的隨需請求數量上限。此配額代表對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 動作的請求總數。
Anthropic Claude 3.5 Sonnet 的每分鐘隨需模型推論請求	us-west-2：250 ap-northeast-1：20 ap-southeast-1：20 eu-central-1：20 eu-west-1：20 eu-west-3：20 每個其他支援的區域：50	否	Anthropic Claude 3.5 Sonnet 在一分鐘內可以呼叫模型推論的次數上限。配額會考慮 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的合併總和。
Anthropic Claude 3.5 Sonnet V2 的每分鐘隨需模型推論請求	us-west-2：250 每個其他支援的區域：50	否	Anthropic Claude 3.5 Sonnet V2 在一分鐘內可以呼叫模型推論的次數上限。配額會考慮 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的合併總和。
Anthropic Claude 3.7 Sonnet V1 的每分鐘隨需模型推論請求	每個支援的區域：125	否	您可以在一分鐘內為 Anthropic Claude 3.7 Sonnet V1 提交模型推論的隨需請求數量上限。此配額代表對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 動作的請求總數。
Anthropic Claude Opus 4.6 V1 的每分鐘隨需模型推論請求	每個受支援的區域：5,000	否	對於 Anthropic Claude Opus 4.6 V1，您可以在一分鐘內提交模型推論的隨需請求數量上限。此配額代表對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 動作的請求總數。
Anthropic Claude Sonnet 4.6 的每分鐘隨需模型推論請求	每個受支援的區域：5,000	否	對於 Anthropic Claude Sonnet 4.6，您可以在一分鐘內提交模型推論的隨需請求數量上限。此配額代表對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 動作的請求總數。
Cohere Command R 的每分鐘隨需模型推論請求	每個支援的區域：400	否	您可以在一分鐘內呼叫模型推論的次數上限。配額會考慮 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream for Cohere Command R 128k 的合併總和。
Cohere Command R Plus 的每分鐘隨需模型推論請求	每個支援的區域：400	否	您可以在一分鐘內呼叫模型推論的次數上限。配額會考慮 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream for Cohere Command R Plus 128k 的合併總和。
Cohere Embed English 的每分鐘隨需模型推論請求	每個受支援的區域：2,000	否	對於 Cohere Embed English，您可以在一分鐘內呼叫 InvokeModel 的次數上限。
Cohere 內嵌多語言的每分鐘隨需模型推論請求	每個受支援的區域：2,000	否	對於 Cohere Embed Multilingual，您可以在一分鐘內呼叫 InvokeModel 的次數上限。
Cohere Embed V4 的每分鐘隨需模型推論請求	每個支援的區域：1,000	否	您可以在一分鐘內針對 Cohere Embed V4 提交模型推論的隨需請求數量上限。此配額代表對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 動作的請求總數。
Cohere Rerank 3.5 的每分鐘隨需模型推論請求	每個受支援的區域：250	否	對於 Cohere Rerank 3.5，您可以在一分鐘內呼叫 InvokeModel 的次數上限。
DeepSeek V3 V1 的每分鐘隨需模型推論請求	每個受支援的區域：10,000	否	您可以針對 DeepSeek V3 V1 在一分鐘內提交模型推論的隨需請求數量上限。此配額代表對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 動作的請求總數。
DeepSeek V3.2 的每分鐘隨需模型推論請求	每個受支援的區域：10,000	否	對於 DeepSeek V3.2，您可以在一分鐘內提交模型推論的隨需請求數量上限。此配額代表對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 動作的請求總數。
GPT OSS Safeguard 120B 的每分鐘隨需模型推論請求	每個受支援的區域：10,000	否	對於 GPT OSS Safeguard 120B，您可以在一分鐘內提交模型推論的隨需請求數量上限。此配額代表對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 動作的請求總數。
GPT OSS Safeguard 20B 的每分鐘隨需模型推論請求	每個受支援的區域：10,000	否	對於 GPT OSS Safeguard 20B，您可以在一分鐘內提交模型推論的隨需請求數量上限。此配額代表對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 動作的請求總數。
Gemma 3 12B 的每分鐘隨需模型推論請求	每個受支援的區域：10,000	否	您可以在一分鐘內針對 Gemma 3 12B 提交模型推論的隨需請求數量上限。此配額代表對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 動作的請求總數。
Gemma 3 27B 的每分鐘隨需模型推論請求	每個受支援的區域：10,000	否	針對 Gemma 3 27B，您可以在一分鐘內提交模型推論的隨需請求數量上限。此配額代表對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 動作的請求總數。
Gemma 3 4B 的每分鐘隨需模型推論請求	每個受支援的區域：10,000	否	您可以在一分鐘內針對 Gemma 3 4B 提交模型推論的隨需請求數量上限。此配額代表對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 動作的請求總數。
每分鐘針對 Kimi K2 Thinking 的隨需模型推論請求	每個受支援的區域：10,000	否	您可以提交以進行模型推論的隨需請求數量上限，在一分鐘內即可用於 Kimi K2 Thinking。此配額代表對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 動作的請求總數。
Magistral Small 1.2 的每分鐘隨需模型推論請求	每個受支援的區域：10,000	否	針對 Magistral Small 1.2，您可以在一分鐘內提交模型推論的隨需請求數量上限。此配額代表對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 動作的請求總數。
Meta Llama 3 70B Instruct 的每分鐘隨需模型推論請求	每個支援的區域：400	否	對於 Meta Llama 3 70B Instruct，您可以在一分鐘內提交模型推論的隨需請求數量上限。此配額代表對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 動作的請求總數。
Meta Llama 3 8B Instruct 的每分鐘隨需模型推論請求	每個支援的區域：800	否	對於 Meta Llama 3 8B Instruct，您可以在一分鐘內提交模型推論的隨需請求數量上限。此配額代表對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 動作的請求總數。
Meta Llama 3.1 405B Instruct 的每分鐘隨需模型推論請求	每個受支援的區域：200	否	對於 Meta Llama 3.1 405B Instruct，您可以在一分鐘內提交模型推論的隨需請求數量上限。此配額代表對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 動作的請求總數。
Meta Llama 3.1 70B Instruct 的每分鐘隨需模型推論請求	每個支援的區域：400	否	針對 Meta Llama 3.1 70B Instruct，您可以在一分鐘內提交模型推論的隨需請求數量上限。此配額代表對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 動作的請求總數。
Meta Llama 3.1 8B Instruct 的每分鐘隨需模型推論請求	每個支援的區域：800	否	針對 Meta Llama 3.1 8B Instruct，您可以在一分鐘內提交模型推論的隨需請求數量上限。此配額代表對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 動作的請求總數。
Meta Llama 3.2 11B Instruct 的每分鐘隨需模型推論請求	每個支援的區域：400	否	對於 Meta Llama 3.2 11B Instruct，您可以在一分鐘內呼叫模型推論的次數上限。配額會考慮 InvokeModel、InvokeModelWithResponseStream、Converse 和 ConverseStream 的請求總和。
Meta Llama 3.2 1B Instruct 的每分鐘隨需模型推論請求	每個支援的區域：800	否	針對 Meta Llama 3.2 1B Instruct，您可以在一分鐘內提交模型推論的隨需請求數量上限。此配額代表對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 動作的請求總數。
Meta Llama 3.2 3B Instruct 的每分鐘隨需模型推論請求	每個支援的區域：800	否	對於 Meta Llama 3.2 3B Instruct，您可以在一分鐘內呼叫模型推論的次數上限。配額會考慮 InvokeModel、InvokeModelWithResponseStream、Converse 和 ConverseStream 的請求總和。
Meta Llama 3.2 90B Instruct 的每分鐘隨需模型推論請求	每個支援的區域：400	否	對於 Meta Llama 3.2 90B Instruct，您可以在一分鐘內呼叫模型推論的次數上限。配額會考慮 InvokeModel、InvokeModelWithResponseStream、Converse 和 ConverseStream 的請求總和。
Meta Llama 3.3 70B Instruct 的每分鐘隨需模型推論請求	每個支援的區域：400	否	對於 Meta Llama 3.3 70B Instruct，您可以在一分鐘內提交模型推論的隨需請求數量上限。此配額代表對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 動作的請求總數。
MiniMax M2.5 的每分鐘隨需模型推論請求	每個受支援的區域：10,000	否	對於 MiniMax M2.5，您可以在一分鐘內提交模型推論的隨需請求數量上限。此配額代表對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 動作的請求總數。
Minimax M2 的每分鐘隨需模型推論請求	每個受支援的區域：10,000	否	針對 Minimax M2，您可以在一分鐘內提交模型推論的隨需請求數量上限。此配額代表對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 動作的請求總數。
Minimax M2.1 的每分鐘隨需模型推論請求	每個受支援的區域：10,000	否	針對 Minimax M2.1，您可以在一分鐘內提交模型推論的隨需請求數量上限。此配額代表對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 動作的請求總數。
Ministral 14B 3.0 的每分鐘隨需模型推論請求	每個受支援的區域：10,000	否	針對 Ministral 14B 3.0，您可以在一分鐘內提交模型推論的隨需請求數量上限。此配額代表對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 動作的請求總數。
Ministral 3B 3.0 的每分鐘隨需模型推論請求	每個受支援的區域：10,000	否	針對 Ministral 3B 3.0，您可以在一分鐘內提交模型推論的隨需請求數量上限。此配額代表對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 動作的請求總數。
Ministral 8B 3.0 的每分鐘隨需模型推論請求	每個受支援的區域：10,000	否	針對 Ministral 8B 3.0，您可以在一分鐘內提交模型推論的隨需請求數量上限。此配額代表對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 動作的請求總數。
Mistral 7B Instruct 的每分鐘隨需模型推論請求	每個支援的區域：800	否	對於 Mistral mistral-7b-instruct-v0，您可以在一分鐘內呼叫 InvokeModel 的次數上限
Mistral AI Mistral Small 的每分鐘隨需模型推論請求	每個支援的區域：400	否	對於 Mistral AI Mistral Small，您可以在一分鐘內呼叫 InvokeModel 和 InvokeModelWithResponseStream 的次數上限
Mistral Devstral 2 123b 的每分鐘隨需模型推論請求	每個受支援的區域：10,000	否	對於 Mistral Devstral 2 123b，您可以在一分鐘內提交模型推論的隨需請求數量上限。此配額代表對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 動作的請求總數。
Mistral Large 每分鐘的隨需模型推論請求	每個支援的區域：400	否	對於 Mistral mistral-large-2402-v1，您可以在一分鐘內呼叫 InvokeModel 和 InvokeModelWithResponseStream 的次數上限
Mistral Large 2407 的每分鐘隨需模型推論請求	每個支援的區域：400	否	對於 Mistral Large 2407，您可以在一分鐘內呼叫模型推論的次數上限。配額會考慮 InvokeModel、InvokeModelWithResponseStream、Converse 和 ConverseStream 的請求總和
Mistral Large 3 的每分鐘隨需模型推論請求	每個受支援的區域：10,000	否	對於 Mistral Large 3，您可以在一分鐘內提交模型推論的隨需請求數量上限。此配額代表對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 動作的請求總數。
Mistral Mixtral 8x7b Instruct 的每分鐘隨需模型推論請求	每個支援的區域：400	否	對於 Mistral mixtral-8x7b-v0，您可以在一分鐘內呼叫 InvokeModel 的次數上限
Moonshot AI Kimi K2.5 的每分鐘隨需模型推論請求	每個受支援的區域：10,000	否	對於 Moonshot AI Kimi K2.5，您可以在一分鐘內提交模型推論的隨需請求數量上限。此配額代表對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 動作的請求總數。
NVIDIA Nemotron 3 Super 120B A12B 的每分鐘隨需模型推論請求	每個受支援的區域：10,000	否	針對 NVIDIA Nemotron 3 Super 120B A12B，您可以在一分鐘內提交模型推論的隨需請求數量上限。此配額代表對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 動作的請求總數。
NVIDIA Nemotron Nano 2 的每分鐘隨需模型推論請求	每個受支援的區域：10,000	否	針對 NVIDIA Nemotron Nano 2，您可以在一分鐘內提交模型推論的隨需請求數量上限。此配額代表對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 動作的請求總數。
NVIDIA Nemotron Nano 2 VL 的每分鐘隨需模型推論請求	每個受支援的區域：10,000	否	針對 NVIDIA Nemotron Nano 2 VL，您可以在一分鐘內提交模型推論的隨需請求數量上限。此配額代表對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 動作的請求總數。
Nemotron Nano 3 30B 每分鐘隨需模型推論請求	每個受支援的區域：10,000	否	對於 Nemotron Nano 3 30B，您可以在一分鐘內提交模型推論的隨需請求數量上限。此配額代表對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 動作的請求總數。
OpenAI GPT OSS 120B 的每分鐘隨需模型推論請求	每個受支援的區域：10,000	否	針對 OpenAI GPT OSS 120B，您可以在一分鐘內提交模型推論的隨需請求數量上限。此配額代表對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 動作的請求總數。
OpenAI GPT OSS 20B 的每分鐘隨需模型推論請求	每個受支援的區域：10,000	否	針對 OpenAI GPT OSS 20B，您可以在一分鐘內提交模型推論的隨需請求數量上限。此配額代表對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 動作的請求總數。
Qwen3 235B a22b 2507 V1 的每分鐘隨需模型推論請求	每個受支援的區域：10,000	否	對於 Qwen3 235B a22b 2507 V1，您可以在一分鐘內提交模型推論的隨需請求數量上限。此配額代表對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 動作的請求總數。
Qwen3 32B V1 的每分鐘隨需模型推論請求	每個受支援的區域：10,000	否	對於 Qwen3 32B V1，您可以在一分鐘內提交模型推論的隨需請求數量上限。此配額代表對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 動作的請求總數。
Qwen3 Coder 30B a3b V1 的每分鐘隨需模型推論請求	每個受支援的區域：10,000	否	對於 Qwen3 Coder 30B a3b V1，您可以在一分鐘內提交模型推論的隨需請求數量上限。此配額代表對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 動作的請求總數。
Qwen3 Coder 480B a35b V1 的每分鐘隨需模型推論請求	每個受支援的區域：10,000	否	對於 Qwen3 Coder 480B a35b V1，您可以在一分鐘內提交模型推論的隨需請求數量上限。此配額代表對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 動作的請求總數。
Qwen3 Coder Next 的每分鐘隨需模型推論請求	每個受支援的區域：10,000	否	對於 Qwen3 Coder Next，您可以在一分鐘內提交模型推論的隨需請求數量上限。此配額代表對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 動作的請求總數。
Qwen3 Next 80B A3B 的每分鐘隨需模型推論請求	每個受支援的區域：10,000	否	對於 Qwen3 Next 80B A3B，您可以在一分鐘內提交模型推論的隨需請求數量上限。此配額代表對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 動作的請求總數。
Qwen3 VL 235B A22B 的每分鐘隨需模型推論請求	每個受支援的區域：10,000	否	對於 Qwen3 VL 235B A22B，您可以在一分鐘內提交模型推論的隨需請求數量上限。此配額代表對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 動作的請求總數。
Stability.ai Stable Diffusion 3 Large 的每分鐘隨需模型推論請求	每個受支援的區域：15	否	對於 Stability.ai Stable Diffusion 3 Large，您可以在一分鐘內呼叫 InvokeModel 的次數上限。
Stability.ai Stable Diffusion 3 Medium 的每分鐘隨需模型推論請求	每個支援的區域：60	否	對於 Stability.ai Stable Diffusion 3 Medium，您可以在一分鐘內呼叫 InvokeModel 的次數上限
Stability.ai Stable Diffusion 3.5 Large 的每分鐘隨需模型推論請求	每個受支援的區域：15	否	對於 Stability.ai Stable Diffusion 3.5 Large，您可以在一分鐘內呼叫 InvokeModel 的次數上限。
Stability.ai 穩定映像核心的每分鐘隨需模型推論請求	每個支援的區域：90	否	對於 Stability.ai 穩定映像核心，您可以在一分鐘內呼叫 InvokeModel 的次數上限。
Stability.ai Stable Image Ultra 的每分鐘隨需模型推論請求	每個受支援的區域：10	否	對於 Stability.ai Stable Image Ultra，您可以在一分鐘內呼叫 InvokeModel 的次數上限。
穩定映像保守擴展的每分鐘隨需模型推論請求	每個受支援的區域：2	否	針對穩定映像保守擴展，您可以在一分鐘內提交模型推論的隨需請求數量上限。此配額代表對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 動作的請求總數。
穩定影像控制草圖每分鐘的隨需模型推論請求	每個受支援的區域：10	否	針對穩定影像控制草圖，您可以在一分鐘內提交模型推論的隨需請求數量上限。此配額代表對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 動作的請求總數。
穩定影像控制結構的每分鐘隨需模型推論請求	每個受支援的區域：10	否	您可以在一分鐘內針對穩定影像控制結構提交模型推論的隨需請求數量上限。此配額代表對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 動作的請求總數。
穩定映像 Creative Upscale 的每分鐘隨需模型推論請求	每個受支援的區域：2	否	針對穩定映像 Creative Upscale，您可以在一分鐘內提交模型推論的隨需請求數量上限。此配額代表對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 動作的請求總數。
穩定映像清除物件的每分鐘隨需模型推論請求	每個受支援的區域：10	否	針對穩定映像清除物件，您可以在一分鐘內提交模型推論的隨需請求數量上限。此配額代表對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 動作的請求總數。
穩定映像快速擴展的每分鐘隨需模型推論請求	每個受支援的區域：10	否	針對穩定映像快速擴展，您可以在一分鐘內提交模型推論的隨需請求數量上限。此配額代表對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 動作的請求總數。
穩定映像注入的每分鐘隨需模型推論請求	每個受支援的區域：10	否	您可以在一分鐘內針對穩定映像注入提交模型推論的隨需請求數量上限。此配額代表對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 動作的請求總數。
穩定映像 Outpaint 的每分鐘隨需模型推論請求	每個受支援的區域：2	否	您可以在一分鐘內針對穩定影像貼圖提交模型推論的隨需請求數量上限。此配額代表對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 動作的請求總數。
穩定映像移除背景的每分鐘隨需模型推論請求	每個受支援的區域：10	否	針對穩定映像移除背景，您可以在一分鐘內提交模型推論的隨需請求數量上限。此配額代表對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 動作的請求總數。
穩定影像搜尋和重新著色的每分鐘隨需模型推論請求	每個受支援的區域：10	否	針對穩定影像搜尋和重新著色，您可以在一分鐘內提交模型推論的隨需請求數量上限。此配額代表對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 動作的請求總數。
穩定影像搜尋和取代的每分鐘隨需模型推論請求	每個受支援的區域：10	否	針對穩定映像搜尋和取代，您可以在一分鐘內提交模型推論的隨需請求數量上限。此配額代表對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 動作的請求總數。
穩定影像樣式指南的每分鐘隨需模型推論請求	每個受支援的區域：10	否	針對穩定映像樣式指南，您可以在一分鐘內提交模型推論的隨需請求數量上限。此配額代表對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 動作的請求總數。
穩定影像樣式傳輸的每分鐘隨需模型推論請求	每個受支援的區域：10	否	您可以在一分鐘內針對穩定影像樣式傳輸提交模型推論的隨需請求數量上限。此配額代表對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 動作的請求總數。
每分鐘 12 個實驗室 Marengo 的隨需模型推論請求	每個受支援的區域：100	否	對於十二個實驗室 Marengo，您可以在一分鐘內提交模型推論的隨需請求數量上限。此配額代表對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 動作的請求總數。
12 個 Labs Pegasus 的每分鐘隨需模型推論請求	每個支援的區域：60	是	對於十二個 Labs Pegasus，您可以在一分鐘內提交模型推論的隨需請求數量上限。配額會考慮 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的合併總和。
TwelveLabs Marengo Embed 3.0 的每分鐘隨需模型推論請求	每個受支援的區域：500	是	對於 TwelveLabs Marengo Embed 3.0，您可以在一分鐘內提交模型推論的隨需請求數量上限。此配額代表對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 動作的請求總數。
Voxtral Mini 1.0 的每分鐘隨需模型推論請求	每個受支援的區域：10,000	否	對於 Voxtral Mini 1.0，您可以在一分鐘內提交模型推論的隨需請求數量上限。此配額代表對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 動作的請求總數。
Voxtral Small 1.0 的每分鐘隨需模型推論請求	每個受支援的區域：10,000	否	對於 Voxtral Small 1.0，您可以在一分鐘內提交模型推論的隨需請求數量上限。此配額代表對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 動作的請求總數。
Writer Palmyra Vision 7B 的每分鐘隨需模型推論請求	每個受支援的區域：10,000	否	對於 Writer Palmyra Vision 7B，您可以在一分鐘內提交模型推論的隨需請求數量上限。此配額代表對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 動作的請求總數。
Z.ai GLM 5 的每分鐘隨需模型推論請求	每個受支援的區域：10,000	否	對於 Z.ai GLM 5，您可以在一分鐘內提交模型推論的隨需請求數量上限。此配額代表對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 動作的請求總數。
Z.ai GLM-4.7 的每分鐘隨需模型推論請求	每個受支援的區域：10,000	否	對於 Z.ai GLM-4.7，您可以在一分鐘內提交模型推論的隨需請求數量上限。此配額代表對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 動作的請求總數。
Z.ai GLM-4.7 Flash 的每分鐘隨需模型推論請求	每個受支援的區域：10,000	否	您可以針對 Z.ai GLM-4.7 Flash 在一分鐘內提交模型推論的隨需請求數量上限。此配額代表對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 動作的請求總數。
AI21 Labs Jamba 1.5 Large 的每分鐘隨需模型推論字符	每個支援的區域：300，000	否	對於 AI21 Labs Jamba 1.5 Large，您可以在一分鐘內提交模型推論的字符數量上限。配額會考慮 Converse 和 InvokeModel 所有請求的輸入和輸出字符的合併總和。
AI21 Labs Jamba 1.5 Mini 的每分鐘隨需模型推論字符	每個支援的區域：300，000	否	對於 AI21 Labs Jamba 1.5 Mini，您可以在一分鐘內提交模型推論的字符數量上限。配額會考慮 Converse 和 InvokeModel 所有請求的輸入和輸出字符的合併總和。
Amazon Nova Lite 的每分鐘隨需模型推論字符	us-east-1：4，000，000 eu-west-2：4，000，000 其他每個支援的區域：200，000	否	您可以為 Amazon Nova Lite 在一分鐘內提交模型推論的隨需字符數量上限。配額會考慮對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符總和。
Amazon Nova Micro 的每分鐘隨需模型推論字符	us-east-1：4，000，000 eu-west-2：4，000，000 其他每個支援的區域：200，000	否	您可以為 Amazon Nova Micro 在一分鐘內提交模型推論的隨需權杖數量上限。配額會考慮對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符總和。
Amazon Nova Pro 的每分鐘隨需模型推論字符	每個受支援的區域：1,000,000	否	您可以在一分鐘內為 Amazon Nova Pro 提交模型推論的隨需權杖數量上限。配額會考慮對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符的合併總和。
Amazon Titan Image Generator G1 V2 的每分鐘隨需模型推論字符	每個受支援的區域：2,000	否	對於 Amazon Titan Image Generator G1 V2，您可以在一分鐘內提交模型推論的隨需權杖數量上限。配額會考慮對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符的合併總和。
Amazon Titan Multimodal Embeddings G1 的每分鐘隨需模型推論字符	每個支援的區域：300，000	否	您可以在一分鐘內透過 InvokeModel 為 Amazon Titan Multimodal Embeddings G1 提供的字符數量上限。
Amazon Titan Text Embeddings 的每分鐘隨需模型推論字符	每個支援的區域：300，000	否	您可以在一分鐘內透過 InvokeModel 為 Amazon Titan Text Embeddings 提供的字符數量上限。
Amazon Titan Text Embeddings V2 的每分鐘隨需模型推論字符	每個支援的區域：300，000	否	您可以在一分鐘內透過 InvokeModel 為 Amazon Titan Text Embeddings V2 提供的字符數量上限。
Amazon Titan Text Express 的每分鐘隨需模型推論字符	每個支援的區域：300，000	否	您可以在一分鐘內提交以進行模型推論的隨需權杖數量上限。配額會考慮對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream for Amazon Titan Text Express 的所有請求的輸入和輸出字符總和。
Amazon Titan Text Premier 的每分鐘隨需模型推論字符	每個支援的區域：300，000	否	您可以在一分鐘內提交以進行模型推論的隨需權杖數量上限。配額會考慮對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream for Amazon Titan Text Premier 的所有請求的輸入和輸出字符總和。
Anthropic Claude 3 Haiku 的每分鐘隨需模型推論字符	us-east-1：2，000，000 us-west-2：2，000，000 ap-northeast-1：200，000 ap-southeast-1：200，000 每個其他支援的區域：300，000	否	您可以在一分鐘內提交以進行模型推論的隨需權杖數量上限。配額會考慮對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream for Anthropic Claude 3 Haiku 的所有請求的輸入和輸出字符總和。
Anthropic Claude 3 Opus 的每分鐘隨需模型推論字符	每個支援的區域：400，000	否	您可以在一分鐘內為 Anthropic Claude 3 Opus 提交模型推論的隨需權杖數量上限。配額會考慮對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符的合併總和。
Anthropic Claude 3 Sonnet 的每分鐘隨需模型推論字符	us-east-1：1，000，000 us-west-2：1，000，000 每個其他支援的區域：200，000	否	您可以在一分鐘內提交以進行模型推論的隨需權杖數量上限。配額會考慮對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream for Anthropic Claude 3 Sonnet 的所有請求的輸入和輸出字符總和。
Anthropic Claude 3.5 Haiku 的每分鐘隨需模型推論字符	us-west-1：300，000 每個其他支援的區域：2，000，000	否	對於 Anthropic Claude 3.5 Haiku，您可以在一分鐘內提交模型推論的隨需字符數量上限。配額會考慮對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符的合併總和。
Anthropic Claude 3.5 Sonnet 的每分鐘隨需模型推論字符	us-west-2：2，000，000 ap-northeast-1：200，000 ap-southeast-1：200，000 eu-central-1：200，000 eu-west-1：200，000 eu-west-3：200，000 每個其他支援的區域：400，000	否	您可以在一分鐘內為 Anthropic Claude 3.5 Sonnet 提交模型推論的字符數量上限。配額會考慮 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的合併總和。
Anthropic Claude 3.5 Sonnet V2 的每分鐘隨需模型推論字符	us-west-2：2，000，000 每個其他支援的區域：400，000	否	您可以在一分鐘內為 Anthropic Claude 3.5 Sonnet V2 提交模型推論的字符數量上限。配額會考慮 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的合併總和。
Anthropic Claude 3.7 Sonnet V1 的每分鐘隨需模型推論字符	每個受支援的區域：50 萬個	否	針對 Anthropic Claude 3.7 Sonnet V1，您可以在一分鐘內提交模型推論的隨需字符數量上限。配額會考慮對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符的合併總和。
Anthropic Claude Opus 4.6 V1 的每分鐘隨需模型推論字符	每個支援的區域：1，500，000	否	對於 Anthropic Claude Opus 4.6 V1，您可以在一分鐘內提交模型推論的隨需字符數量上限。配額會考慮對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符的合併總和。
Anthropic Claude Sonnet 4.6 的每分鐘隨需模型推論字符	每個支援的區域：3，000，000	否	對於 Anthropic Claude Sonnet 4.6，您可以在一分鐘內提交模型推論的隨需字符數量上限。配額會考慮對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符的合併總和。
Cohere Command R 的每分鐘隨需模型推論字符	每個支援的區域：300，000	否	您可以在一分鐘內提交以進行模型推論的隨需權杖數量上限。配額會考慮對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream for Cohere Command R 128k 的所有請求的輸入和輸出字符總和。
Cohere Command R Plus 的每分鐘隨需模型推論權杖	每個支援的區域：300，000	否	您可以在一分鐘內提交以進行模型推論的隨需權杖數量上限。配額會考慮對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream for Cohere Command R Plus 128k 的所有請求的輸入和輸出字符總和。
Cohere Embed English 的每分鐘隨需模型推論字符	每個支援的區域：300，000	否	您可以在一分鐘內透過 InvokeModel 為 Cohere Embed English 提供的字符數量上限。
適用於 Cohere Embed Multilingual 的每分鐘隨需模型推論字符	每個支援的區域：300，000	否	您可以在一分鐘內透過 InvokeModel 為 Cohere Embed Multilingual 提供的字符數量上限。
Cohere Embed V4 的每分鐘隨需模型推論字符	每個支援的區域：150，000	否	您可以在一分鐘內針對 Cohere Embed V4 提交模型推論的隨需權杖數量上限。配額會考慮對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符的合併總和。
DeepSeek V3 V1 的每分鐘隨需模型推論字符	每個支援的區域：100，000，000	否	對於 DeepSeek V3 V1，您可以在一分鐘內提交模型推論的隨需字符數量上限。配額會考慮對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符的合併總和。
DeepSeek V3.2 的每分鐘隨需模型推論字符	每個支援的區域：100，000，000	否	對於 DeepSeek V3.2，您可以在一分鐘內提交模型推論的隨需字符數量上限。配額會考慮對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符的合併總和。
GPT OSS Safeguard 120B 的每分鐘隨需模型推論字符	每個支援的區域：100，000，000	否	對於 GPT OSS Safeguard 120B，您可以在一分鐘內提交模型推論的隨需權杖數量上限。配額會考慮對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符的合併總和。
GPT OSS Safeguard 20B 的每分鐘隨需模型推論字符	每個支援的區域：100，000，000	否	對於 GPT OSS Safeguard 20B，您可以在一分鐘內提交模型推論的隨需權杖數量上限。配額會考慮對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符的合併總和。
Gemma 3 12B 的每分鐘隨需模型推論字符	每個支援的區域：100，000，000	否	針對 Gemma 3 12B，您可以在一分鐘內提交模型推論的隨需字符數量上限。配額會考慮對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符的合併總和。
Gemma 3 27B 的每分鐘隨需模型推論字符	每個支援的區域：100，000，000	否	針對 Gemma 3 27B，您可以在一分鐘內提交模型推論的隨需字符數量上限。配額會考慮對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符的合併總和。
Gemma 3 4B 的每分鐘隨需模型推論字符	每個支援的區域：100，000，000	否	對於 Gemma 3 4B，您可以在一分鐘內提交模型推論的隨需字符數量上限。配額會考慮對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符的合併總和。
適用於 Kimi K2 Thinking 的每分鐘隨需模型推論字符	每個支援的區域：100，000，000	否	您可以在一分鐘內提交以進行模型推論的隨需權杖數量上限，以供 Kimi K2 Thinking 使用。配額會考慮對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符的合併總和。
Magistral Small 1.2 的每分鐘隨需模型推論字符	每個支援的區域：100，000，000	否	針對 Magistral Small 1.2，您可以在一分鐘內提交模型推論的隨需權杖數量上限。配額會考慮對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符的合併總和。
Meta Llama 3 70B Instruct 的每分鐘隨需模型推論字符	每個支援的區域：300，000	否	對於 Meta Llama 3 70B Instruct，您可以在一分鐘內提交模型推論的隨需字符數量上限。配額會考慮對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符的合併總和。
Meta Llama 3 8B Instruct 的每分鐘隨需模型推論字符	每個支援的區域：300，000	否	對於 Meta Llama 3 8B Instruct，您可以在一分鐘內提交模型推論的隨需字符數量上限。配額會考慮對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符的合併總和。
Meta Llama 3.1 405B Instruct 的每分鐘隨需模型推論字符	每個支援的區域：400，000	否	對於 Meta Llama 3.1 405B Instruct，您可以在一分鐘內提交模型推論的隨需字符數量上限。配額會考慮對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符的合併總和。
Meta Llama 3.1 70B Instruct 的每分鐘隨需模型推論字符	每個支援的區域：300，000	否	對於 Meta Llama 3.1 70B Instruct，您可以在一分鐘內提交模型推論的隨需字符數量上限。配額會考慮對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符的合併總和。
Meta Llama 3.1 8B Instruct 的每分鐘隨需模型推論字符	每個支援的區域：300，000	否	對於 Meta Llama 3.1 8B Instruct，您可以在一分鐘內提交模型推論的隨需字符數量上限。配額會考慮對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符的合併總和。
Meta Llama 3.2 11B Instruct 的每分鐘隨需模型推論字符	每個支援的區域：300，000	否	對於 Meta Llama 3.2 11B Instruct，您可以在一分鐘內提交模型推論的字符數量上限。配額會考慮 InvokeModel、InvokeModelWithResponseStream、Converse 和 ConverseStream 的字符總和。
Meta Llama 3.2 1B Instruct 的每分鐘隨需模型推論字符	每個支援的區域：300，000	否	對於 Meta Llama 3.2 1B Instruct，您可以在一分鐘內提交模型推論的隨需字符數量上限。配額會考慮對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符的合併總和。
Meta Llama 3.2 3B Instruct 的每分鐘隨需模型推論字符	每個支援的區域：300，000	否	對於 Meta Llama 3.2 3B Instruct，您可以在一分鐘內提交模型推論的字符數量上限。配額會考慮 InvokeModel、InvokeModelWithResponseStream、Converse 和 ConverseStream 的字符總和。
Meta Llama 3.2 90B Instruct 的每分鐘隨需模型推論字符	每個支援的區域：300，000	否	對於 Meta Llama 3.2 90B Instruct，您可以在一分鐘內提交模型推論的字符數量上限。配額會考慮 InvokeModel、InvokeModelWithResponseStream、Converse 和 ConverseStream 的字符總和。
Meta Llama 3.3 70B Instruct 的每分鐘隨需模型推論字符	每個支援的區域：300，000	否	對於 Meta Llama 3.3 70B Instruct，您可以在一分鐘內提交模型推論的隨需字符數量上限。配額會考慮對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符的合併總和。
MiniMax M2.5 的每分鐘隨需模型推論字符	每個支援的區域：100，000，000	否	對於 MiniMax M2.5，您可以在一分鐘內提交模型推論的隨需字符數量上限。配額會考慮對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符的合併總和。
Minimax M2 的每分鐘隨需模型推論字符	每個支援的區域：100，000，000	否	針對 Minimax M2，您可以在一分鐘內提交模型推論的隨需權杖數量上限。配額會考慮對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符的合併總和。
Minimax M2.1 的每分鐘隨需模型推論字符	每個支援的區域：100，000，000	否	針對 Minimax M2.1，您可以在一分鐘內提交模型推論的隨需權杖數量上限。配額會考慮對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符的合併總和。
Ministral 14B 3.0 的每分鐘隨需模型推論字符	每個支援的區域：100，000，000	否	針對 Ministral 14B 3.0，您可以在一分鐘內提交模型推論的隨需字符數量上限。配額會考慮對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符的合併總和。
Ministral 3B 3.0 的每分鐘隨需模型推論字符	每個支援的區域：100，000，000	否	針對 Ministral 3B 3.0，您可以在一分鐘內提交模型推論的隨需權杖數量上限。配額會考慮對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符的合併總和。
Ministral 8B 3.0 的每分鐘隨需模型推論字符	每個支援的區域：100，000，000	否	針對 Ministral 8B 3.0，您可以在一分鐘內提交模型推論的隨需字符數量上限。配額會考慮對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符的合併總和。
Mistral AI Mistral 7B Instruct 的每分鐘隨需模型推論字符	每個支援的區域：300，000	否	您可以在一分鐘內提交以進行模型推論的隨需權杖數量上限。配額會考慮對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream for Mistral AI Mistral 7B Instruct 的所有請求的輸入和輸出字符總和。
Mistral AI Mistral Large 的每分鐘隨需模型推論字符	每個支援的區域：300，000	否	您可以在一分鐘內提交以進行模型推論的隨需權杖數量上限。配額會考慮對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream for Mistral AI Mistral Large 的所有請求的輸入和輸出字符的合併總和。
Mistral AI Mistral Small 的每分鐘隨需模型推論字符	每個支援的區域：300，000	否	您可以在一分鐘內提交以進行模型推論的隨需權杖數量上限。配額會考慮對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream for Mistral AI Mistral Small 的所有請求的輸入和輸出字符總和。
Mistral AI Mixtral 8X7BB Instruct 的每分鐘隨需模型推論字符	每個支援的區域：300，000	否	您可以在一分鐘內提交以進行模型推論的隨需權杖數量上限。配額會考慮對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream for Mistral AI Mixtral 8X7B Instruct 的所有請求的輸入和輸出字符總和。
Mistral Devstral 2 123b 的每分鐘隨需模型推論字符	每個支援的區域：100，000，000	否	對於 Mistral Devstral 2 123b，您可以在一分鐘內提交模型推論的隨需字符數量上限。配額會考慮對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符的合併總和。
Mistral Large 2407 的每分鐘隨需模型推論字符	每個支援的區域：300，000	否	對於 Mistral Large 2407，您可以在一分鐘內提交模型推論的字符數量上限。配額會考慮 InvokeModel、InvokeModelWithResponseStream、Converse 和 ConverseStream 的字符總和
Mistral Large 3 的每分鐘隨需模型推論字符	每個支援的區域：100，000，000	否	對於 Mistral Large 3，您可以在一分鐘內提交模型推論的隨需權杖數量上限。配額會考慮對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符的合併總和。
Moonshot AI Kimi K2.5 的每分鐘隨需模型推論字符	每個支援的區域：100，000，000	否	對於 Moonshot AI Kimi K2.5，您可以在一分鐘內提交模型推論的隨需權杖數量上限。配額會考慮對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符的合併總和。
NVIDIA Nemotron 3 Super 120B A12B 的每分鐘隨需模型推論字符	每個支援的區域：100，000，000	否	針對 NVIDIA Nemotron 3 Super 120B A12B，您可以在一分鐘內提交模型推論的隨需權杖數量上限。配額會考慮對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符的合併總和。
NVIDIA Nemotron Nano 2 的每分鐘隨需模型推論字符	每個支援的區域：100，000，000	否	針對 NVIDIA Nemotron Nano 2，您可以在一分鐘內提交模型推論的隨需權杖數量上限。配額會考慮對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符的合併總和。
NVIDIA Nemotron Nano 2 VL 的每分鐘隨需模型推論字符	每個支援的區域：100，000，000	否	針對 NVIDIA Nemotron Nano 2 VL，您可以在一分鐘內提交模型推論的隨需權杖數量上限。配額會考慮對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符的合併總和。
Nemotron Nano 3 30B 的每分鐘隨需模型推論字符	每個支援的區域：100，000，000	否	對於 Nemotron Nano 3 30B，您可以在一分鐘內提交模型推論的隨需字符數量上限。配額會考慮對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符的合併總和。
OpenAI GPT OSS 120B 的每分鐘隨需模型推論字符	每個支援的區域：100，000，000	否	對於 OpenAI GPT OSS 120B，您可以在一分鐘內提交模型推論的隨需字符數量上限。配額會考慮對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符的合併總和。
OpenAI GPT OSS 20B 的每分鐘隨需模型推論字符	每個支援的區域：100，000，000	否	針對 OpenAI GPT OSS 20B，您可以在一分鐘內提交模型推論的隨需字符數量上限。配額會考慮對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符的合併總和。
Qwen3 235B a22b 2507 V1 的每分鐘隨需模型推論字符	每個支援的區域：100，000，000	否	對於 Qwen3 235B a22b 2507 V1，您可以在一分鐘內提交模型推論的隨需字符數量上限。配額會考慮對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符的合併總和。
Qwen3 32B V1 的每分鐘隨需模型推論字符	每個支援的區域：100，000，000	否	對於 Qwen3 32B V1，您可以在一分鐘內提交模型推論的隨需字符數量上限。配額會考慮對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符的合併總和。
Qwen3 Coder 30B a3b V1 的每分鐘隨需模型推論字符	每個支援的區域：100，000，000	否	對於 Qwen3 Coder 30B a3b V1，您可以在一分鐘內提交模型推論的隨需字符數量上限。配額會考慮對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符的合併總和。
Qwen3 Coder 480B a35b V1 的每分鐘隨需模型推論字符	每個支援的區域：100，000，000	否	對於 Qwen3 Coder 480B a35b V1，您可以在一分鐘內提交模型推論的隨需字符數量上限。配額會考慮對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符的合併總和。
Qwen3 Coder Next 的每分鐘隨需模型推論字符	每個支援的區域：100，000，000	否	對於 Qwen3 Coder Next，您可以在一分鐘內提交模型推論的隨需字符數量上限。配額會考慮對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符的合併總和。
Qwen3 Next 80B A3B 的每分鐘隨需模型推論字符	每個支援的區域：100，000，000	否	對於 Qwen3 Next 80B A3B，您可以在一分鐘內提交模型推論的隨需字符數量上限。配額會考慮對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符的合併總和。
Qwen3 VL 235B A22B 的每分鐘隨需模型推論字符	每個支援的區域：100，000，000	否	對於 Qwen3 VL 235B A22B，您可以在一分鐘內提交模型推論的隨需字符數量上限。配額會考慮對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符的合併總和。
Voxtral Mini 1.0 的每分鐘隨需模型推論字符	每個支援的區域：100，000，000	否	對於 Voxtral Mini 1.0，您可以在一分鐘內提交模型推論的隨需權杖數量上限。配額會考慮對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符的合併總和。
Voxtral Small 1.0 的每分鐘隨需模型推論字符	每個支援的區域：100，000，000	否	對於 Voxtral Small 1.0，您可以在一分鐘內提交模型推論的隨需權杖數量上限。配額會考慮對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符的合併總和。
Writer Palmyra Vision 7B 的每分鐘隨需模型推論字符	每個支援的區域：100，000，000	否	對於 Writer Palmyra Vision 7B，您可以在一分鐘內提交模型推論的隨需字符數量上限。配額會考慮對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符的合併總和。
Z.ai GLM 5 的每分鐘隨需模型推論字符	每個支援的區域：100，000，000	否	對於 Z.ai GLM 5，您可以在一分鐘內提交模型推論的隨需字符數量上限。配額會考慮對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符的合併總和。
Z.ai GLM-4.7 的每分鐘隨需模型推論字符	每個支援的區域：100，000，000	否	對於 Z.ai GLM-4.7，您可以在一分鐘內提交模型推論的隨需字符數量上限。配額會考慮對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符的合併總和。
Z.ai GLM-4.7 Flash 的每分鐘隨需模型推論字符	每個支援的區域：100，000，000	否	對於 Z.ai GLM-4.7 Flash，您可以在一分鐘內提交模型推論的隨需字符數量上限。配額會考慮對 Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream 的所有請求的輸入和輸出字符的合併總和。
每個函數的參數	每個受支援的區域：5	是	您可以在動作群組函數中擁有的參數數目上限。
每秒的 PrepareAgent 請求數	每個受支援的區域：2	否	每秒的 PrepareAgent API 請求數目上限。
Amazon Nova 2 多模態內嵌 V1 每個批次推論任務的記錄	每個受支援的區域：100,000	是	Amazon Nova 2 多模式內嵌 V1 批次推論任務中所有輸入檔案的記錄數目上限。
Amazon Nova Premier 每個批次推論任務的記錄	每個受支援的區域：100,000	是	Amazon Nova Premier 批次推論任務中所有輸入檔案的記錄數目上限。
Claude 3 Haiku 每個批次推論任務的記錄	每個受支援的區域：100,000	是	Claude 3 Haiku 批次推論任務中所有輸入檔案的記錄數目上限。
Claude 3 Opus 每個批次推論任務的記錄	每個受支援的區域：100,000	是	Claude 3 Opus 批次推論任務中所有輸入檔案的記錄數目上限。
Claude 3 Sonnet 每個批次推論任務的記錄	每個受支援的區域：100,000	是	Claude 3 Sonnet 批次推論任務中所有輸入檔案的記錄數目上限。
Claude 3.5 Haiku 每個批次推論任務的記錄	每個受支援的區域：100,000	是	Claude 3.5 Haiku 批次推論任務中所有輸入檔案的記錄數目上限。
Claude 3.5 Sonnet 每個批次推論任務的記錄	每個受支援的區域：100,000	是	Claude 3.5 Sonnet 批次推論任務中所有輸入檔案的記錄數目上限。
Claude 3.5 Sonnet v2 每個批次推論任務的記錄	每個受支援的區域：100,000	是	Claude 3.5 Sonnet v2 批次推論任務中所有輸入檔案的記錄數目上限。
Claude 3.7 Sonnet 每個批次推論任務的記錄	每個受支援的區域：100,000	是	Claude 3.7 Sonnet 批次推論任務中所有輸入檔案的記錄數目上限。
Claude Haiku 4.5 每個批次推論任務的記錄	每個受支援的區域：100,000	是	Claude Haiku 4.5 批次推論任務中所有輸入檔案的記錄數目上限。
Claude Opus 4.5 每個批次推論任務的記錄	每個受支援的區域：100,000	是	Claude Opus 4.5 批次推論任務中所有輸入檔案的記錄數目上限。
Claude Opus 4.6 每個批次推論任務的記錄	每個受支援的區域：100,000	是	Claude Opus 4.6 批次推論任務中所有輸入檔案的記錄數目上限。
Claude Sonnet 4 每個批次推論任務的記錄	每個受支援的區域：100,000	是	Claude Sonnet 4 批次推論任務中所有輸入檔案的記錄數目上限。
Claude Sonnet 4.5 每個批次推論任務的記錄	每個受支援的區域：100,000	是	Claude Sonnet 4.5 批次推論任務中所有輸入檔案的記錄數目上限。
Claude Sonnet 4.6 每個批次推論任務的記錄	每個受支援的區域：100,000	是	Claude Sonnet 4.6 批次推論任務中所有輸入檔案的記錄數目上限。
DeepSeek V3.2 每個批次推論任務的記錄	每個受支援的區域：100,000	是	DeepSeek V3.2 批次推論任務中所有輸入檔案的記錄數目上限。
DeepSeek v3 每個批次推論任務的記錄	每個受支援的區域：100,000	是	DeepSeek v3 批次推論任務中所有輸入檔案的記錄數目上限。
Devstral 2 123B 每個批次推論任務的記錄	每個受支援的區域：100,000	是	Devstral 2 123B 批次推論任務中所有輸入檔案的記錄數目上限。
GLM 4.7 每個批次推論任務的記錄	每個受支援的區域：100,000	是	GLM 4.7 批次推論任務中所有輸入檔案的記錄數量上限。
GLM 4.7 Flash 每個批次推論任務的記錄	每個受支援的區域：100,000	是	GLM 4.7 Flash 批次推論任務中所有輸入檔案的記錄數目上限。
GLM 5 每個批次推論任務的記錄	每個受支援的區域：100,000	是	GLM 5 批次推論任務中所有輸入檔案的記錄數目上限。
Gemma 3 12B 每個批次推論任務的記錄	每個受支援的區域：100,000	是	Gemma 3 12B 批次推論任務中所有輸入檔案的記錄數目上限。
Gemma 3 27B 每個批次推論任務的記錄	每個受支援的區域：100,000	是	Gemma 3 27B 批次推論任務中所有輸入檔案的記錄數目上限。
Gemma 3 4B 每個批次推論任務的記錄	每個受支援的區域：100,000	是	Gemma 3 4B 批次推論任務中所有輸入檔案的記錄數目上限。
適用於 Kimi K2 Thinking 的每個批次推論任務的記錄	每個受支援的區域：100,000	是	批次推論任務中，Kimi K2 Thinking 所有輸入檔案的記錄數目上限。
Kimi K2.5 每個批次推論任務的記錄	每個受支援的區域：100,000	是	批次推論任務中，Kimi K2.5 所有輸入檔案的記錄數目上限。
Llama 3.1 405B Instruct 每個批次推論任務的記錄	每個受支援的區域：100,000	是	Llama 3.1 405B Instruct 批次推論任務中所有輸入檔案的記錄數目上限。
Llama 3.1 70B Instruct 每個批次推論任務的記錄	每個受支援的區域：100,000	是	Llama 3.1 70B Instruct 批次推論任務中所有輸入檔案的記錄數目上限。
Llama 3.1 8B Instruct 每個批次推論任務的記錄	每個受支援的區域：100,000	是	Llama 3.1 8B Instruct 批次推論任務中所有輸入檔案的記錄數目上限。
Llama 3.2 11B Instruct 每個批次推論任務的記錄	每個受支援的區域：100,000	是	Llama 3.2 11B Instruct 批次推論任務中所有輸入檔案的記錄數目上限。
Llama 3.2 1B Instruct 每個批次推論任務的記錄	每個受支援的區域：100,000	是	批次推論任務 Llama 3.2 1B Instruct 中所有輸入檔案的記錄數目上限。
Llama 3.2 3B Instruct 每個批次推論任務的記錄	每個受支援的區域：100,000	是	Llama 3.2 3B Instruct 批次推論任務中所有輸入檔案的記錄數目上限。
Llama 3.2 90B Instruct 每個批次推論任務的記錄	每個受支援的區域：100,000	是	Llama 3.2 90B Instruct 批次推論任務中所有輸入檔案的記錄數目上限。
Llama 3.3 70B Instruct 每個批次推論任務的記錄	每個受支援的區域：100,000	是	Llama 3.3 70B Instruct 批次推論任務中所有輸入檔案的記錄數目上限。
Llama 4 Maverick 每個批次推論任務的記錄	每個受支援的區域：100,000	是	Llama 4 Maverick 批次推論任務中所有輸入檔案的記錄數目上限。
Llama 4 Scout 每個批次推論任務的記錄	每個受支援的區域：100,000	是	Llama 4 Scout 批次推論任務中所有輸入檔案的記錄數目上限。
Magistral Small 2509 每個批次推論任務的記錄	每個受支援的區域：100,000	是	Magistral Small 2509 批次推論任務中所有輸入檔案的記錄數目上限。
MiniMax M2 每個批次推論任務的記錄	每個受支援的區域：100,000	是	MiniMax M2 批次推論任務中所有輸入檔案的記錄數目上限。
MiniMax M2.1 每個批次推論任務的記錄	每個受支援的區域：100,000	是	MiniMax M2.1 批次推論任務中所有輸入檔案的記錄數目上限。
MiniMax M2.5 每個批次推論任務的記錄	每個受支援的區域：100,000	是	MiniMax M2.5 批次推論任務中所有輸入檔案的記錄數目上限。
Ministral 3 14B 每個批次推論任務的記錄	每個受支援的區域：100,000	是	Ministral 3 14B 批次推論任務中所有輸入檔案的記錄數目上限。
Ministral 3 8B 每個批次推論任務的記錄	每個受支援的區域：100,000	是	Ministral 3 8B 批次推論任務中所有輸入檔案的記錄數目上限。
Ministral 3B 每個批次推論任務的記錄	每個受支援的區域：100,000	是	Ministral 3B 批次推論任務中所有輸入檔案的記錄數目上限。
Mistral Large 2 (24.07) 每個批次推論任務的記錄	每個受支援的區域：100,000	是	Mistral Large 2 (24.07) 批次推論任務中所有輸入檔案的記錄數目上限。
Mistral Large 3 每個批次推論任務的記錄	每個受支援的區域：100,000	是	Mistral Large 3 批次推論任務中所有輸入檔案的記錄數目上限。
Mistral Small 每個批次推論任務的記錄	每個受支援的區域：100,000	是	Mistral Small 批次推論任務中所有輸入檔案的記錄數目上限。
NVIDIA Nemotron 3 Super 120B A12B 每個批次推論任務的記錄	每個受支援的區域：100,000	是	NVIDIA Nemotron 3 Super 120B A12B 批次推論任務中所有輸入檔案的記錄數量上限。
NVIDIA Nemotron Nano 12B 每個批次推論任務的記錄	每個受支援的區域：100,000	是	NVIDIA Nemotron Nano 12B 批次推論任務中所有輸入檔案的記錄數量上限。
NVIDIA Nemotron Nano 3 30B 每個批次推論任務的記錄	每個受支援的區域：100,000	是	NVIDIA Nemotron Nano 3 30B 批次推論任務中所有輸入檔案的記錄數目上限。
NVIDIA Nemotron Nano 9B 每個批次推論任務的記錄	每個受支援的區域：100,000	是	NVIDIA Nemotron Nano 9B 批次推論任務中所有輸入檔案的記錄數量上限。
Nova 2 Lite 每個批次推論任務的記錄	每個受支援的區域：100,000	是	Nova 2 Lite 批次推論任務中所有輸入檔案的記錄數目上限。
Nova Lite V1 每個批次推論任務的記錄	每個受支援的區域：100,000	是	Nova Lite V1 批次推論任務中所有輸入檔案的記錄數目上限。
Nova Micro V1 每個批次推論任務的記錄	每個受支援的區域：100,000	是	Nova Micro V1 批次推論任務中所有輸入檔案的記錄數目上限。
Nova Pro V1 每個批次推論任務的記錄	每個受支援的區域：100,000	是	Nova Pro V1 批次推論任務中所有輸入檔案的記錄數目上限。
OpenAI GPT OSS 120b 每個批次推論任務的記錄	每個受支援的區域：100,000	是	OpenAI GPT OSS 120b 批次推論任務中所有輸入檔案的記錄數目上限。
OpenAI GPT OSS 20b 每個批次推論任務的記錄	每個受支援的區域：100,000	是	OpenAI GPT OSS 20b 批次推論任務中所有輸入檔案的記錄數目上限。
OpenAI GPT OSS Safeguard 120b 每個批次推論任務的記錄	每個受支援的區域：100,000	是	OpenAI GPT OSS Safeguard 120b 批次推論任務中所有輸入檔案的記錄數目上限。
OpenAI GPT OSS Safeguard 20b 每個批次推論任務的記錄	每個受支援的區域：100,000	是	OpenAI GPT OSS Safeguard 20b 批次推論任務中所有輸入檔案的記錄數目上限。
Qwen3 235B 每個批次推論任務的記錄	每個受支援的區域：100,000	是	Qwen3 235B 批次推論任務中所有輸入檔案的記錄數量上限。
Qwen3 32B 每個批次推論任務的記錄	每個受支援的區域：100,000	是	Qwen3 32B 批次推論任務中所有輸入檔案的記錄數目上限。
Qwen3 Coder 30B 每個批次推論任務的記錄	每個受支援的區域：100,000	是	Qwen3 Coder 30B 批次推論任務中所有輸入檔案的記錄數目上限。
Qwen3 Coder 480B 每個批次推論任務的記錄	每個受支援的區域：100,000	是	Qwen3 Coder 480B 批次推論任務中所有輸入檔案的記錄數目上限。
Qwen3 Coder Next 每個批次推論任務的記錄	每個受支援的區域：100,000	是	Qwen3 Coder Next 批次推論任務中所有輸入檔案的記錄數目上限。
Qwen3 Next 80B 每個批次推論任務的記錄	每個受支援的區域：100,000	是	Qwen3 Next 80B 批次推論任務中所有輸入檔案的記錄數目上限。
Qwen3 VL 235B 每個批次推論任務的記錄	每個受支援的區域：100,000	是	Qwen3 VL 235B 批次推論任務中所有輸入檔案的記錄數目上限。
Titan Multimodal Embeddings G1 的每個批次推論任務的記錄	每個受支援的區域：100,000	是	Titan Multimodal Embeddings G1 批次推論任務中所有輸入檔案的記錄數目上限。
Titan Text Embeddings V2 的每個批次推論任務的記錄	每個受支援的區域：100,000	是	Titan Text Embeddings V2 批次推論任務中所有輸入檔案的記錄數目上限。
Voxtral Mini 3B 2507 每個批次推論任務的記錄	每個受支援的區域：100,000	是	Voxtral Mini 3B 2507 批次推論任務中所有輸入檔案的記錄數目上限。
Voxtral Small 24B 2507 每個批次推論任務的記錄	每個受支援的區域：100,000	是	Voxtral Small 24B 2507 批次推論任務中所有輸入檔案的記錄數目上限。
Writer Palmyra Vision 7B 每個批次推論任務的記錄	每個受支援的區域：100,000	是	Writer Palmyra Vision 7B 批次推論任務中所有輸入檔案的記錄數目上限。
Amazon Nova 2 多模態內嵌 V1 每個批次推論任務的每個輸入檔案記錄	每個受支援的區域：100,000	是	Amazon Nova 2 多模態內嵌 V1 批次推論任務中輸入檔案中的記錄數目上限。
Amazon Nova Premier 每個批次推論任務的每個輸入檔案記錄	每個受支援的區域：100,000	是	Amazon Nova Premier 批次推論任務中輸入檔案中的記錄數目上限。
Claude 3 Haiku 每個批次推論任務的每個輸入檔案記錄	每個受支援的區域：100,000	是	批次推論任務中 Claude 3 Haiku 輸入檔案中的記錄數目上限。
Claude 3 Opus 每個批次推論任務的每個輸入檔案記錄	每個受支援的區域：100,000	是	批次推論任務中 Claude 3 Opus 輸入檔案中的記錄數目上限。
Claude 3 Sonnet 每個批次推論任務的每個輸入檔案記錄	每個受支援的區域：100,000	是	Claude 3 Sonnet 批次推論任務中輸入檔案中的記錄數目上限。
Claude 3.5 Haiku 每個批次推論任務的每個輸入檔案記錄	每個受支援的區域：100,000	是	Claude 3.5 Haiku 批次推論任務中輸入檔案中的記錄數目上限。
Claude 3.5 Sonnet 每個批次推論任務的每個輸入檔案記錄	每個受支援的區域：100,000	是	Claude 3.5 Sonnet 批次推論任務中輸入檔案中的記錄數目上限。
Claude 3.5 Sonnet v2 每個批次推論任務的每個輸入檔案記錄	每個受支援的區域：100,000	是	Claude 3.5 Sonnet v2 批次推論任務中輸入檔案中的記錄數目上限。
Claude 3.7 Sonnet 每個批次推論任務的每個輸入檔案記錄	每個受支援的區域：100,000	是	Claude 3.7 Sonnet 批次推論任務中輸入檔案中的記錄數目上限。
Claude Haiku 4.5 每個批次推論任務的每個輸入檔案記錄	每個受支援的區域：100,000	是	Claude Haiku 4.5 批次推論任務中輸入檔案中的記錄數目上限。
Claude Opus 4.5 每個批次推論任務的每個輸入檔案記錄	每個受支援的區域：100,000	是	Claude Opus 4.5 批次推論任務中輸入檔案中的記錄數目上限。
Claude Opus 4.6 每個批次推論任務的每個輸入檔案記錄	每個受支援的區域：100,000	是	Claude Opus 4.6 批次推論任務中輸入檔案中的記錄數目上限。
Claude Sonnet 4 每個批次推論任務的每個輸入檔案記錄	每個受支援的區域：100,000	是	Claude Sonnet 4 批次推論任務中輸入檔案中的記錄數目上限。
Claude Sonnet 4.5 每個批次推論任務的每個輸入檔案記錄	每個受支援的區域：100,000	是	Claude Sonnet 4.5 批次推論任務中輸入檔案中的記錄數目上限。
Claude Sonnet 4.6 每個批次推論任務的每個輸入檔案記錄	每個受支援的區域：100,000	是	Claude Sonnet 4.6 批次推論任務中輸入檔案中的記錄數目上限。
DeepSeek V3.2 每個批次推論任務的每個輸入檔案記錄	每個受支援的區域：100,000	是	DeepSeek V3.2 批次推論任務中輸入檔案中的記錄數目上限。
DeepSeek v3 每個批次推論任務的每個輸入檔案記錄	每個受支援的區域：100,000	是	DeepSeek v3 批次推論任務中輸入檔案中的記錄數目上限。
Devstral 2 123B 每個批次推論任務的每個輸入檔案記錄	每個受支援的區域：100,000	是	Devstral 2 123B 批次推論任務中輸入檔案中的記錄數目上限。
GLM 4.7 每個批次推論任務的每個輸入檔案記錄	每個受支援的區域：100,000	是	GLM 4.7 批次推論任務中輸入檔案中的記錄數目上限。
GLM 4.7 Flash 每個批次推論任務的每個輸入檔案記錄	每個受支援的區域：100,000	是	GLM 4.7 Flash 批次推論任務中輸入檔案中的記錄數目上限。
GLM 5 的每個批次推論任務每個輸入檔案的記錄	每個受支援的區域：100,000	是	GLM 5 批次推論任務中輸入檔案中的記錄數目上限。
Gemma 3 12B 每個批次推論任務的每個輸入檔案記錄	每個受支援的區域：100,000	是	Gemma 3 12B 批次推論任務中輸入檔案中的記錄數目上限。
Gemma 3 27B 每個批次推論任務的每個輸入檔案記錄	每個受支援的區域：100,000	是	Gemma 3 27B 批次推論任務中輸入檔案中的記錄數目上限。
Gemma 3 4B 每個批次推論任務的每個輸入檔案記錄	每個受支援的區域：100,000	是	Gemma 3 4B 批次推論任務中輸入檔案中的記錄數目上限。
Kimi K2 Thinking 每個批次推論任務的每個輸入檔案記錄	每個受支援的區域：100,000	是	批次推論任務中，Kimi K2 Thinking 輸入檔案中的記錄數目上限。
Kimi K2.5 每個批次推論任務的每個輸入檔案記錄	每個受支援的區域：100,000	是	批次推論任務中，Kimi K2.5 輸入檔案中的記錄數目上限。
Llama 3.1 405B Instruct 的每個批次推論任務每個輸入檔案的記錄	每個受支援的區域：100,000	是	Llama 3.1 405B Instruct 批次推論任務中輸入檔案中的記錄數目上限。
Llama 3.1 70B Instruct 每個批次推論任務的每個輸入檔案記錄	每個受支援的區域：100,000	是	Llama 3.1 70B Instruct 批次推論任務中輸入檔案中的記錄數目上限。
Llama 3.1 8B Instruct 每個批次推論任務的每個輸入檔案記錄	每個受支援的區域：100,000	是	Llama 3.1 8B Instruct 批次推論任務中輸入檔案中的記錄數目上限。
Llama 3.2 11B Instruct 每個批次推論任務的每個輸入檔案記錄	每個受支援的區域：100,000	是	Llama 3.2 11B Instruct 批次推論任務中輸入檔案中的記錄數目上限。
Llama 3.2 1B Instruct 每個批次推論任務的每個輸入檔案記錄	每個受支援的區域：100,000	是	批次推論任務 Llama 3.2 1B Instruct 中輸入檔案中的記錄數目上限。
Llama 3.2 3B Instruct 的每個批次推論任務每個輸入檔案的記錄	每個受支援的區域：100,000	是	Llama 3.2 3B Instruct 批次推論任務中輸入檔案中的記錄數目上限。
Llama 3.2 90B Instruct 每個批次推論任務的每個輸入檔案記錄	每個受支援的區域：100,000	是	Llama 3.2 90B Instruct 批次推論任務中輸入檔案中的記錄數目上限。
Llama 3.3 70B Instruct 每個批次推論任務的每個輸入檔案記錄	每個受支援的區域：100,000	是	Llama 3.3 70B Instruct 批次推論任務中輸入檔案中的記錄數目上限。
Llama 4 Maverick 每個批次推論任務的每個輸入檔案記錄	每個受支援的區域：100,000	是	Llama 4 Maverick 批次推論任務中輸入檔案中的記錄數目上限。
Llama 4 Scout 每個批次推論任務每個輸入檔案的記錄	每個受支援的區域：100,000	是	Llama 4 Scout 批次推論任務中輸入檔案中的記錄數目上限。
Magistral Small 2509 每個批次推論任務的每個輸入檔案記錄	每個受支援的區域：100,000	是	Magistral Small 2509 批次推論任務中輸入檔案中的記錄數目上限。
MiniMax M2 的每個批次推論任務每個輸入檔案的記錄	每個受支援的區域：100,000	是	MiniMax M2 批次推論任務中輸入檔案中的記錄數目上限。
MiniMax M2.1 每個批次推論任務的每個輸入檔案記錄	每個受支援的區域：100,000	是	MiniMax M2.1 批次推論任務中輸入檔案中的記錄數目上限。
MiniMax M2.5 每個批次推論任務的每個輸入檔案記錄	每個受支援的區域：100,000	是	MiniMax M2.5 批次推論任務中輸入檔案中的記錄數目上限。
Ministral 3 14B 每個批次推論任務的每個輸入檔案記錄	每個受支援的區域：100,000	是	Ministral 3 14B 批次推論任務中輸入檔案中的記錄數目上限。
Ministral 3 8B 每個批次推論任務的每個輸入檔案記錄	每個受支援的區域：100,000	是	Ministral 3 8B 批次推論任務中輸入檔案中的記錄數目上限。
Ministral 3B 的每個批次推論任務每個輸入檔案的記錄	每個受支援的區域：100,000	是	Ministral 3B 批次推論任務中輸入檔案中的記錄數目上限。
Mistral Large 2 (24.07) 每個批次推論任務的每個輸入檔案記錄	每個受支援的區域：100,000	是	Mistral Large 2 (24.07) 批次推論任務中輸入檔案中的記錄數目上限。
Mistral Large 3 的每個批次推論任務每個輸入檔案的記錄	每個受支援的區域：100,000	是	Mistral Large 3 批次推論任務中輸入檔案中的記錄數目上限。
Mistral Small 每個批次推論任務的每個輸入檔案記錄	每個受支援的區域：100,000	是	Mistral Small 批次推論任務中輸入檔案中的記錄數目上限。
NVIDIA Nemotron 3 Super 120B A12B 每個批次推論任務的每個輸入檔案記錄	每個受支援的區域：100,000	是	NVIDIA Nemotron 3 Super 120B A12B 批次推論任務中輸入檔案中的記錄數目上限。
NVIDIA Nemotron Nano 12B 每個批次推論任務的每個輸入檔案記錄	每個受支援的區域：100,000	是	NVIDIA Nemotron Nano 12B 批次推論任務中輸入檔案中的記錄數目上限。
NVIDIA Nemotron Nano 3 30B 每個批次推論任務的每個輸入檔案記錄	每個受支援的區域：100,000	是	NVIDIA Nemotron Nano 3 30B 批次推論任務中輸入檔案中的記錄數目上限。
NVIDIA Nemotron Nano 9B 每個批次推論任務的每個輸入檔案記錄	每個受支援的區域：100,000	是	NVIDIA Nemotron Nano 9B 批次推論任務中輸入檔案中的記錄數目上限。
Nova 2 Lite 每個批次推論任務的每個輸入檔案記錄	每個受支援的區域：100,000	是	Nova 2 Lite 批次推論任務中輸入檔案中的記錄數目上限。
Nova Lite V1 每個批次推論任務的每個輸入檔案記錄	每個受支援的區域：100,000	是	Nova Lite V1 批次推論任務中輸入檔案中的記錄數目上限。
Nova Micro V1 每個批次推論任務的每個輸入檔案記錄	每個受支援的區域：100,000	是	Nova Micro V1 批次推論任務中輸入檔案中的記錄數目上限。
Nova Pro V1 每個批次推論任務的每個輸入檔案記錄	每個受支援的區域：100,000	是	Nova Pro V1 批次推論任務中輸入檔案中的記錄數目上限。
OpenAI GPT OSS 120b 每個批次推論任務的每個輸入檔案記錄	每個受支援的區域：100,000	是	OpenAI GPT OSS 120b 批次推論任務中輸入檔案中的記錄數目上限。
OpenAI GPT OSS 20b 每個批次推論任務的每個輸入檔案記錄	每個受支援的區域：100,000	是	OpenAI GPT OSS 20b 批次推論任務中輸入檔案中的記錄數目上限。
OpenAI GPT OSS Safeguard 120b 每個批次推論任務的每個輸入檔案記錄	每個受支援的區域：100,000	是	OpenAI GPT OSS Safeguard 120b 批次推論任務中輸入檔案中的記錄數目上限。
OpenAI GPT OSS Safeguard 20b 每個批次推論任務的每個輸入檔案記錄	每個受支援的區域：100,000	是	OpenAI GPT OSS Safeguard 20b 批次推論任務中輸入檔案中的記錄數目上限。
Qwen3 235B 每個批次推論任務的每個輸入檔案記錄	每個受支援的區域：100,000	是	Qwen3 235B 批次推論任務中輸入檔案中的記錄數目上限。
Qwen3 32B 每個批次推論任務的每個輸入檔案記錄	每個受支援的區域：100,000	是	Qwen3 32B 批次推論任務中輸入檔案中的記錄數目上限。
Qwen3 Coder 30B 每個批次推論任務的每個輸入檔案記錄	每個受支援的區域：100,000	是	Qwen3 Coder 30B 批次推論任務中輸入檔案中的記錄數目上限。
Qwen3 Coder 480B 每個批次推論任務的每個輸入檔案記錄	每個受支援的區域：100,000	是	Qwen3 Coder 480B 批次推論任務中輸入檔案中的記錄數目上限。
Qwen3 Coder Next 每個批次推論任務的每個輸入檔案記錄	每個受支援的區域：100,000	是	Qwen3 Coder Next 批次推論任務中輸入檔案中的記錄數目上限。
Qwen3 Next 80B 每個批次推論任務的每個輸入檔案記錄	每個受支援的區域：100,000	是	Qwen3 Next 80B 批次推論任務中輸入檔案中的記錄數目上限。
Qwen3 VL 235B 每個批次推論任務的每個輸入檔案記錄	每個受支援的區域：100,000	是	Qwen3 VL 235B 批次推論任務中輸入檔案中的記錄數目上限。
Titan Multimodal Embeddings G1 的每個批次推論任務每個輸入檔案的記錄	每個受支援的區域：100,000	是	Titan Multimodal Embeddings G1 批次推論任務中輸入檔案中的記錄數目上限。
Titan Text Embeddings V2 的每個批次推論任務每個輸入檔案的記錄	每個受支援的區域：100,000	是	Titan Text Embeddings V2 批次推論任務中輸入檔案中的記錄數目上限。
Voxtral Mini 3B 2507 每個批次推論任務的每個輸入檔案記錄	每個受支援的區域：100,000	是	Voxtral Mini 3B 2507 批次推論任務中輸入檔案中的記錄數目上限。
Voxtral Small 24B 2507 每個批次推論任務的每個輸入檔案記錄	每個受支援的區域：100,000	是	Voxtral Small 24B 2507 批次推論任務中輸入檔案中的記錄數目上限。
Writer Palmyra Vision 7B 每個批次推論任務的每個輸入檔案記錄	每個受支援的區域：100,000	是	Writer Palmyra Vision 7B 批次推論任務中輸入檔案中的記錄數目上限。
使用 Amazon Nova 2 多模式內嵌 V1 基礎模型的進行中和提交的批次推論任務總和	每個受支援的區域：100	是	使用 Amazon Nova 2 Multimodal Embeddings V1 基本模型的進行中和提交的批次推論任務數量上限。
使用 Amazon Nova Premier 基本模型的進行中和提交的批次推論任務總和	每個受支援的區域：100	是	使用 Amazon Nova Premier 基本模型的進行中和提交的批次推論任務數量上限。
使用 Claude 3 Haiku 基礎模型的進行中和提交的批次推論任務總和	每個受支援的區域：100	是	使用 Claude 3 Haiku 基礎模型的進行中和提交的批次推論任務數量上限。
使用 Claude 3 Opus 基礎模型進行中的和提交的批次推論任務總和	每個受支援的區域：100	是	使用 Claude 3 Opus 基礎模型的進行中和提交的批次推論任務數量上限。
使用 Claude 3 Sonnet 基礎模型進行中的和提交的批次推論任務總和	每個受支援的區域：100	是	使用 Claude 3 Sonnet 基礎模型的進行中和提交的批次推論任務數量上限。
使用 Claude 3.5 Haiku 基礎模型的進行中和提交的批次推論任務總和	每個受支援的區域：100	是	使用 Claude 3.5 Haiku 基礎模型的進行中和提交的批次推論任務數量上限。
使用 Claude 3.5 Sonnet 基本模型的進行中和提交的批次推論任務總和	每個受支援的區域：100	是	使用 Claude 3.5 Sonnet 基礎模型的進行中和提交的批次推論任務數量上限。
使用 Claude 3.5 Sonnet v2 基礎模型的進行中和提交的批次推論任務總和	每個受支援的區域：100	是	使用 Claude 3.5 Sonnet v2 基礎模型的進行中和提交的批次推論任務數量上限。
使用 Claude 3.7 Sonnet 基礎模型的進行中和提交的批次推論任務總和	每個受支援的區域：100	是	使用 Claude 3.7 Sonnet 基礎模型的進行中和提交的批次推論任務數量上限。
使用 Claude Haiku 4.5 基礎模型的進行中和提交的批次推論任務總和	每個受支援的區域：100	是	使用 Claude Haiku 4.5 基礎模型的進行中和提交的批次推論任務數量上限。
使用 Claude Opus 4.5 基礎模型進行中的和提交的批次推論任務總和	每個受支援的區域：100	是	使用 Claude Opus 4.5 基礎模型的進行中和提交的批次推論任務數量上限。
使用 Claude Opus 4.6 基礎模型的進行中和提交的批次推論任務總和	每個受支援的區域：100	是	使用 Claude Opus 4.6 基礎模型的進行中和提交的批次推論任務數量上限。
使用 Claude Sonnet 4 基礎模型的進行中和提交的批次推論任務總和	每個受支援的區域：100	是	使用 Claude Sonnet 4 基礎模型的進行中和提交的批次推論任務數量上限。
使用 Claude Sonnet 4.5 基礎模型的進行中和提交的批次推論任務總和。	每個受支援的區域：100	是	使用 Claude Sonnet 4.5 基礎模型的進行中和提交的批次推論任務數量上限。
使用 Claude Sonnet 4.6 基礎模型的進行中和提交的批次推論任務總和	每個受支援的區域：100	是	使用 Claude Sonnet 4.6 基礎模型的進行中和提交的批次推論任務數量上限。
使用 DeepSeek V3.2 基礎模型的進行中和提交的批次推論任務總和	每個受支援的區域：100	是	使用 DeepSeek V3.2 基礎模型的進行中和提交的批次推論任務數量上限。
使用 DeepSeek v3 基礎模型的進行中和提交的批次推論任務總和	每個受支援的區域：100	是	使用 DeepSeek v3 基礎模型的進行中和提交的批次推論任務數量上限。
使用 Devstral 2 123B 基礎模型的進行中和提交的批次推論任務總和	每個受支援的區域：100	是	使用 Devstral 2 123B 基礎模型的進行中和提交的批次推論任務數量上限。
使用 GLM 4.7 基礎模型的進行中和提交的批次推論任務總和	每個受支援的區域：100	是	使用 GLM 4.7 基礎模型的進行中和提交的批次推論任務數量上限。
使用 GLM 4.7 Flash 基礎模型的進行中和提交的批次推論任務總和	每個受支援的區域：100	是	使用 GLM 4.7 Flash 基礎模型的進行中和提交的批次推論任務數量上限。
使用 GLM 5 基礎模型進行中的和提交的批次推論任務總和	每個受支援的區域：100	是	使用 GLM 5 基礎模型的進行中和提交的批次推論任務數量上限。
使用 Gemma 3 12B 基礎模型進行中的和提交的批次推論任務總和	每個受支援的區域：100	是	使用 Gemma 3 12B 基礎模型的進行中和提交的批次推論任務數量上限。
使用 Gemma 3 27B 基礎模型的進行中和提交的批次推論任務總和	每個受支援的區域：100	是	使用 Gemma 3 27B 基礎模型的進行中和提交的批次推論任務數量上限。
使用 Gemma 3 4B 基礎模型的進行中和提交的批次推論任務總和	每個受支援的區域：100	是	使用 Gemma 3 4B 基礎模型的進行中和提交的批次推論任務數量上限。
使用適用於 Kimi K2 Thinking 的基礎模型進行中的和提交的批次推論任務總和	每個受支援的區域：100	是	使用適用於 Kimi K2 Thinking 的基本模型進行中的和提交的批次推論任務數量上限。
使用適用於 Kimi K2.5 的基礎模型進行中的和提交的批次推論任務總和	每個受支援的區域：100	是	使用 Kimi K2.5 基礎模型的進行中和提交的批次推論任務數量上限。
使用 Llama 3.1 405B Instruct 基礎模型的進行中和提交的批次推論任務總和	每個受支援的區域：100	是	使用 Llama 3.1 405B Instruct 基礎模型的進行中和提交的批次推論任務數量上限。
使用 Llama 3.1 70B Instruct 基礎模型的進行中和提交的批次推論任務總和	每個受支援的區域：100	是	使用 Llama 3.1 70B Instruct 基礎模型的進行中和提交的批次推論任務數量上限。
使用 Llama 3.1 8B Instruct 基礎模型的進行中和提交的批次推論任務總和	每個受支援的區域：100	是	使用 Llama 3.1 8B Instruct 基礎模型的進行中和提交的批次推論任務數量上限。
使用 Llama 3.2 11B Instruct 基礎模型的進行中和提交的批次推論任務總和	每個受支援的區域：100	是	使用 Llama 3.2 11B Instruct 基礎模型的進行中和提交的批次推論任務數量上限。
使用 Llama 3.2 1B Instruct 基礎模型的進行中和提交的批次推論任務總和	每個受支援的區域：100	是	使用 Llama 3.2 1B Instruct 基礎模型的進行中和提交的批次推論任務數量上限。
使用 Llama 3.2 3B Instruct 基礎模型的進行中和提交的批次推論任務總和	每個受支援的區域：100	是	使用 Llama 3.2 3B Instruct 基礎模型的進行中和提交的批次推論任務數量上限。
使用 Llama 3.2 90B Instruct 基礎模型的進行中和提交的批次推論任務總和	每個受支援的區域：100	是	使用 Llama 3.2 90B Instruct 基礎模型的進行中和提交的批次推論任務數量上限。
使用 Llama 3.3 70B Instruct 基礎模型的進行中和提交的批次推論任務總和	每個受支援的區域：100	是	使用 Llama 3.3 70B Instruct 基礎模型的進行中和提交的批次推論任務數量上限。
使用 Llama 4 Maverick 基礎模型進行中的和提交的批次推論任務總和	每個受支援的區域：100	是	使用 Llama 4 Maverick 基礎模型的進行中和提交的批次推論任務數量上限。
使用 Llama 4 Scout 基礎模型的進行中和提交的批次推論任務總和	每個受支援的區域：100	是	使用 Llama 4 Scout 基礎模型的進行中和提交的批次推論任務數量上限。
使用 Magistral Small 2509 基本模型進行中的和提交的批次推論任務總和	每個受支援的區域：100	是	使用 Magistral Small 2509 基礎模型的進行中和提交的批次推論任務數量上限。
使用 MiniMax M2 基礎模型進行中的和提交的批次推論任務總和	每個受支援的區域：100	是	使用 MiniMax M2 基礎模型的進行中和提交的批次推論任務數量上限。
使用 MiniMax M2.1 基礎模型的進行中和提交的批次推論任務總和	每個受支援的區域：100	是	使用 MiniMax M2.1 基礎模型的進行中和提交的批次推論任務數量上限。
使用 MiniMax M2.5 基礎模型的進行中和提交的批次推論任務總和	每個受支援的區域：100	是	使用 MiniMax M2.5 基礎模型的進行中和提交的批次推論任務數量上限。
使用 Ministral 3 14B 基礎模型進行中的和提交的批次推論任務總和	每個受支援的區域：100	是	使用 Ministral 3 14B 基礎模型的進行中和提交的批次推論任務數量上限。
使用 Ministral 3 8B 基礎模型進行中的和提交的批次推論任務總和	每個受支援的區域：100	是	使用 Ministral 3 8B 基礎模型的進行中和提交的批次推論任務數量上限。
使用 Ministral 3B 基礎模型進行中的和提交的批次推論任務總和	每個受支援的區域：100	是	使用 Ministral 3B 基礎模型的進行中和提交的批次推論任務數量上限。
使用 Mistral Large 2 (24.07) 基本模型進行中的和提交的批次推論任務總和	每個受支援的區域：100	是	使用 Mistral Large 2 (24.07) 基本模型的進行中和提交的批次推論任務數量上限。
使用 Mistral Large 3 基礎模型進行中的和提交的批次推論任務總和	每個受支援的區域：100	是	使用 Mistral Large 3 基礎模型的進行中和提交的批次推論任務數量上限。
使用 Mistral Small 基礎模型進行中的和提交的批次推論任務總和	每個受支援的區域：100	是	使用 Mistral Small 基礎模型的進行中和提交的批次推論任務數量上限。
使用 NVIDIA Nemotron 3 Super 120B A12B 基本模型的進行中和提交的批次推論任務總和	每個受支援的區域：100	是	使用 NVIDIA Nemotron 3 Super 120B A12B 基本模型的進行中和提交的批次推論任務數量上限。
使用適用於 NVIDIA Nemotron Nano 12B 的基礎模型進行中的和提交的批次推論任務總和	每個受支援的區域：100	是	使用 NVIDIA Nemotron Nano 12B 基礎模型的進行中和提交的批次推論任務數量上限。
使用 NVIDIA Nemotron Nano 3 30B 基礎模型的進行中和提交的批次推論任務總和	每個受支援的區域：100	是	使用 NVIDIA Nemotron Nano 3 30B 基本模型的進行中和提交的批次推論任務數量上限。
使用 NVIDIA Nemotron Nano 9B 基本模型的進行中和提交的批次推論任務總和	每個受支援的區域：100	是	使用 NVIDIA Nemotron Nano 9B 基本模型的進行中和提交的批次推論任務數量上限。
使用 Nova 2 Lite 基本模型的進行中和提交的批次推論任務總和	每個受支援的區域：100	是	使用 Nova 2 Lite 基礎模型的進行中和提交的批次推論任務數量上限。
使用 Nova Lite V1 基礎模型的進行中和提交的批次推論任務總和	每個受支援的區域：100	是	使用 Nova Lite V1 基礎模型的進行中和提交的批次推論任務數量上限。
使用 Nova Micro V1 基礎模型的進行中和提交的批次推論任務總和	每個受支援的區域：100	是	使用 Nova Micro V1 基礎模型的進行中和提交的批次推論任務數量上限。
使用 Nova Pro V1 基礎模型的進行中和提交的批次推論任務總和	每個受支援的區域：100	是	使用 Nova Pro V1 基礎模型的進行中和提交的批次推論任務數量上限。
使用 OpenAI GPT OSS 120b 基礎模型的進行中和提交的批次推論任務總和	每個受支援的區域：100	是	使用 OpenAI GPT OSS 120b 基礎模型的進行中和提交的批次推論任務數量上限。
使用 OpenAI GPT OSS 20b 基礎模型的進行中和提交的批次推論任務總和	每個受支援的區域：100	是	使用 OpenAI GPT OSS 20b 基礎模型的進行中和提交的批次推論任務數量上限。
使用 OpenAI GPT OSS Safeguard 120b 基礎模型的進行中和提交的批次推論任務總和	每個受支援的區域：100	是	使用 OpenAI GPT OSS Safeguard 120b 基礎模型的進行中和提交的批次推論任務數量上限。
使用 OpenAI GPT OSS Safeguard 20b 基礎模型的進行中和提交的批次推論任務總和	每個受支援的區域：100	是	使用 OpenAI GPT OSS Safeguard 20b 基礎模型的進行中和提交的批次推論任務數量上限。
使用 Qwen3 235B 基礎模型的進行中和提交的批次推論任務總和	每個受支援的區域：100	是	使用 Qwen3 235B 基礎模型的進行中和提交的批次推論任務數量上限。
使用 Qwen3 32B 基礎模型的進行中和提交的批次推論任務總和	每個受支援的區域：100	是	使用 Qwen3 32B 基礎模型的進行中和提交的批次推論任務數量上限。
使用 Qwen3 Coder 30B 基礎模型的進行中和提交的批次推論任務總和	每個受支援的區域：100	是	使用 Qwen3 Coder 30B 基礎模型的進行中和提交的批次推論任務數量上限。
使用 Qwen3 Coder 480B 基礎模型的進行中和提交的批次推論任務總和	每個受支援的區域：100	是	使用 Qwen3 Coder 480B 基礎模型的進行中和提交的批次推論任務數量上限。
使用 Qwen3 Coder Next 基礎模型的進行中和提交的批次推論任務總和	每個受支援的區域：100	是	使用 Qwen3 Coder Next 基礎模型的進行中和提交的批次推論任務數量上限。
使用 Qwen3 Next 80B 基礎模型的進行中和提交的批次推論任務總和	每個受支援的區域：100	是	使用 Qwen3 Next 80B 基礎模型的進行中和提交的批次推論任務數量上限。
使用 Qwen3 VL 235B 基礎模型的進行中和提交的批次推論任務總和	每個受支援的區域：100	是	使用 Qwen3 VL 235B 基礎模型的進行中和提交的批次推論任務數量上限。
使用 Titan Multimodal Embeddings G1 基礎模型的進行中和提交的批次推論任務總和	每個受支援的區域：100	是	使用 Titan Multimodal Embeddings G1 基礎模型的進行中和提交的批次推論任務數量上限。
使用 Titan Text Embeddings V2 基礎模型的進行中和提交的批次推論任務總和	每個受支援的區域：100	是	使用 Titan Text Embeddings V2 基礎模型的進行中和提交的批次推論任務數量上限。
使用 Voxtral Mini 3B 2507 基礎模型的進行中和提交的批次推論任務總和	每個受支援的區域：100	是	使用 Voxtral Mini 3B 2507 基礎模型的進行中和提交的批次推論任務數量上限。
使用 Voxtral Small 24B 2507 基礎模型的進行中和提交的批次推論任務總和	每個受支援的區域：100	是	使用 Voxtral Small 24B 2507 基礎模型的進行中和提交的批次推論任務數量上限。
使用 Writer Palmyra Vision 7B 基礎模型的進行中和提交的批次推論任務總和	每個受支援的區域：100	是	使用 Writer Palmyra Vision 7B 基礎模型的進行中和提交的批次推論任務數量上限。
使用 Titan Multimodal Embeddings G1 自訂模型的進行中和提交的批次推論任務總和	每個支援的區域：3	否	使用 Titan Multimodal Embeddings G1 自訂模型的進行中和提交的批次推論任務數量上限。
使用 Titan Text Embeddings V2 自訂模型的進行中和提交的批次推論任務總和	每個支援的區域：3	否	使用 Titan Text Embeddings V2 自訂模型的進行中和提交的批次推論任務數量上限
Bedrock 資料自動化執行時間的調節速率限制：ListTagsForResource	每個受支援的區域：每秒 25 個	否	在目前區域中，每個帳戶每秒可以提出的 Bedrock 資料自動化執行時間上限：ListTagsForResource 請求
Bedrock 資料自動化執行時間的調節速率限制：TagResource	每個受支援的區域：每秒 25 個	否	Bedrock 資料自動化執行期的數目上限：您可以在目前區域中，為每個帳戶每秒提出的 TagResource 請求
Bedrock 資料自動化執行時間的調節速率限制：UntagResource	每個受支援的區域：每秒 25 個	否	Bedrock 資料自動化執行期的數目上限：您可以在目前區域中的每個帳戶每秒提出的 UntagResource 請求
Bedrock 資料自動化的調節速率限制：ListTagsForResource	每個受支援的區域：每秒 25 個	否	Bedrock 資料自動化的最大數量：您在目前區域中每個帳戶每秒可以提出的 ListTagsForResource 請求
Bedrock 資料自動化的調節速率限制：TagResource	每個受支援的區域：每秒 25 個	否	Bedrock 資料自動化數量上限：在目前區域中，您可以為每個帳戶每秒提出的 TagResource 請求
Bedrock 資料自動化的調節速率限制：UntagResource	每個受支援的區域：每秒 25 個	否	Bedrock 資料自動化的最大數量：您可以在目前區域中的每個帳戶每秒提出的 UntagResource 請求
CreateBlueprint 的調節速率限制	每個支援的區域：每秒 5 個	否	在目前區域中，每個帳戶每秒可以提出的 CreateBlueprint 請求數目上限
CreateBlueprintVersion 的調節速率限制	每個支援的區域：每秒 5 個	否	在目前區域中，每個帳戶每秒可以提出的 CreateBlueprintVersion 請求數目上限
CreateDataAutomationLibrary 的調節速率限制	每個受支援的區域：每秒 3 個	否	在目前區域中，每個帳戶每秒可以提出的 CreateDataAutomationLibrary 請求數目上限
CreateDataAutomationProject 的調節速率限制	每個支援的區域：每秒 5 個	否	在目前區域中，每個帳戶每秒可以提出的 CreateDataAutomationProject 請求數目上限
DeleteBlueprint 的調節速率限制	每個支援的區域：每秒 5 個	否	在目前區域中，每個帳戶每秒可以提出的 DeleteBlueprint 請求數目上限
DeleteDataAutomationLibrary 的調節速率限制	每個受支援的區域：每秒 3 個	否	在目前區域中，每個帳戶每秒可以提出的 DeleteDataAutomationLibrary 請求數目上限
DeleteDataAutomationProject 的調節速率限制	每個支援的區域：每秒 5 個	否	在目前區域中，每個帳戶每秒可以提出的 DeleteDataAutomationProject 請求數目上限
GetBlueprint 的調節速率限制	每個支援的區域：每秒 5 個	否	在目前區域中，每個帳戶每秒可以提出的 GetBlueprint 請求數目上限
GetDataAutomationLibrary 的調節速率限制	每個支援的區域：每秒 5 個	否	在目前區域中，每個帳戶每秒可以提出的 GetDataAutomationLibrary 請求數目上限
GetDataAutomationLibraryEntity 的調節速率限制	每個支援的區域：每秒 5 個	否	在目前區域中，每個帳戶每秒可以提出的 GetDataAutomationLibraryEntity 請求數目上限
GetDataAutomationLibraryIngestionJob 的調節速率限制	每個支援的區域：每秒 5 個	否	在目前區域中，每個帳戶每秒可以提出的 GetDataAutomationLibraryIngestionJob 請求數目上限
GetDataAutomationProject 的調節速率限制	每個支援的區域：每秒 5 個	否	在目前區域中，每個帳戶每秒可以提出的 GetDataAutomationProject 請求數目上限
GetDataAutomationStatus 的調節速率限制	每個支援的區域：每秒 10	否	在目前區域中，每個帳戶每秒可以提出的 GetDataAutomationStatus 請求數目上限
InvokeDataAutomationAsync 的調節速率限制	每個支援的區域：每秒 10	否	在目前區域中，每個帳戶每秒可以提出的 InvokeDataAutomationAsync 請求數目上限
InvokeDataAutomationLibraryIngestionJob 的調節速率限制	每個支援的區域：每秒 5 個	否	在目前區域中，每個帳戶每秒可以提出的 InvokeDataAutomationLibraryIngestionJob 請求數目上限
ListBlueprints 的調節速率限制	每個支援的區域：每秒 5 個	否	在目前區域中，每個帳戶每秒可以提出的 ListBlueprints 請求數目上限
ListDataAutomationLibraries 的調節速率限制	每個支援的區域：每秒 5 個	否	在目前區域中，每個帳戶每秒可以提出的 ListDataAutomationLibraries 請求數目上限
ListDataAutomationLibraryEntities 的調節速率限制	每個支援的區域：每秒 5 個	否	在目前區域中，每個帳戶每秒可以提出的 ListDataAutomationLibraryEntities 請求數目上限
ListDataAutomationLibraryIngestionJobs 的調節速率限制	每個支援的區域：每秒 5 個	否	在目前區域中，每個帳戶每秒可以提出的 ListDataAutomationLibraryIngestionJobs 請求數目上限
ListDataAutomationProjects 的調節速率限制	每個支援的區域：每秒 5 個	否	在目前區域中，每個帳戶每秒可以提出的 ListDataAutomationProjects 請求數目上限
UpdateBlueprint 的調節速率限制	每個支援的區域：每秒 5 個	否	在目前區域中，每個帳戶每秒可以提出的 UpdateBlueprint 請求數目上限
UpdateDataAutomationLibrary 的調節速率限制	每個支援的區域：每秒 5 個	否	在目前區域中，每個帳戶每秒可以提出的 UpdateDataAutomationLibrary 請求數目上限
UpdateDataAutomationProject 的調節速率限制	每個支援的區域：每秒 5 個	否	在目前區域中，每個帳戶每秒可以提出的 UpdateDataAutomationProject 請求數目上限
每秒 UpdateAgent 請求數	每個受支援的區域：4	否	每秒 UpdateAgent API 請求的數量上限。
每秒 UpdateAgentActionGroup 請求數	每個受支援的區域：6	否	每秒 UpdateAgentActionGroup API 請求的數量上限。
每秒 UpdateAgentAlias 請求數	每個受支援的區域：2	否	每秒 UpdateAgentAlias API 請求的數量上限。
每秒 UpdateAgentKnowledgeBase 請求數	每個受支援的區域：4	否	每秒 UpdateAgentKnowledgeBase API 請求的數量上限。
【bedrock-mantle 端點】 Claude Opus 4.7 每分鐘輸入字符	每個受支援的區域：20,000,000	是	【bedrock-mantle 端點】您的帳戶每分鐘可提交至此區域中 Claude Opus 4.7 的輸入字符數量上限。此模型的所有 APIs之間共用。
【bedrock-mantle 端點】 Claude Opus 4.8 每分鐘輸入字符	每個受支援的區域：20,000,000	是	【bedrock-mantle 端點】您的帳戶每分鐘可提交至此區域中 Claude Opus 4.8 的輸入字符數量上限。此模型的所有 APIs之間共用。
【bedrock-mantle 端點】 GPT-5.4 每分鐘輸入字符	每個受支援的區域：20,000,000	是	【bedrock-mantle 端點】您的帳戶每分鐘可提交到此區域中 GPT-5.4 的輸入字符數量上限。此模型的所有 APIs之間共用。
【bedrock-mantle 端點】 GPT-5.5 每分鐘輸入字符	每個支援的區域：10，000，000	是	【bedrock-mantle 端點】您的帳戶每分鐘可提交到此區域中 GPT-5.5 的輸入字符數量上限。此模型的所有 APIs之間共用。
【bedrock-mantle 端點】 Claude Opus 4.7 每分鐘輸出字符	每個支援的區域：2，000，000	是	【bedrock-mantle 端點】您在此區域中的帳戶每分鐘可產生的最大輸出字符數 Claude Opus 4.7。此模型的所有 APIs之間共用。
【bedrock-mantle 端點】 Claude Opus 4.8 每分鐘輸出字符	每個支援的區域：2，000，000	是	【bedrock-mantle 端點】您在此區域中的帳戶每分鐘可產生的最大輸出字符數 Claude Opus 4.8。此模型的所有 APIs之間共用。
【bedrock-mantle 端點】 GPT-5.4 每分鐘輸出字符	每個支援的區域：2，000，000	是	【bedrock-mantle 端點】 GPT-5.4 每分鐘可為您在此區域中的帳戶產生的輸出字符數目上限。此模型的所有 APIs之間共用。
【bedrock-mantle 端點】 GPT-5.5 每分鐘輸出字符	每個受支援的區域：1,000,000	是	【bedrock-mantle 端點】 GPT-5.5 每分鐘可為您在此區域中的帳戶產生的輸出字符數量上限。此模型的所有 APIs之間共用。

注意

您可以按照以下步驟請求提高帳戶配額：

如果配額標示為是，您可以依照《Service Quotas 使用者指南》中請求提高配額的步驟進行調整。
如果配額標記為否，您可以透過提高限制表單提交請求，以考慮提高配額。
對於任何模型，您皆可一起請求提高下列配額：
- ${model} 的每分鐘跨區域 InvokeModel 字符
- ${model} 的每分鐘跨區域 InvokeModel 請求
- ${model} 的每分鐘隨需 InvokeModel 字符
- ${model} 的每分鐘隨需 InvokeModel 請求
若要請求提高這些配額的任意組合，請遵循《Service Quotas 使用者指南》中請求提高配額的步驟，請求提高 ${model} 的每分鐘跨區域 InvokeModel 字符配額。這麼做之後，支援團隊會與您聯絡，並提供您同時提高其他三個配額的選項。由於需求量龐大，將優先考慮所產生流量足以消耗其現有配額配置的客戶。如果您不符合此條件，可能會拒絕您的請求。

您的瀏覽器已停用或無法使用 Javascript。

您必須啟用 Javascript，才能使用 AWS 文件。請參閱您的瀏覽器說明頁以取得說明。

文件慣用形式

AWS Batch

Amazon Bedrock AgentCore