Amazon Bedrock Service-Endpunkte Amazon-Bedrock-Servicekontingente

Endpunkte und Kontingente von Amazon Bedrock

Um programmgesteuert eine Verbindung zu einem AWS Service herzustellen, verwenden Sie einen Endpunkt. AWS Dienste bieten die folgenden Endpunkttypen in einigen oder allen AWS Regionen, die der Dienst unterstützt: IPv4-Endpunkte, Dual-Stack-Endpunkte und FIPS-Endpunkte. Einige Dienste bieten globale Endpunkte. Weitere Informationen finden Sie unter AWS Dienstendpunkte.

Servicekontingenten, auch Limits genannt, sind die maximale Anzahl von Serviceressourcen oder Vorgängen für Ihr AWS Konto. Weitere Informationen finden Sie unter AWS Service Quotas.

Im Folgenden werden die Service-Endpunkte und -kontingente für diesen Service beschrieben.

Amazon Bedrock Service-Endpunkte

APIs für Amazon Bedrock-Steuerungsebenen

Die folgende Tabelle enthält eine Liste der Region-specific Endpunkte, die Amazon Bedrock für die Verwaltung, Schulung und Bereitstellung von Modellen unterstützt. Verwenden Sie diese Endpunkte für Amazon Bedrock API-Operationen.

Name der Region	Region	Endpunkt	Protocol (Protokoll)
USA Ost (Ohio)	us-east-2	bedrock.us-east-2.amazonaws.com bedrock-fips.us-east-2.amazonaws.com	HTTPS HTTPS
USA Ost (Nord-Virginia)	us-east-1	bedrock.us-east-1.amazonaws.com bedrock-fips.us-east-1.amazonaws.com	HTTPS HTTPS
USA West (Nordkalifornien)	us-west-1	bedrock.us-west-1.amazonaws.com bedrock-fips.us-west-1.amazonaws.com	HTTPS HTTPS
USA West (Oregon)	us-west-2	bedrock.us-west-2.amazonaws.com bedrock-fips.us-west-2.amazonaws.com	HTTPS HTTPS
Afrika (Kapstadt)	af-south-1	bedrock.af-south-1.amazonaws.com	HTTPS
Asien-Pazifik (Hyderabad)	ap-south-2	bedrock.ap-south-2.amazonaws.com	HTTPS
Asien-Pazifik (Jakarta)	ap-southeast-3	bedrock.ap-southeast-3.amazonaws.com	HTTPS
Asien-Pazifik (Malaysia)	ap-southeast-5	bedrock.ap-southeast-5.amazonaws.com	HTTPS
Asien-Pazifik (Melbourne)	ap-southeast-4	bedrock.ap-southeast-4.amazonaws.com	HTTPS
Asien-Pazifik (Mumbai)	ap-south-1	bedrock.ap-south-1.amazonaws.com	HTTPS
Asien-Pazifik (Neuseeland)	ap-southeast-6	bedrock.ap-southeast-6.amazonaws.com	HTTPS
Asien-Pazifik (Osaka)	ap-northeast-3	bedrock.ap-northeast-3.amazonaws.com	HTTPS
Asien-Pazifik (Seoul)	ap-northeast-2	bedrock.ap-northeast-2.amazonaws.com	HTTPS
Asien-Pazifik (Singapur)	ap-southeast-1	bedrock.ap-southeast-1.amazonaws.com	HTTPS
Asien-Pazifik (Sydney)	ap-southeast-2	bedrock.ap-southeast-2.amazonaws.com	HTTPS
Asien-Pazifik (Taipeh)	ap-east-2	bedrock.ap-east-2.amazonaws.com	HTTPS
Asien-Pazifik (Thailand)	ap-southeast-7	bedrock.ap-southeast-7.amazonaws.com	HTTPS
Asien-Pazifik (Tokio)	ap-northeast-1	bedrock.ap-northeast-1.amazonaws.com	HTTPS
Kanada (Zentral)	ca-central-1	bedrock.ca-central-1.amazonaws.com bedrock-fips.ca-central-1.amazonaws.com	HTTPS HTTPS
Kanada West (Calgary)	ca-west-1	bedrock.ca-west-1.amazonaws.com bedrock-fips.ca-west-1.amazonaws.com	HTTPS HTTPS
Europa (Frankfurt)	eu-central-1	bedrock.eu-central-1.amazonaws.com	HTTPS
Europa (Irland)	eu-west-1	bedrock.eu-west-1.amazonaws.com	HTTPS
Europa (London)	eu-west-2	bedrock.eu-west-2.amazonaws.com	HTTPS
Europa (Mailand)	eu-south-1	bedrock.eu-south-1.amazonaws.com	HTTPS
Europa (Paris)	eu-west-3	bedrock.eu-west-3.amazonaws.com	HTTPS
Europa (Spanien)	eu-south-2	bedrock.eu-south-2.amazonaws.com	HTTPS
Europa (Stockholm)	eu-north-1	bedrock.eu-north-1.amazonaws.com	HTTPS
Europa (Zürich)	eu-central-2	bedrock.eu-central-2.amazonaws.com	HTTPS
Israel (Tel Aviv)	il-central-1	bedrock.il-central-1.amazonaws.com	HTTPS
Mexiko (Zentral)	mx-central-1	bedrock.mx-central-1.amazonaws.com	HTTPS
Naher Osten (Bahrain)	me-south-1	bedrock.me-south-1.amazonaws.com	HTTPS
Naher Osten (VAE)	me-central-1	bedrock.me-central-1.amazonaws.com	HTTPS
Südamerika (São Paulo)	sa-east-1	bedrock.sa-east-1.amazonaws.com	HTTPS
AWS GovCloud (US-East)	us-gov-east-1	bedrock.us-gov-east-1.amazonaws.com bedrock-fips.us-gov-east-1.amazonaws.com	HTTPS HTTPS
AWS GovCloud (US-West)	us-gov-west-1	bedrock.us-gov-west-1.amazonaws.com bedrock-fips.us-gov-west-1.amazonaws.com	HTTPS HTTPS

Amazon Bedrock-Laufzeit-APIs

Die folgende Tabelle enthält eine Liste der Region-specific Endpunkte, die Amazon Bedrock unterstützt, um Inferenzanfragen für in Amazon Bedrock gehostete Modelle zu stellen. Verwenden Sie diese Endpunkte für Amazon Bedrock Runtime API-Operationen.

Name der Region	Region	Endpunkt	Protocol (Protokoll)
USA Ost (Ohio)	us-east-2	bedrock-runtime.us-east-2.amazonaws.com bedrock-runtime-fips.us-east-2.amazonaws.com	HTTPS HTTPS
USA Ost (Nord-Virginia)	us-east-1	bedrock-runtime.us-east-1.amazonaws.com bedrock-runtime-fips.us-east-1.amazonaws.com	HTTPS HTTPS
USA West (Oregon)	us-west-2	bedrock-runtime.us-west-2.amazonaws.com bedrock-runtime-fips.us-west-2.amazonaws.com	HTTPS HTTPS
Asien-Pazifik (Hyderabad)	ap-south-2	bedrock-runtime.ap-south-2.amazonaws.com	HTTPS
Asien-Pazifik (Mumbai)	ap-south-1	bedrock-runtime.ap-south-1.amazonaws.com	HTTPS
Asien-Pazifik (Osaka)	ap-northeast-3	bedrock-runtime.ap-northeast-3.amazonaws.com	HTTPS
Asien-Pazifik (Seoul)	ap-northeast-2	bedrock-runtime.ap-northeast-2.amazonaws.com	HTTPS
Asien-Pazifik (Singapur)	ap-southeast-1	bedrock-runtime.ap-southeast-1.amazonaws.com	HTTPS
Asien-Pazifik (Sydney)	ap-southeast-2	bedrock-runtime.ap-southeast-2.amazonaws.com	HTTPS
Asien-Pazifik (Tokio)	ap-northeast-1	bedrock-runtime.ap-northeast-1.amazonaws.com	HTTPS
Kanada (Zentral)	ca-central-1	bedrock-runtime.ca-central-1.amazonaws.com bedrock-runtime-fips.ca-central-1.amazonaws.com	HTTPS HTTPS
Europa (Frankfurt)	eu-central-1	bedrock-runtime.eu-central-1.amazonaws.com	HTTPS
Europa (Irland)	eu-west-1	bedrock-runtime.eu-west-1.amazonaws.com	HTTPS
Europa (London)	eu-west-2	bedrock-runtime.eu-west-2.amazonaws.com	HTTPS
Europa (Mailand)	eu-south-1	bedrock-runtime.eu-south-1.amazonaws.com	HTTPS
Europa (Paris)	eu-west-3	bedrock-runtime.eu-west-3.amazonaws.com	HTTPS
Europa (Spanien)	eu-south-2	bedrock-runtime.eu-south-2.amazonaws.com	HTTPS
Europa (Stockholm)	eu-north-1	bedrock-runtime.eu-north-1.amazonaws.com	HTTPS
Europa (Zürich)	eu-central-2	bedrock-runtime.eu-central-2.amazonaws.com	HTTPS
Südamerika (São Paulo)	sa-east-1	bedrock-runtime.sa-east-1.amazonaws.com	HTTPS
AWS GovCloud (US-East)	us-gov-east-1	bedrock-runtime.us-gov-east-1.amazonaws.com bedrock-runtime-fips.us-gov-east-1.amazonaws.com	HTTPS HTTPS
AWS GovCloud (US-West)	us-gov-west-1	bedrock-runtime.us-gov-west-1.amazonaws.com bedrock-runtime-fips.us-gov-west-1.amazonaws.com	HTTPS HTTPS

Build-Time-APIs für Agents für Amazon Bedrock

Die folgende Tabelle enthält eine Liste von Region-specific Endpunkten, die Agents for Amazon Bedrock für die Erstellung und Verwaltung von Agenten und Wissensdatenbanken unterstützt. Verwenden Sie diese Endpunkte für Agents for Amazon Bedrock API-Operationen.

Name der Region	Region	Endpunkt	Protocol (Protokoll)
USA Ost (Nord-Virginia)	us-east-1	bedrock-agent.us-east-1.amazonaws.com	HTTPS
USA Ost (Nord-Virginia)	us-east-1	bedrock-agent-fips.us-east-1.amazonaws.com	HTTPS
USA West (Oregon)	us-west-2	bedrock-agent.us-west-2.amazonaws.com	HTTPS
USA West (Oregon)	us-west-2	bedrock-agent-fips.us-west-2.amazonaws.com	HTTPS
Asien-Pazifik (Singapur)	ap-southeast-1	bedrock-agent.ap-southeast-1.amazonaws.com	HTTPS
Asien-Pazifik (Sydney)	ap-southeast-2	bedrock-agent.ap-southeast-2.amazonaws.com	HTTPS
Asien-Pazifik (Tokio)	ap-northeast-1	bedrock-agent.ap-northeast-1.amazonaws.com	HTTPS
Asien-Pazifik (Seoul)	ap-northeast-2	bedrock-agent.ap-northeast-2.amazonaws.com	HTTPS
Kanada (Zentral)	ca-central-1	bedrock-agent.ca-central-1.amazonaws.com	HTTPS
Europa (Frankfurt)	eu-central-1	bedrock-agent.eu-central-1.amazonaws.com	HTTPS
Europa (Irland)	eu-west-1	bedrock-agent.eu-west-1.amazonaws.com	HTTPS
Europa (London)	eu-west-2	bedrock-agent.eu-west-2.amazonaws.com	HTTPS
Europa (Paris)	eu-west-3	bedrock-agent.eu-west-3.amazonaws.com	HTTPS
Asien-Pazifik (Mumbai)	ap-south-1	bedrock-agent.ap-south-1.amazonaws.com	HTTPS
Südamerika (São Paulo)	sa-east-1	bedrock-agent.sa-east-1.amazonaws.com	HTTPS

Runtime-APIs für Agents für Amazon Bedrock

Die folgende Tabelle enthält eine Liste von Region-specific Endpunkten, die Agents for Amazon Bedrock zum Aufrufen von Agenten und Abfragen von Wissensdatenbanken unterstützt. Verwenden Sie diese Endpunkte für Agents for Amazon Bedrock Runtime API-Operationen.

Name der Region	Region	Endpunkt	Protocol (Protokoll)
USA Ost (Nord-Virginia)	us-east-1	bedrock-agent-runtime.us-east-1.amazonaws.com	HTTPS
USA Ost (Nord-Virginia)	us-east-1	bedrock-agent-runtime-fips.us-east-1.amazonaws.com	HTTPS
USA West (Oregon)	us-west-2	bedrock-agent-runtime.us-west-2.amazonaws.com	HTTPS
USA West (Oregon)	us-west-2	bedrock-agent-runtime-fips.us-west-2.amazonaws.com	HTTPS
Asien-Pazifik (Singapur)	ap-southeast-1	bedrock-agent-runtime.ap-southeast-1.amazonaws.com	HTTPS
Asien-Pazifik (Sydney)	ap-southeast-2	bedrock-agent-runtime.ap-southeast-2.amazonaws.com	HTTPS
Asien-Pazifik (Tokio)	ap-northeast-1	bedrock-agent-runtime.ap-northeast-1.amazonaws.com	HTTPS
Asien-Pazifik (Seoul)	ap-northeast-2	bedrock-agent-runtime.ap-northeast-2.amazonaws.com	HTTPS
Kanada (Zentral)	ca-central-1	bedrock-agent-runtime.ca-central-1.amazonaws.com	HTTPS
Europa (Frankfurt)	eu-central-1	bedrock-agent-runtime.eu-central-1.amazonaws.com	HTTPS
Europa (Paris)	eu-west-3	bedrock-agent-runtime.eu-west-3.amazonaws.com	HTTPS
Europa (Irland)	eu-west-1	bedrock-agent-runtime.eu-west-1.amazonaws.com	HTTPS
Europa (London)	eu-west-2	bedrock-agent-runtime.eu-west-2.amazonaws.com	HTTPS
Asien-Pazifik (Mumbai)	ap-south-1	bedrock-agent-runtime.ap-south-1.amazonaws.com	HTTPS
Südamerika (São Paulo)	sa-east-1	bedrock-agent-runtime.sa-east-1.amazonaws.com	HTTPS

Amazon Bedrock Datenautomatisierungs-APIs

Die folgende Tabelle enthält eine Liste der Region-specific Endpunkte, die Data Automation for Amazon Bedrock unterstützt. Endgeräte, die das Wort verwenden, runtime rufen Blueprints und Projekte auf, um Informationen aus Dateien zu extrahieren. Verwenden Sie diese Endpunkte für Amazon Bedrock Data Automation Runtime API-Operationen. Endpunkte ohne diese runtime werden verwendet, um Blueprints und Projekte zu erstellen, um Anleitungen zur Extraktion bereitzustellen. Verwenden Sie diese Endpunkte für Amazon Bedrock Data Automation API Buildtime-Operationen

Name der Region	Region	Endpunkt	Protocol (Protokoll)
USA Ost (Ohio)	us-east-2	bedrock-data-automation.us-east-2.amazonaws.com bedrock-data-automation-runtime.us-east-2.amazonaws.com bedrock-data-automation-fips.us-east-2.amazonaws.com bedrock-data-automation-runtime-fips.us-east-2.amazonaws.com	HTTPS HTTPS HTTPS HTTPS
USA Ost (Nord-Virginia)	us-east-1	bedrock-data-automation.us-east-1.amazonaws.com bedrock-data-automation-runtime.us-east-1.api.aws bedrock-data-automation-runtime.us-east-1.amazonaws.com bedrock-data-automation.us-east-1.api.aws bedrock-data-automation-fips.us-east-1.amazonaws.com bedrock-data-automation-runtime-fips.us-east-1.api.aws bedrock-data-automation-runtime-fips.us-east-1.amazonaws.com bedrock-data-automation-fips.us-east-1.api.aws	HTTPS HTTPS HTTPS HTTPS HTTPS HTTPS HTTPS HTTPS
USA West (Oregon)	us-west-2	bedrock-data-automation.us-west-2.amazonaws.com bedrock-data-automation-runtime.us-west-2.api.aws bedrock-data-automation-runtime.us-west-2.amazonaws.com bedrock-data-automation.us-west-2.api.aws bedrock-data-automation-fips.us-west-2.amazonaws.com bedrock-data-automation-runtime-fips.us-west-2.api.aws bedrock-data-automation-runtime-fips.us-west-2.amazonaws.com bedrock-data-automation-fips.us-west-2.api.aws	HTTPS HTTPS HTTPS HTTPS HTTPS HTTPS HTTPS HTTPS
Asien-Pazifik (Mumbai)	ap-south-1	bedrock-data-automation.ap-south-1.amazonaws.com bedrock-data-automation-runtime.ap-south-1.amazonaws.com	HTTPS HTTPS
Asien-Pazifik (Sydney)	ap-southeast-2	bedrock-data-automation.ap-southeast-2.amazonaws.com bedrock-data-automation-runtime.ap-southeast-2.amazonaws.com	HTTPS HTTPS
Asien-Pazifik (Tokio)	ap-northeast-1	bedrock-data-automation.ap-northeast-1.amazonaws.com bedrock-data-automation-runtime.ap-northeast-1.amazonaws.com	HTTPS HTTPS
Kanada (Zentral)	ca-central-1	bedrock-data-automation.ca-central-1.amazonaws.com bedrock-data-automation-runtime.ca-central-1.amazonaws.com bedrock-data-automation-fips.ca-central-1.amazonaws.com bedrock-data-automation-runtime-fips.ca-central-1.amazonaws.com	HTTPS HTTPS HTTPS HTTPS
Europa (Frankfurt)	eu-central-1	bedrock-data-automation.eu-central-1.amazonaws.com bedrock-data-automation-runtime.eu-central-1.amazonaws.com	HTTPS HTTPS
Europa (Irland)	eu-west-1	bedrock-data-automation.eu-west-1.amazonaws.com bedrock-data-automation-runtime.eu-west-1.amazonaws.com	HTTPS HTTPS
Europa (London)	eu-west-2	bedrock-data-automation.eu-west-2.amazonaws.com bedrock-data-automation-runtime.eu-west-2.amazonaws.com	HTTPS HTTPS
Europa (Spanien)	eu-south-2	bedrock-data-automation.eu-south-2.amazonaws.com bedrock-data-automation-runtime.eu-south-2.amazonaws.com	HTTPS HTTPS
AWS GovCloud (US-West)	us-gov-west-1	bedrock-data-automation.us-gov-west-1.amazonaws.com bedrock-data-automation-runtime.us-gov-west-1.amazonaws.com bedrock-data-automation-fips.us-gov-west-1.amazonaws.com bedrock-data-automation-runtime-fips.us-gov-west-1.amazonaws.com	HTTPS HTTPS HTTPS HTTPS

Amazon-Bedrock-Servicekontingente

Tipp

Da Amazon Bedrock über eine große Anzahl von Kontingenten verfügt, empfehlen wir, dass Sie die Service-Kontingente in der Konsole anzeigen, anstatt die Tabelle unten zu verwenden. Öffnen Sie Amazon Bedrock-Kontingente. Verwenden Sie das Suchfeld, um bestimmte Kontingente zu finden. Verwenden Sie das Zahnradsymbol, um zu steuern, wie viele Kontingente auf einer Seite angezeigt werden.

Name	Standard	Anpassbar	Description
(Erweiterte Prompt-Optimierung) Aktive Jobs pro Konto	Jede unterstützte Region: 20	Ja	Die maximale Anzahl aktiver APO-Jobs (Advanced Prompt Optimization) pro Konto.
(Advanced Prompt Optimization) Inaktive Jobs pro Konto	Jede unterstützte Region: 5 000	Ja	Die maximale Anzahl inaktiver APO-Jobs (Advanced Prompt Optimization) pro Konto.
(Automatisiertes Denken) Anmerkungen in der Richtlinie	Jede unterstützte Region: 10	Nein	Die maximale Anzahl von Anmerkungen in einer Richtlinie für automatisiertes Denken.
(Automated Reasoning) -Anfragen pro Sekunde CancelAutomatedReasoningPolicyBuildWorkflow	Jede unterstützte Region: 5	Yes (Ja)	Die maximale Anzahl von CancelAutomatedReasoningPolicyBuildWorkflow API-Anfragen pro Sekunde.
(Automatisiertes Denken) Gleichzeitige Builds pro Richtlinie	Jede unterstützte Region: 2	Nein	Die maximale Anzahl gleichzeitiger Builds pro Automated Reasoning-Richtlinie.
(Automated Reasoning) Gleichzeitige Policy-Builds pro Konto	Jede unterstützte Region: 5	Nein	Die maximale Anzahl gleichzeitiger Policy-Builds für automatisiertes Denken in einem Konto.
(Automated Reasoning) -Anfragen pro Sekunde CreateAutomatedReasoningPolicy	Jede unterstützte Region: 5	Yes (Ja)	Die maximale Anzahl von CreateAutomatedReasoningPolicy API-Anfragen pro Sekunde.
(Automated Reasoning) CreateAutomatedReasoningPolicyTestCase -Anfragen pro Sekunde	Jede unterstützte Region: 5	Yes (Ja)	Die maximale Anzahl von CreateAutomatedReasoningPolicyTestCase API-Anfragen pro Sekunde.
(Automated Reasoning) CreateAutomatedReasoningPolicyVersion -Anfragen pro Sekunde	Jede unterstützte Region: 5	Yes (Ja)	Die maximale Anzahl von CreateAutomatedReasoningPolicyVersion API-Anfragen pro Sekunde.
(Automated Reasoning) DeleteAutomatedReasoningPolicy -Anfragen pro Sekunde	Jede unterstützte Region: 5	Yes (Ja)	Die maximale Anzahl von DeleteAutomatedReasoningPolicy API-Anfragen pro Sekunde.
(Automated Reasoning) DeleteAutomatedReasoningPolicyBuildWorkflow -Anfragen pro Sekunde	Jede unterstützte Region: 5	Yes (Ja)	Die maximale Anzahl von DeleteAutomatedReasoningPolicyBuildWorkflow API-Anfragen pro Sekunde.
(Automated Reasoning) DeleteAutomatedReasoningPolicyTestCase -Anfragen pro Sekunde	Jede unterstützte Region: 5	Yes (Ja)	Die maximale Anzahl von DeleteAutomatedReasoningPolicyTestCase API-Anfragen pro Sekunde.
(Automated Reasoning) ExportAutomatedReasoningPolicyVersion -Anfragen pro Sekunde	Jede unterstützte Region: 5	Yes (Ja)	Die maximale Anzahl von ExportAutomatedReasoningPolicyVersion API-Anfragen pro Sekunde.
(Automated Reasoning) GetAutomatedReasoningPolicy -Anfragen pro Sekunde	Jede unterstützte Region: 10	Yes (Ja)	Die maximale Anzahl von GetAutomatedReasoningPolicy API-Anfragen pro Sekunde.
(Automated Reasoning) GetAutomatedReasoningPolicyAnnotations -Anfragen pro Sekunde	Jede unterstützte Region: 10	Yes (Ja)	Die maximale Anzahl von GetAutomatedReasoningPolicyAnnotations API-Anfragen pro Sekunde.
(Automated Reasoning) GetAutomatedReasoningPolicyBuildWorkflow -Anfragen pro Sekunde	Jede unterstützte Region: 10	Yes (Ja)	Die maximale Anzahl von GetAutomatedReasoningPolicyBuildWorkflow API-Anfragen pro Sekunde.
(Automated Reasoning) GetAutomatedReasoningPolicyBuildWorkflowResultAssets -Anfragen pro Sekunde	Jede unterstützte Region: 10	Yes (Ja)	Die maximale Anzahl von GetAutomatedReasoningPolicyBuildWorkflowResultAssets API-Anfragen pro Sekunde.
(Automated Reasoning) GetAutomatedReasoningPolicyNextScenario -Anfragen pro Sekunde	Jede unterstützte Region: 10	Yes (Ja)	Die maximale Anzahl von GetAutomatedReasoningPolicyNextScenario API-Anfragen pro Sekunde.
(Automated Reasoning) GetAutomatedReasoningPolicyTestCase -Anfragen pro Sekunde	Jede unterstützte Region: 10	Yes (Ja)	Die maximale Anzahl von GetAutomatedReasoningPolicyTestCase API-Anfragen pro Sekunde.
(Automated Reasoning) GetAutomatedReasoningPolicyTestResult -Anfragen pro Sekunde	Jede unterstützte Region: 10	Yes (Ja)	Die maximale Anzahl von GetAutomatedReasoningPolicyTestResult API-Anfragen pro Sekunde.
(Automated Reasoning) ListAutomatedReasoningPolicies -Anfragen pro Sekunde	Jede unterstützte Region: 5	Yes (Ja)	Die maximale Anzahl von ListAutomatedReasoningPolicies API-Anfragen pro Sekunde.
(Automated Reasoning) ListAutomatedReasoningPolicyBuildWorkflows -Anfragen pro Sekunde	Jede unterstützte Region: 5	Yes (Ja)	Die maximale Anzahl von ListAutomatedReasoningPolicyBuildWorkflows API-Anfragen pro Sekunde.
(Automated Reasoning) ListAutomatedReasoningPolicyTestCases -Anfragen pro Sekunde	Jede unterstützte Region: 5	Yes (Ja)	Die maximale Anzahl von ListAutomatedReasoningPolicyTestCases API-Anfragen pro Sekunde.
(Automated Reasoning) ListAutomatedReasoningPolicyTestResults -Anfragen pro Sekunde	Jede unterstützte Region: 5	Yes (Ja)	Die maximale Anzahl von ListAutomatedReasoningPolicyTestResults API-Anfragen pro Sekunde.
(Automatisiertes Denken) Richtlinien pro Konto	Jede unterstützte Region: 100	Nein	Die maximale Anzahl von Richtlinien für automatisiertes Denken in einem Konto.
(Automatisiertes Denken) Regeln in der Richtlinie	Jede unterstützte Region: 500	Nein	Die maximale Anzahl von Regeln in einer Richtlinie für automatisiertes Denken.
(Automatisiertes Denken) Größe des Quelldokuments (MB)	Jede unterstützte Region: 5	Nein	Die maximale Größe des Quelldokuments (MB) für die Erstellung einer Richtlinie für automatisiertes Denken.
(Automatisiertes Denken) Tokens für das Quelldokument	Jede unterstützte Region: 122.880	Nein	Die maximale Anzahl von Tokens, die bei der Erstellung einer Richtlinie für automatisiertes Denken in einem Quelldokument zulässig ist.
(Automated Reasoning) StartAutomatedReasoningPolicyBuildWorkflow -Anfragen pro Sekunde	Jede unterstützte Region: 1	Ja	Die maximale Anzahl von StartAutomatedReasoningPolicyBuildWorkflow API-Anfragen pro Sekunde.
(Automated Reasoning) StartAutomatedReasoningPolicyTestWorkflow -Anfragen pro Sekunde	Jede unterstützte Region: 1	Ja	Die maximale Anzahl von StartAutomatedReasoningPolicyTestWorkflow API-Anfragen pro Sekunde.
(Automatisiertes Denken) Tests pro Richtlinie	Jede unterstützte Region: 100	Nein	Die maximale Anzahl von Tests pro Richtlinie für automatisiertes Denken.
(Automatisiertes Denken) Typen pro Richtlinie	Jede unterstützte Region: 50	Nein	Die maximale Anzahl von Typen in einer Richtlinie für automatisiertes Denken.
(Automated Reasoning) UpdateAutomatedReasoningPolicy -Anfragen pro Sekunde	Jede unterstützte Region: 5	Yes (Ja)	Die maximale Anzahl von UpdateAutomatedReasoningPolicy API-Anfragen pro Sekunde.
(Automated Reasoning) UpdateAutomatedReasoningPolicyAnnotations -Anfragen pro Sekunde	Jede unterstützte Region: 5	Yes (Ja)	Die maximale Anzahl von UpdateAutomatedReasoningPolicyAnnotations API-Anfragen pro Sekunde.
(Automated Reasoning) UpdateAutomatedReasoningPolicyTestCase -Anfragen pro Sekunde	Jede unterstützte Region: 5	Yes (Ja)	Die maximale Anzahl von UpdateAutomatedReasoningPolicyTestCase API-Anfragen pro Sekunde.
(Automatisiertes Denken) Werte pro Richtlinientyp	Jede unterstützte Region: 50	Nein	Die maximale Anzahl von Werten pro Typ in einer Richtlinie für automatisiertes Denken.
(Automatisiertes Denken) Variablen in der Richtlinie	Jede unterstützte Region: 200	Nein	Die maximale Anzahl von Variablen in einer Richtlinie für automatisiertes Denken.
(Automated Reasoning) Versionen pro Richtlinie	Jede unterstützte Region: 1 000	Nein	Die maximale Anzahl von Versionen pro Automated Reasoning-Richtlinie.
(Datenautomatisierung) (Konsole) Maximale Größe der Dokumentdatei (MB)	Jede unterstützte Region: 200	Nein	Die maximale Dateigröße für die Konsole
(Datenautomatisierung) (Konsole) Maximale Anzahl von Seiten pro Dokumentdatei	Jede unterstützte Region: 20	Nein	Die maximale Anzahl von Seiten pro Dokument in der Konsole
(Datenautomatisierung) CreateBlueprint — Maximale Anzahl von Blueprints pro Konto	Jede unterstützte Region: 350	Ja	Die maximale Anzahl von Blueprints pro Konto
(Datenautomatisierung) CreateBlueprintVersion — Maximale Anzahl von Blueprint-Versionen pro Blueprint	Jede unterstützte Region: 10	Yes (Ja)	Die maximale Anzahl von Versionen pro Blueprint
(Datenautomatisierung) CreateDataAutomationLibrary — Maximale Anzahl von Datenautomatisierungsbibliotheken pro Konto	Jede unterstützte Region: 10	Yes (Ja)	Die maximale Anzahl von Datenautomatisierungsbibliotheken pro Konto
(Datenautomatisierung) Länge der Beschreibung für Felder (Zeichen)	Jede unterstützte Region: 300	Nein	Die maximale Länge der Beschreibung für Felder in Zeichen
(Datenautomatisierung) InvokeBlueprintOptimizationAsync — Maximale Anzahl gleichzeitiger Jobs zur Blueprint-Optimierung	Jede unterstützte Region: 3	Ja	Die maximale Anzahl offener Invoke Blueprint Optimization Async-Jobs
(Datenautomatisierung) InvokeBlueprintOptimizationAsync — Maximale Anzahl von Blueprint-Optimierungsaufträgen pro Tag	Jede unterstützte Region: 30	Nein	Die maximale Anzahl von Invoke Blueprint Optimization Async-Jobs pro Tag
(Datenautomatisierung) InvokeDataAutomation (Sync) — Dokument — Maximale Anzahl von Anfragen	Jede unterstützte Region: 60	Ja	Die maximale Anzahl von InvokeDataAutomation Anfragen pro Minute für die Dokumentmodalität
(Datenautomatisierung) InvokeDataAutomation (Sync) — Bild — Maximale Anzahl von Anfragen	us-east-1: 200 us-west-2: 200 Jede der anderen unterstützten Regionen: 100	Ja	Die maximale Anzahl von InvokeDataAutomation Anfragen pro Minute für die Bildmodalität
(Datenautomatisierung) InvokeDataAutomationAsync — Audio — Maximale Anzahl gleichzeitiger Jobs	us-east-1: 20 us-west-2: 20 Jede der anderen unterstützten Regionen: 2	Ja	Die maximale Anzahl offener Invoke Data Automation Async-Jobs für Audios
(Datenautomatisierung) InvokeDataAutomationAsync — Dokument — Maximale Anzahl gleichzeitiger Jobs	ap-south-1:5 ca-central-1:5 eu-south-2:5 eu-west-2: 5 Jede der anderen unterstützten Regionen: 25	Ja	Die maximale Anzahl offener Invoke Data Automation Async-Jobs für Dokumente
(Data Automation) InvokeDataAutomationAsync — Bild — Maximale Anzahl gleichzeitiger Jobs	us-east-1: 20 us-west-2: 20 Jede der anderen unterstützten Regionen: 5	Ja	Die maximale Anzahl offener Invoke Data Automation Async-Jobs für Bilder
(Datenautomatisierung) InvokeDataAutomationAsync — Maximale Anzahl offener Jobs	Jede unterstützte Region: 1 800	Nein	Die maximale Anzahl offener Invoke Data Automation Async-Jobs für Bilder
(Datenautomatisierung) InvokeDataAutomationAsync — Video — Maximale Anzahl gleichzeitiger Jobs	us-east-1: 20 us-west-2: 20 Jede der anderen unterstützten Regionen: 3	Ja	Die maximale Anzahl offener Invoke Data Automation Async-Jobs für Videos
(Datenautomatisierung) Maximale Anzahl von Vokabelphrasen pro Bibliothek	Jede unterstützte Region: 500	Ja	Die maximale Anzahl von benutzerdefinierten Vokabelphrasen, die pro Bibliothek konfiguriert werden können
(Datenautomatisierung) Maximale Audio-Samplerate (Hz)	Jede unterstützte Region: 48.000	Nein	Die maximale Audio-Samplerate
(Datenautomatisierung) Maximale Anzahl von Blueprints pro Projekt (Audios)	Jede unterstützte Region: 1	Nein	Die maximale Anzahl von Blueprints pro Projekt für Audios
(Datenautomatisierung) Maximale Anzahl von Blueprints pro Projekt (Dokumente)	Jede unterstützte Region: 40	Nein	Die maximale Anzahl von Blueprints pro Projekt für Dokumente
(Datenautomatisierung) Maximale Anzahl von Blueprints pro Projekt (Bilder)	Jede unterstützte Region: 1	Nein	Die maximale Anzahl von Blueprints pro Projekt für Bilder
(Datenautomatisierung) Maximale Anzahl von Blueprints pro Projekt (Videos)	Jede unterstützte Region: 1	Nein	Die maximale Anzahl von Blueprints pro Projekt für Videos
(Datenautomatisierung) Maximale JSON-Blueprint-Größe (Zeichen)	Jede unterstützte Region: 100 000	Nein	Die maximale Größe von JSON in Zeichen
(Datenautomatisierung) Maximale Ebenen der Feldhierarchie	Jede unterstützte Region: 1	Nein	Die maximale Anzahl der Ebenen der Feldhierarchie
(Datenautomatisierung) Maximale Anzahl von Seiten pro Dokument	Jede unterstützte Region: 3 000	Nein	Die maximale Anzahl von Seiten pro Dokument
(Datenautomatisierung) Maximale Auflösung	Jede unterstützte Region: 8 000	Nein	Die maximale Auflösung für Bilder
(Datenautomatisierung) Maximale Größe der Audiodatei (MB)	Jede unterstützte Region: 2 048	Nein	Die maximale Dateigröße für Audio
(Datenautomatisierung) Maximale Audiolänge (Minuten)	Jede unterstützte Region: 240	Nein	Die maximale Länge für Audio in Minuten
(Datenautomatisierung) Maximale Größe der Dokumentdatei (MB)	Jede unterstützte Region: 500	Nein	Die maximale Dateigröße
(Datenautomatisierung) Maximale Bilddateigröße (MB)	Jede unterstützte Region: 5	Nein	Die maximale Dateigröße für Bilder
(Datenautomatisierung) Maximale Länge des Befehlsfeldes für Audio-Blueprint — (Zeichen)	Jede unterstützte Region: 500	Ja	Die maximale Länge des Befehlsfeldes für den Audio-Blueprint in Zeichen
(Datenautomatisierung) Maximale Anzahl von Blueprints pro Start-Inferenzanforderung (Audios)	Jede unterstützte Region: 1	Nein	Die maximale Anzahl von Inline-Blueprints in der Start-Inferenzanforderung
(Datenautomatisierung) Maximale Anzahl von Blueprints pro Start-Inferenzanforderung (Dokumente)	Jede unterstützte Region: 10	Nein	Die maximale Anzahl von Inline-Blueprints in der Start-Inferenzanforderung
(Datenautomatisierung) Maximale Anzahl von Blueprints pro Start-Inferenzanforderung (Bilder)	Jede unterstützte Region: 1	Nein	Die maximale Anzahl von Inline-Blueprints in der Start-Inferenzanforderung
(Datenautomatisierung) Maximale Anzahl von Blueprints pro Start-Inferenzanforderung (Videos)	Jede unterstützte Region: 1	Nein	Die maximale Anzahl von Inline-Blueprints in der Start-Inferenzanforderung
(Datenautomatisierung) Maximale Anzahl von Listenfeldern pro Blueprint	Jede unterstützte Region: 15	Nein	Die maximale Anzahl von Listenfeldern pro Blueprint
(Datenautomatisierung) Maximale Videodateigröße (MB)	Jede unterstützte Region: 10 240	Nein	Die maximale Dateigröße für Videos
(Datenautomatisierung) Maximale Videolänge (Minuten)	Jede unterstützte Region: 240	Nein	Die maximale Länge für Videos in Minuten
(Datenautomatisierung) Minimale Audio-Abtastrate (Hz)	Jede unterstützte Region: 8 000	Nein	Die minimale Audio-Samplerate
(Datenautomatisierung) Minimale Audiolänge (Millisekunden)	Jede unterstützte Region: 500	Nein	Die Mindestlänge für Audio in Millisekunden
(Evaluierung) Anzahl gleichzeitiger Jobs zur automatischen Modellevaluierung	Jede unterstützte Region: 20	Nein	Die maximale Anzahl von Aufträgen zur automatischen Modellevaluierung, die Sie in diesem Konto in der aktuellen Region gleichzeitig angeben können.
(Evaluierung) Anzahl gleichzeitiger Modellevaluierungsjobs, bei denen menschliche Arbeitskräfte eingesetzt werden	Jede unterstützte Region: 10	Nein	Die maximale Anzahl von Modellevaluierungsjobs, bei denen menschliche Arbeitskräfte eingesetzt werden, die Sie in diesem Konto in der aktuellen Region gleichzeitig angeben können.
(Evaluierung) Anzahl der benutzerdefinierten Metriken	Jede unterstützte Region: 10	Nein	Die maximale Anzahl von benutzerdefinierten Metriken, die Sie in einem Modellevaluierungsjob angeben können, bei dem menschliche Mitarbeiter eingesetzt werden.
(Evaluierung) Anzahl von Datensätzen mit benutzerdefinierten Eingabeaufforderungen bei einer Evaluierung eines Modells am Menschen	Jede unterstützte Region: 1	Nein	Die maximale Anzahl von Datensätzen mit benutzerdefinierten Eingabeaufforderungen, die Sie in einem Auftrag zur Evaluierung eines menschlichen Modells in diesem Konto in der aktuellen Region angeben können.
(Evaluierung) Anzahl von Datensätzen pro Auftrag	Jede unterstützte Region: 5	Nein	Die maximale Anzahl von Datensätzen, die Sie in einem automatisierten Modellevaluierungsjob angeben können. Dies umfasst sowohl benutzerdefinierte als auch integrierte Prompt-Datensätze.
(Evaluierung) Anzahl der Bewertungsaufträge	Jede unterstützte Region: 5 000	Nein	Die maximale Anzahl von Modellevaluierungsjobs, die Sie in diesem Konto in der aktuellen Region erstellen können.
(Bewertung) Anzahl der Metriken pro Datensatz	Jede unterstützte Region: 3	Nein	Die maximale Anzahl von Metriken, die Sie pro Datensatz in einem automatisierten Modellevaluierungsjob angeben können. Dies umfasst sowohl benutzerdefinierte als auch integrierte Metriken.
(Bewertung) Anzahl der Modelle in einem Modellevaluierungsjob, bei dem menschliche Mitarbeiter eingesetzt werden	Jede unterstützte Region: 2	Nein	Die maximale Anzahl von Modellen, die Sie in einem Modellevaluierungsjob angeben können, bei dem menschliche Arbeitskräfte verwendet werden.
(Evaluierung) Anzahl der Modelle im Rahmen einer automatisierten Modellevaluierung	Jede unterstützte Region: 1	Nein	Die maximale Anzahl von Modellen, die Sie in einem automatisierten Modellevaluierungsjob angeben können.
(Evaluierung) Anzahl der Eingabeaufforderungen in einem Datensatz mit benutzerdefinierten Eingabeaufforderungen	Jede unterstützte Region: 1 000	Nein	Die maximale Anzahl von Eingabeaufforderungen, die ein Datensatz mit benutzerdefinierten Eingabeaufforderungen enthalten kann.
(Evaluierung) Größe der Eingabeaufforderung	Jede unterstützte Region: 4	Nein	Die maximale Größe (in KB) einer einzelnen Eingabeaufforderung in einem benutzerdefinierten Prompt-Datensatz.
(Bewertung) Aufgabenzeit für Mitarbeiter	Jede unterstützte Region: 30	Nein	Die maximale Zeitdauer (in Tagen), die einem Mitarbeiter zur Erledigung von Aufgaben zur Verfügung stehen kann.
(Flows) Agentenknoten pro Flow	Jede unterstützte Region: 20	Nein	Die maximale Anzahl von Agentknoten.
(Flows) Collector-Knoten pro Flow	Jede unterstützte Region: 1	Nein	Die maximale Anzahl von Collector-Knoten.
(Flows) Konditionieren Sie Knoten pro Flow	Jede unterstützte Region: 5	Nein	Die maximale Anzahl von Bedingungsknoten.
(Flüsse) Bedingungen pro Bedingungsknoten	Jede unterstützte Region: 5	Nein	Die maximale Anzahl von Bedingungen pro Bedingungsknoten.
(Flows) CreateFlow Anfragen pro Sekunde	Jede unterstützte Region: 2	Nein	Die maximale Anzahl von CreateFlow Anfragen pro Sekunde.
(Flows) CreateFlowAlias Anfragen pro Sekunde	Jede unterstützte Region: 2	Nein	Die maximale Anzahl von CreateFlowAlias Anfragen pro Sekunde.
(Flows) CreateFlowVersion Anfragen pro Sekunde	Jede unterstützte Region: 2	Nein	Die maximale Anzahl von CreateFlowVersion Anfragen pro Sekunde.
(Flows) DeleteFlow Anfragen pro Sekunde	Jede unterstützte Region: 2	Nein	Die maximale Anzahl von DeleteFlow Anfragen pro Sekunde.
(Flows) DeleteFlowAlias Anfragen pro Sekunde	Jede unterstützte Region: 2	Nein	Die maximale Anzahl von DeleteFlowAlias Anfragen pro Sekunde.
(Flows) DeleteFlowVersion Anfragen pro Sekunde	Jede unterstützte Region: 2	Nein	Die maximale Anzahl von DeleteFlowVersion Anfragen pro Sekunde.
(Flows) Flow-Aliase pro Flow	Jede unterstützte Region: 10	Nein	Die maximale Anzahl von Flow-Aliasen.
(Flows) Flow-Ausführungen pro Konto	Jede unterstützte Region: 1 000	Ja	Die maximale Anzahl von Flow-Ausführungen pro Konto.
(Flows) Flow-Versionen pro Flow	Jede unterstützte Region: 10	Nein	Die maximale Anzahl von Flow-Versionen.
(Flows) Flows pro Konto	Jede unterstützte Region: 100	Yes (Ja)	Die maximale Anzahl von Flows pro Konto.
(Flows-) GetFlow Anfragen pro Sekunde	Jede unterstützte Region: 10	Nein	Die maximale Anzahl von GetFlow Anfragen pro Sekunde.
(Flows) GetFlowAlias Anfragen pro Sekunde	Jede unterstützte Region: 10	Nein	Die maximale Anzahl von GetFlowAlias Anfragen pro Sekunde.
(Flows) GetFlowVersion Anfragen pro Sekunde	Jede unterstützte Region: 10	Nein	Die maximale Anzahl von GetFlowVersion Anfragen pro Sekunde.
(Flows) Inline-Codeknoten pro Flow	Jede unterstützte Region: 5	Nein	Die maximale Anzahl von Inline-Codeknoten pro Flow.
(Flows) Eingabeknoten pro Flow	Jede unterstützte Region: 1	Nein	Die maximale Anzahl von Flow-Eingabeknoten.
(Flows) Iterator-Knoten pro Flow	Jede unterstützte Region: 1	Nein	Die maximale Anzahl von Iteratorknoten.
(Flows) Knotenpunkte in der Wissensdatenbank pro Flow	Jede unterstützte Region: 20	Nein	Die maximale Anzahl von Knotenpunkten in der Wissensdatenbank.
(Flows) Lambda-Funktionsknoten pro Flow	Jede unterstützte Region: 20	Nein	Die maximale Anzahl von Lambda-Funktionsknoten.
(Flows) Lex-Knoten pro Flow	Jede unterstützte Region: 5	Nein	Die maximale Anzahl von Lex-Knoten.
(Flows) ListFlowAliases Anfragen pro Sekunde	Jede unterstützte Region: 10	Nein	Die maximale Anzahl von ListFlowAliases Anfragen pro Sekunde.
(Flows) ListFlowVersions Anfragen pro Sekunde	Jede unterstützte Region: 10	Nein	Die maximale Anzahl von ListFlowVersions Anfragen pro Sekunde.
(Flows) ListFlows Anfragen pro Sekunde	Jede unterstützte Region: 10	Nein	Die maximale Anzahl von ListFlows Anfragen pro Sekunde.
(Flows) Ausgabeknoten pro Flow	Jede unterstützte Region: 20	Nein	Die maximale Anzahl von Flow-Ausgabeknoten.
(Flows-) PrepareFlow Anfragen pro Sekunde	Jede unterstützte Region: 2	Nein	Die maximale Anzahl von PrepareFlow Anfragen pro Sekunde.
(Flows) Prompt Knoten pro Flow	Jede unterstützte Region: 20	Ja	Die maximale Anzahl von Prompt-Knoten.
(Flows) S3-Abrufknoten pro Flow	Jede unterstützte Region: 10	Nein	Die maximale Anzahl von S3-Abrufknoten.
(Flows) S3-Speicherknoten pro Flow	Jede unterstützte Region: 10	Nein	Die maximale Anzahl von S3-Speicherknoten.
(Flows) Gesamtzahl der Knoten pro Flow	Jede unterstützte Region: 40	Nein	Die maximale Anzahl von Knoten in einem Flow.
(Flows) UpdateFlow Anfragen pro Sekunde	Jede unterstützte Region: 2	Nein	Die maximale Anzahl von UpdateFlow Anfragen pro Sekunde.
(Flows) UpdateFlowAlias Anfragen pro Sekunde	Jede unterstützte Region: 2	Nein	Die maximale Anzahl von UpdateFlowAlias Anfragen pro Sekunde.
(Flows) ValidateFlowDefinition Anfragen pro Sekunde	Jede unterstützte Region: 2	Nein	Die maximale Anzahl von ValidateFlowDefinition Anfragen pro Sekunde.
(Guardrails) Richtlinien für automatisiertes Denken pro Leitplanke	Jede unterstützte Region: 2	Nein	Die maximale Anzahl von Richtlinien für automatisiertes Denken pro Leitplanke.
(Guardrails) Maximale Eingabegröße für Inhaltsrichtlinien in Texteinheiten (Stufe Classic)	us-east-1: 1 000 us-east-2: 1 000 us-west-2: 1 000 ap-northeast-1: 1 000 ap-northeast-2:1.000 ap-south-1:1.000 ap-southeast-1:1.000 ap-southeast-2: 1 000 eu-central-1: 1 000 eu-south-1:25 EU-West-3:25 sa-east-1:25 Jede der anderen unterstützten Regionen: 106	Ja	Die maximale Größe des Eingabetextes, gemessen in Texteinheiten, der für Inhaltsfilter verarbeitet werden kann. Diese Beschränkung gilt zwar für die klassische Stufe, wir empfehlen jedoch aufgrund der überlegenen Stabilität, der zusätzlichen Funktionen und der mehrsprachigen Unterstützung eine Migration zur Standardstufe.
(Guardrails) Maximale Eingabegröße für Inhaltsrichtlinien in Texteinheiten (Stufe Standard — empfohlen)	us-east-1: 1 000 us-east-2: 1 000 us-west-2: 1 000 ap-northeast-1:500 ap-northeast-2:1.000 ap-south-1:500 ap-southeast-1:1.000 ap-southeast-2:400 eu-central-1:500 eu-south-1:25 EU-West-3:25 Jede der anderen unterstützten Regionen: 106	Ja	Die maximale Größe des Eingabetextes, gemessen in Texteinheiten, der für Inhaltsfilter verarbeitet werden kann. Dies gilt für die Standardstufe, die empfohlen wird.
(Guardrails) Maximale Eingabegröße in Texteinheiten für die Richtlinie zur kontextuellen Erdung	Jede unterstützte Region: 106	Ja	Die maximale Größe des Eingabetextes, gemessen in Texteinheiten, der durch Contextual Grounding Policies verarbeitet werden kann
(Leitplanken) Länge der kontextbezogenen Grundabfrage in Texteinheiten	Jede unterstützte Region: 1	Nein	Die maximale Länge der Abfrage für die kontextuelle Erdung in Texteinheiten
(Leitplanken) Länge der Antwort auf die kontextuelle Erdung in Texteinheiten	Jede unterstützte Region: 5	Nein	Die maximale Länge der Antwort für die kontextuelle Erdung in Texteinheiten
(Leitplanken) Länge der kontextuellen Erdungsquelle in Texteinheiten	us-east-1: 100 us-west-2: 100 Jede der anderen unterstützten Regionen: 50	Nein	Die maximale Länge der Erdungsquelle für die kontextuelle Erdung in Texteinheiten
(Guardrails) Beispielsätze pro Thema	Jede unterstützte Region: 5	Nein	Die maximale Anzahl von Themenbeispielen, die pro Thema aufgenommen werden können
(Leitplanken) Leitplanken pro Konto	Jede unterstützte Region: 100	Nein	Die maximale Anzahl von Leitplanken in einem Konto
(Guardrails) Burst-Rate für Texteinheiten zur On-demand ApplyGuardrail Inhaltsfilterrichtlinie (Stufe Classic)	us-east-1: 1 000 us-east-2: 1 000 us-west-2: 1 000 ap-northeast-1: 1 000 ap-northeast-2:1.000 ap-south-1:1.000 ap-southeast-1:1.000 ap-southeast-2: 1 000 eu-central-1: 1 000 Jede der anderen unterstützten Regionen: 25	Nein	Die maximale Anzahl von Texteinheiten in einem Burst, die für Inhaltsfilter verarbeitet werden können. Diese Beschränkung gilt zwar für die klassische Stufe, wir empfehlen jedoch aufgrund der überlegenen Stabilität, der zusätzlichen Funktionen und der mehrsprachigen Unterstützung eine Migration zur Standard-Stufe.
(Guardrails) Burst-Rate für On-demand ApplyGuardrail Inhaltsfilterrichtlinien in Texteinheiten (Stufe Standard — empfohlen)	us-east-1: 1 000 us-east-2: 1 000 us-west-2: 1 000 ap-northeast-1:500 ap-northeast-2:1.000 ap-south-1:500 ap-southeast-1:1.000 ap-southeast-2:400 eu-central-1:500 Jede der anderen unterstützten Regionen: 25	Nein	Die maximale Anzahl von Texteinheiten in einem Burst, die für Inhaltsfilter verarbeitet werden können. Dies gilt für die Standardstufe, die empfohlen wird.
(Guardrails) Texteinheiten pro Sekunde für die On-demand ApplyGuardrail Inhaltsfilterrichtlinie (Stufe Classic)	us-east-1: 200 us-west-2: 200 Jede der anderen unterstützten Regionen: 25	Ja	Die maximale Anzahl von Texteinheiten pro Sekunde, die für Inhaltsfilter verarbeitet werden können. Diese Beschränkung gilt zwar für die klassische Stufe, wir empfehlen jedoch aufgrund der überlegenen Stabilität, der zusätzlichen Funktionen und der mehrsprachigen Unterstützung eine Migration zur Standardstufe.
(Guardrails) Texteinheiten pro Sekunde zur On-demand ApplyGuardrail Inhaltsfilterrichtlinie (Stufe Standard — empfohlen)	us-east-1: 200 us-east-2:200 us-west-1:200 us-west-2: 200 ap-northeast-1:50 ap-northeast-2: 100 ap-south-1:50 ap-southeast-1: 100 eu-central-1:50 Jede der anderen unterstützten Regionen: 25	Ja	Die maximale Anzahl von Texteinheiten pro Sekunde, die für Inhaltsfilter verarbeitet werden können. Dies gilt für die Standardstufe, die empfohlen wird.
(Guardrails) On-demand ApplyGuardrail Abgelehnte Texteinheiten für Themenrichtlinien, Burst-Rate (Stufe Classic)	us-east-1: 200 us-west-2: 200 Jede der anderen unterstützten Regionen: 25	Nein	Die maximale Anzahl von Texteinheiten in einem Block, die für abgelehnte Themen verarbeitet werden können. Diese Beschränkung gilt zwar für die klassische Stufe, wir empfehlen jedoch aufgrund der überlegenen Stabilität, der zusätzlichen Funktionen und der mehrsprachigen Unterstützung eine Migration zur Standardstufe.
(Guardrails) Abgelehnte Texteinheiten zum On-demand ApplyGuardrail Thema, Anzahl der Texteinheiten (Stufe „Standard“ — empfohlen)	us-east-1: 1 000 us-east-2: 1 000 us-west-2: 1 000 ap-northeast-1:500 ap-northeast-2:1.000 ap-south-1:500 ap-southeast-1:1.000 ap-southeast-2:400 eu-central-1:500 Jede der anderen unterstützten Regionen: 25	Nein	Die maximale Anzahl von Texteinheiten in einem Burst, die für abgelehnte Themen verarbeitet werden können. Dies gilt für die Standardstufe, die empfohlen wird.
(Guardrails) Texteinheiten pro Sekunde für die Themenrichtlinie On-demand ApplyGuardrail verweigert (Stufe Classic)	us-east-1:50 US-West-2:50 Jede der anderen unterstützten Regionen: 25	Ja	Die maximale Anzahl von Texteinheiten pro Sekunde, die für abgelehnte Themen verarbeitet werden können. Diese Beschränkung gilt zwar für die klassische Stufe, wir empfehlen jedoch aufgrund der überlegenen Stabilität, der zusätzlichen Funktionen und der mehrsprachigen Unterstützung eine Migration zur Standardstufe.
(Guardrails) Texteinheiten pro Sekunde zur Themenrichtlinie On-demand ApplyGuardrail verweigert (Stufe Standard — empfohlen)	us-east-1: 200 us-west-2: 200 Jede der anderen unterstützten Regionen: 25	Ja	Die maximale Anzahl von Texteinheiten pro Sekunde, die für abgelehnte Themen verarbeitet werden können. Dies gilt für die Standardstufe, die empfohlen wird.
(Guardrails) Filterrichtlinie für On-demand ApplyGuardrail sensible Informationen, Texteinheiten, Burst-Rate	us-east-1: 1 000 us-east-2: 1 000 us-west-2: 1 000 ap-northeast-1: 1 000 ap-northeast-2:1.000 ap-south-1:1.000 ap-southeast-1:1.000 ap-southeast-2: 1 000 eu-central-1: 1 000 Jede der anderen unterstützten Regionen: 25	Nein	Die maximale Anzahl von Texteinheiten in einem Burst, die für Filter mit vertraulichen Informationen verarbeitet werden können.
(Guardrails) Richtlinien zum Filtern On-demand ApplyGuardrail vertraulicher Informationen (Texteinheiten pro Sekunde)	us-east-1: 500 us-east-2:100 us-west-1:50 us-west-2: 500 ap-northeast-1:500 ap-northeast-2: 100 ap-south-1:200 ap-southeast-1: 100 ca-central-1:250 eu-central-1:500 Jede der anderen unterstützten Regionen: 25	Ja	Die maximale Anzahl von Texteinheiten pro Sekunde, die für Filter für vertrauliche Informationen verarbeitet werden können.
(Guardrails) On-demand ApplyGuardrail Textfilterrichtlinie, Burst-Rate für Texteinheiten	us-east-1: 1 000 us-east-2: 1 000 us-west-2: 1 000 ap-northeast-1: 1 000 ap-northeast-2:1.000 ap-south-1:1.000 ap-southeast-1:1.000 ap-southeast-2: 1 000 eu-central-1: 1 000 Jede der anderen unterstützten Regionen: 25	Nein	Die maximale Anzahl von Texteinheiten in einem Burst, die für Wortfilter verarbeitet werden können.
(Guardrails) Texteinheiten On-demand ApplyGuardrail pro Sekunde gemäß der Wortfilterrichtlinie	us-east-1: 500 us-east-2:500 us-west-1:500 us-west-2: 500 ap-northeast-1:500 ap-northeast-2:500 ap-south-1:500 ap-southeast-1:500 eu-central-1:500 Jede der anderen unterstützten Regionen: 25	Ja	Die maximale Anzahl von Texteinheiten pro Sekunde, die für Wortfilter verarbeitet werden können.
(Guardrails) On-demand ApplyGuardrail Kontextuelle Erdungsrichtlinie für Texteinheiten, Burst-Rate	Jede unterstützte Region: 106	Nein	Die maximale Anzahl von Texteinheiten in einem Burst, die für kontextuelles Grounding verarbeitet werden können.
(Guardrails) Texteinheiten pro Sekunde für die On-demand ApplyGuardrail kontextuelle Erdung	Jede unterstützte Region: 106	Ja	Die maximale Anzahl von Texteinheiten pro Sekunde, die für kontextuelles Grounding verarbeitet werden können.
Burst-Rate bei Anfragen (Guardrails) On-demand ApplyGuardrail	us-east-1: 100 us-east-2:100 us-west-1:100 us-west-2: 100 ap-northeast-1:100 ap-northeast-2: 100 ap-south-1: 100 ap-southeast-1: 100 eu-central-1: 100 Jede der anderen unterstützten Regionen: 25	Nein	Die maximale Anzahl von ApplyGuardrail API-Aufrufen, die Sie in einem Burst senden können.
(Guardrails) On-demand ApplyGuardrail -Anfragen pro Sekunde	us-east-1: 100 us-east-2:100 us-west-1:100 us-west-2: 100 ap-northeast-1:100 ap-northeast-2: 100 ap-south-1: 100 ap-southeast-1: 100 eu-central-1: 100 Jede der anderen unterstützten Regionen: 25	Ja	Die maximal zulässige Anzahl von ApplyGuardrail API-Aufrufen pro Sekunde
Burst-Rate der On-demand InvokeGuardrailChecks Anfragen (Guardrails)	Jede unterstützte Region: 1 500	Nein	Die maximale Anzahl von InvokeGuardrailChecks API-Aufrufen, die Sie in einem Burst senden können
(Guardrails) On-demand InvokeGuardrailChecks Anfragen pro Minute	Jede unterstützte Region: 1 500	Ja	Die maximal zulässige Anzahl von InvokeGuardrailChecks API-Aufrufen pro Minute
(Guardrails) Regex-Entitäten im Filter für vertrauliche Informationen	Jede unterstützte Region: 30	Nein	Die maximale Anzahl von Guardrail-Filter-Regexes, die in eine Richtlinie für vertrauliche Informationen aufgenommen werden können
(Guardrails) Länge der Regex in Zeichen	Jede unterstützte Region: 500	Nein	Die maximale Länge eines regulären Leitplankenfilters in Zeichen
(Guardrails) Maximale Eingabegröße in Texteinheiten für die Richtlinie für vertrauliche Informationen	us-east-1: 1 000 us-east-2: 1 000 us-west-2: 1 000 ap-northeast-1: 1 000 ap-northeast-2:1.000 ap-south-1:1.000 ap-southeast-1:1.000 ap-southeast-2: 1 000 eu-central-1: 1 000 Jede der anderen unterstützten Regionen: 106	Ja	Die maximale Größe des Eingabetextes, gemessen in Texteinheiten, der mit Filterrichtlinien für vertrauliche Informationen verarbeitet werden kann
(Guardrails) Maximale Eingabegröße der Themenrichtlinie in Texteinheiten (Stufe Classic)	us-east-1: 200 us-west-2: 200 ap-southeast-1:25 eu-south-1:25 EU-West-3:25 sa-east-1:25 Jede der anderen unterstützten Regionen: 106	Ja	Die maximale Größe des Eingabetextes, gemessen in Texteinheiten, der für abgelehnte Themen verarbeitet werden kann. Diese Beschränkung gilt zwar für die klassische Stufe, wir empfehlen jedoch aufgrund der überlegenen Stabilität, der zusätzlichen Funktionen und der mehrsprachigen Unterstützung eine Migration zur Standardstufe.
(Guardrails) Maximale Eingabegröße für Themenrichtlinien in Texteinheiten (Stufe Standard — empfohlen)	us-east-1: 1 000 us-east-2: 1 000 us-west-2: 1 000 ap-northeast-1:500 ap-northeast-2:1.000 ap-south-1:500 ap-southeast-1:1.000 ap-southeast-2:400 eu-central-1:500 eu-south-1:25 EU-West-3:25 Jede der anderen unterstützten Regionen: 106	Ja	Die maximale Größe des Eingabetextes, gemessen in Texteinheiten, der für abgelehnte Themen verarbeitet werden kann. Dies gilt für die Standardstufe, die empfohlen wird.
(Leitplanken) Themen pro Leitplanke	Jede unterstützte Region: 30	Nein	Die maximale Anzahl von Themen, die in allen Richtlinien für Leitplanken definiert werden können
(Leitplanken) Versionen pro Leitplanke	Jede unterstützte Region: 20	Nein	Die maximale Anzahl von Versionen, die eine Leitplanke haben kann
(Leitplanken) Wortlänge in Zeichen	Jede unterstützte Region: 100	Nein	Die maximale Länge eines Worts in einer Liste blockierter Wörter in Zeichen
(Guardrails) Maximale Eingabegröße für Word-Richtlinien in Texteinheiten	us-east-1: 1 000 us-east-2: 1 000 us-west-2: 1 000 ap-northeast-1: 1 000 ap-northeast-2:1.000 ap-south-1:1.000 ap-southeast-1:1.000 ap-southeast-2: 1 000 eu-central-1: 1 000 Jede der anderen unterstützten Regionen: 106	Ja	Die maximale Größe des Eingabetextes, gemessen in Texteinheiten, der mit Word-Filterrichtlinien verarbeitet werden kann
(Guardrails) Richtlinie „Wörter pro Wort“	Jede unterstützte Region: 10 000	Nein	Die maximale Anzahl von Wörtern, die in eine Liste gesperrter Wörter aufgenommen werden können
(Wissensdatenbanken) Gleichzeitige DeleteKnowledgeBaseDocuments Anfragen IngestKnowledgeBaseDocuments und Anfragen pro Konto	Jede unterstützte Region: 10	Nein	Die maximale Anzahl von IngestKnowledgeBaseDocuments DeleteKnowledgeBaseDocuments AND-Anfragen, die gleichzeitig in einem Konto ausgeführt werden können.
(Wissensdatenbanken) Gleichzeitige Aufnahmeaufträge pro Konto	Jede unterstützte Region: 5	Nein	Die maximale Anzahl von Aufnahmeaufträgen, die gleichzeitig in einem Konto ausgeführt werden können.
(Wissensdatenbanken) Gleichzeitige Aufnahmeaufträge pro Datenquelle	Jede unterstützte Region: 1	Nein	Die maximale Anzahl von Aufnahmeaufträgen, die gleichzeitig für eine Datenquelle ausgeführt werden können.
(Wissensdatenbanken) Gleichzeitige Aufnahmeaufträge pro Wissensdatenbank	Jede unterstützte Region: 1	Nein	Die maximale Anzahl von Aufnahmeaufträgen, die für eine Wissensdatenbank gleichzeitig ausgeführt werden können.
(Wissensdatenbanken) CreateDataSource -Anfragen pro Sekunde	Jede unterstützte Region: 2	Nein	Die maximale Anzahl von CreateDataSource API-Anfragen pro Sekunde.
(Wissensdatenbanken) CreateKnowledgeBase Anfragen pro Sekunde	Jede unterstützte Region: 2	Nein	Die maximale Anzahl von CreateKnowledgeBase API-Anfragen pro Sekunde.
(Wissensdatenbanken) Datenquellen pro Wissensdatenbank	Jede unterstützte Region: 5	Nein	Die maximale Anzahl von Datenquellen pro Wissensdatenbank.
(Wissensdatenbanken) DeleteDataSource Anfragen pro Sekunde	Jede unterstützte Region: 2	Nein	Die maximale Anzahl von DeleteDataSource API-Anfragen pro Sekunde.
(Wissensdatenbanken) DeleteKnowledgeBase Anfragen pro Sekunde	Jede unterstützte Region: 2	Nein	Die maximale Anzahl von DeleteKnowledgeBase API-Anfragen pro Sekunde.
(Wissensdatenbanken) DeleteKnowledgeBaseDocuments Anfragen pro Sekunde	Jede unterstützte Region: 5	Nein	Die maximale Anzahl von DeleteKnowledgeBaseDocuments API-Anfragen pro Sekunde.
(Wissensdatenbanken) Dateien, die pro Aufnahmejob hinzugefügt oder aktualisiert werden sollen	Jede unterstützte Region: 5 000 000	Nein	Die maximale Anzahl neuer und aktualisierter Dateien, die pro Aufnahmejob aufgenommen werden können.
(Wissensdatenbanken) Zu löschende Dateien pro Aufnahme-Job	Jede unterstützte Region: 5 000 000	Nein	Die maximale Anzahl von Dateien, die pro Aufnahmeauftrag gelöscht werden können.
(Wissensdatenbanken) Dateien, die pro Auftrag aufgenommen werden sollen. IngestKnowledgeBaseDocuments	Jede unterstützte Region: 25	Nein	Die maximale Anzahl von Dokumenten, die pro IngestKnowledgeBaseDocuments Anfrage aufgenommen werden können.
(Wissensdatenbanken) GenerateQuery Anfragen pro Sekunde	Jede unterstützte Region: 2	Nein	Die maximale Anzahl von GenerateQuery API-Anfragen pro Sekunde.
(Wissensdatenbanken) GetDataSource Anfragen pro Sekunde	Jede unterstützte Region: 10	Nein	Die maximale Anzahl von GetDataSource API-Anfragen pro Sekunde.
(Wissensdatenbanken) GetIngestionJob Anfragen pro Sekunde	Jede unterstützte Region: 10	Nein	Die maximale Anzahl von GetIngestionJob API-Anfragen pro Sekunde.
(Wissensdatenbanken) GetKnowledgeBase Anfragen pro Sekunde	Jede unterstützte Region: 10	Nein	Die maximale Anzahl von GetKnowledgeBase API-Anfragen pro Sekunde.
(Wissensdatenbanken) GetKnowledgeBaseDocuments Anfragen pro Sekunde	Jede unterstützte Region: 5	Nein	Die maximale Anzahl von GetKnowledgeBaseDocuments API-Anfragen pro Sekunde.
(Wissensdatenbanken) IngestKnowledgeBaseDocuments Anfragen pro Sekunde	Jede unterstützte Region: 5	Nein	Die maximale Anzahl von IngestKnowledgeBaseDocuments API-Anfragen pro Sekunde.
(Wissensdatenbanken) IngestKnowledgeBaseDocuments Gesamtgröße der Nutzlast	Jede unterstützte Region: 6	Nein	Die maximale Größe (in MB) der gesamten Nutzlast in einer IngestKnowledgeBaseDocuments Anfrage.
(Wissensdatenbanken) Dateigröße des Aufnahmeauftrags mit Textinhalt	Jede unterstützte Region: 50	Nein	Die maximale Größe (in MB) einer Datei mit Textinhalt (z. B. TXT-, PDF- oder DOCX-Dateien) in einem Aufnahme-Job.
(Wissensdatenbanken) Größe des Aufnahmeauftrags	Jede unterstützte Region: 100	Nein	Die maximale Größe (in GB) eines Aufnahme-Jobs.
(Wissensdatenbanken) Wissensdatenbanken pro Konto	Jede unterstützte Region: 100	Nein	Die maximale Anzahl von Wissensdatenbanken pro Konto.
(Wissensdatenbanken) ListDataSources Anfragen pro Sekunde	Jede unterstützte Region: 10	Nein	Die maximale Anzahl von ListDataSources API-Anfragen pro Sekunde.
(Wissensdatenbanken) ListIngestionJobs Anfragen pro Sekunde	Jede unterstützte Region: 10	Nein	Die maximale Anzahl von ListIngestionJobs API-Anfragen pro Sekunde.
(Wissensdatenbanken) ListKnowledgeBaseDocuments Anfragen pro Sekunde	Jede unterstützte Region: 5	Nein	Die maximale Anzahl von ListKnowledgeBaseDocuments API-Anfragen pro Sekunde.
(Wissensdatenbanken) ListKnowledgeBases Anfragen pro Sekunde	Jede unterstützte Region: 10	Nein	Die maximale Anzahl von ListKnowledgeBases API-Anfragen pro Sekunde.
(Wissensdatenbanken) Maximale Anzahl von Dateien für den BDA-Parser	Jede unterstützte Region: 1 000	Nein	Die maximale Anzahl von Dateien, die mit Amazon Bedrock Data Automation als Parser verwendet werden können.
(Wissensdatenbanken) Maximale Anzahl von Dateien für Foundation Models als Parser	Jede unterstützte Region: 1 000	Nein	Die maximale Anzahl von Dateien, die mit Foundation Models als Parser verwendet werden können.
(Wissensdatenbanken) Anfragen pro Sekunde neu bewerten	Jede unterstützte Region: 10	Nein	Die maximale Anzahl von Rerank-API-Anfragen pro Sekunde.
(Wissensdatenbanken) Anfragen pro Sekunde abrufen	Jede unterstützte Region: 20	Nein	Die maximale Anzahl von Retrieve-API-Anfragen pro Sekunde.
(Knowledge Bases) RetrieveAndGenerate -Anfragen pro Sekunde	Jede unterstützte Region: 20	Nein	Die maximale Anzahl von RetrieveAndGenerate API-Anfragen pro Sekunde.
(Wissensdatenbanken) RetrieveAndGenerateStream Anfragen pro Sekunde	Jede unterstützte Region: 20	Nein	Die maximale Anzahl von RetrieveAndGenerateStream API-Anfragen pro Sekunde.
(Wissensdatenbanken) StartIngestionJob Anfragen pro Sekunde	Jede unterstützte Region: 0,1	Nein	Die maximale Anzahl von StartIngestionJob API-Anfragen pro Sekunde.
(Wissensdatenbanken) UpdateDataSource Anfragen pro Sekunde	Jede unterstützte Region: 2	Nein	Die maximale Anzahl von UpdateDataSource API-Anfragen pro Sekunde.
(Wissensdatenbanken) UpdateKnowledgeBase Anfragen pro Sekunde	Jede unterstützte Region: 2	Nein	Die maximale Anzahl von UpdateKnowledgeBase API-Anfragen pro Sekunde.
(Wissensdatenbanken) Größe der Benutzerabfrage	Jede unterstützte Region: 1 000	Nein	Die maximale Größe (in Zeichen) einer Benutzerabfrage.
(Verwaltete Wissensdatenbanken) AgenticRetrieveStream Anfragen pro Sekunde pro Konto	Jede unterstützte Region: 1	Nein	Die maximale Anzahl von AgenticRetrieveStream API-Anfragen pro Sekunde pro Konto für verwaltete KBs.
Größe der AgenticRetrieveStream Benutzerabfrage (verwaltete Wissensdatenbanken)	Jede unterstützte Region: 10 000	Nein	Die maximale Größe (in Zeichen) einer Benutzerabfrage AgenticRetrieveStream für verwaltete KBs.
(Verwaltete Wissensdatenbanken) Gleichzeitige Aufnahmeaufträge pro Wissensdatenbank	Jede unterstützte Region: 50	Nein	Die maximale Anzahl gleichzeitiger Aufnahmeaufträge pro verwalteter KB.
(Verwaltete Wissensdatenbanken) Datenquellen pro Wissensdatenbank	Jede unterstützte Region: 200	Nein	Die maximale Anzahl von Datenquellen pro verwalteter KB.
(Verwaltete Wissensdatenbanken) DeleteKnowledgeBaseDocuments Anfragen pro Sekunde	Jede unterstützte Region: 10	Nein	Die maximale Anzahl von DeleteKnowledgeBaseDocuments API-Anfragen pro Sekunde für verwaltete KBs.
(Verwaltete Wissensdatenbanken) DeleteResourcePolicy Anfragen pro Sekunde	Jede unterstützte Region: 5	Nein	Die maximale Anzahl von DeleteResourcePolicy API-Anfragen pro Sekunde für verwaltete KBs.
(Verwaltete Wissensdatenbanken) Dateien, die pro Anfrage aufgenommen werden IngestKnowledgeBaseDocuments	Jede unterstützte Region: 10	Nein	Die maximale Anzahl von Dateien, die pro IngestKnowledgeBaseDocuments API-Anforderung für verwaltete KBs aufgenommen werden können.
(Verwaltete Wissensdatenbanken) GetDocumentContent Anfragen pro Sekunde pro Konto	Jede unterstützte Region: 100	Nein	Die maximale Anzahl von GetDocumentContent API-Anfragen pro Sekunde und Konto.
(Verwaltete Wissensdatenbanken) GetDocumentContent Anfragen pro Sekunde pro Wissensdatenbank	Jede unterstützte Region: 5	Nein	Die maximale Anzahl von GetDocumentContent API-Anfragen pro Sekunde pro verwalteter KB.
(Verwaltete Wissensdatenbanken) GetResourcePolicy Anfragen pro Sekunde	Jede unterstützte Region: 5	Nein	Die maximale Anzahl von GetResourcePolicy API-Anfragen pro Sekunde für verwaltete KBs.
(Verwaltete Wissensdatenbanken) Größe des extrahierten Texts der einzelnen Datei (MB)	Jede unterstützte Region: 30	Nein	Die maximale Größe (in MB) von extrahiertem Text aus einer einzelnen Datei für verwaltete KBs.
(Verwaltete Wissensdatenbanken) IngestKnowledgeBaseDocuments Anfragen pro Sekunde	Jede unterstützte Region: 20	Nein	Die maximale Anzahl von IngestKnowledgeBaseDocuments API-Anfragen pro Sekunde für verwaltete KBs.
(Verwaltete Wissensdatenbanken) Wissensdatenbanken pro Konto	Jede unterstützte Region: 1 000	Nein	Die maximale Anzahl verwalteter KBs pro Konto.
(Verwaltete Wissensdatenbanken) ListKnowledgeBaseDocuments Anfragen pro Sekunde	Jede unterstützte Region: 10	Nein	Die maximale Anzahl von ListKnowledgeBaseDocuments API-Anfragen pro Sekunde für verwaltete KBs.
(Verwaltete Wissensdatenbanken) PutResourcePolicy Anfragen pro Sekunde	Jede unterstützte Region: 5	Nein	Die maximale Anzahl von PutResourcePolicy API-Anfragen pro Sekunde für verwaltete KBs.
(Verwaltete Wissensdatenbanken) Anfragen pro Sekunde und Konto abrufen	Jede unterstützte Region: 100	Nein	Die maximale Anzahl von Abruf-API-Anfragen pro Sekunde pro Konto für verwaltete KBs.
(Verwaltete Wissensdatenbanken) Abfragen pro Sekunde und Wissensdatenbank abrufen	Jede unterstützte Region: 5	Nein	Die maximale Anzahl von Retrieve-API-Anfragen pro Sekunde pro verwalteter KB.
(Verwaltete Wissensdatenbanken) Größe der Benutzerabfrage abrufen	Jede unterstützte Region: 10 000	Nein	Die maximale Größe (in Zeichen) einer Benutzerabfrage für Retrieve for Managed KBs.
(Verwaltete Wissensdatenbanken) Gesamtspeichergröße pro Wissensdatenbank (TB)	Jede unterstützte Region: 10	Nein	Die maximale Gesamtspeichergröße (in TB) pro verwalteter KB.
(Modellanpassung) Benutzerdefinierte Modelle pro Konto	Jede unterstützte Region: 100	Yes (Ja)	Die maximale Anzahl von benutzerdefinierten Modellen in einem Konto.
(Modellanpassung) Bereitstellungen In-progress benutzerdefinierter Modelle	Jede unterstützte Region: 2	Ja	Die maximale Anzahl laufender Bereitstellungen benutzerdefinierter Modelle
(Modellanpassung) Maximale Größe der Eingabedatei für Destillierungsanpassungsaufträge	Jede unterstützte Region: 2 Gigabyte	Nein	Die maximale Größe der Eingabedatei für Aufträge zur Anpassung der Destillation.
(Modellanpassung) Maximale Leitungslänge für Aufträge zur Anpassung der Destillation	Jede unterstützte Region: 16 Kilobyte	Nein	Die maximale Zeilenlänge in der Eingabedatei für Aufträge zur Anpassung der Destillation.
(Modellanpassung) Maximale Anzahl von Eingabeaufforderungen für Aufträge zur Anpassung der Destillation	Jede unterstützte Region: 15 000	Nein	Die maximale Anzahl von Eingabeaufforderungen, die für Aufträge zur Anpassung der Destillation erforderlich sind.
(Modellanpassung) Maximale Anzahl von Schulungsaufzeichnungen für einen Amazon Nova Fine-tuning Canvas-Job	Jede unterstützte Region: 10 000	Ja	Die maximale Anzahl von Datensätzen, die für einen Amazon Nova Fine-tuning Canvas-Job zulässig sind.
(Modellanpassung) Maximale Länge des Kontextes zur Feinabstimmung des Studentenmodells für Amazon Nova Micro V1-Destillationsanpassungsaufträge	Jede unterstützte Region: 32.000	Nein	Die maximale Länge des Kontextes zur Feinabstimmung des Studentenmodells für Amazon Nova Micro V1-Destillationsanpassungsjobs.
(Modellanpassung) Maximale Länge des Kontextes zur Feinabstimmung des Studentenmodells für Amazon Nova V1-Destillationsanpassungsaufträge	Jede unterstützte Region: 32.000	Nein	Die maximale Länge des Studentenmodells zur Feinabstimmung des Kontextes für Amazon Nova V1-Destillationsanpassungsjobs.
(Anpassung des Modells) Maximale Länge des Kontextes zur Feinabstimmung des Studentenmodells für Aufträge zur Anpassung der Destillation nach dem Vorbild „Anthropic Claude 3 Haiku 20240307 V1“	Jede unterstützte Region: 32.000	Nein	Die maximale Länge des Studierendenmodells zur Feinabstimmung des Kontextes für Aufgaben zur Anpassung der Destillation in Anthropic Claude 3 Haiku 20240307 V1.
(Modellanpassung) Maximale Länge des Kontextes zur Feinabstimmung des Studentenmodells für Llama 3.1 70B Instruct V1-Destillationsanpassungsaufträge	Jede unterstützte Region: 16 000	Nein	Die maximale Länge des Kontextes zur Feinabstimmung des Studentenmodells für Llama 3.1 70B Instruct V1-Destillationsanpassungsaufträge.
(Modellanpassung) Maximale Länge des Kontextes zur Feinabstimmung des Studentenmodells für Llama 3.1 8B Instruct V1-Destillationsanpassungsaufträge	Jede unterstützte Region: 32.000	Nein	Die maximale Länge des Kontextes zur Feinabstimmung des Studentenmodells für Llama 3.1 8B Instruct V1-Destillationsanpassungsaufträge.
(Modellanpassung) Mindestanzahl von Eingabeaufforderungen für Aufträge zur Anpassung der Destillation	Jede unterstützte Region: 100	Nein	Die Mindestanzahl von Eingabeaufforderungen, die für Aufträge zur Anpassung der Destillation erforderlich sind.
(Modellanpassung) Geplante Anpassungsaufträge	Jede unterstützte Region: 10	Nein	Die maximale Anzahl von geplanten Anpassungsaufträgen.
(Modellanpassung) Summe der On-Demand-Bereitstellungsanfragen für benutzerdefinierte Modelle pro Minute für Amazon Nova 2 Lite	Jede unterstützte Region: 2.000	Nein	Die Summe der an Converse eingereichten On-Demand-Bereitstellungsanfragen für benutzerdefinierte Modelle pro Minute sowie der InvokeModelWithResponseStream Aktionen für Amazon Nova 2 Lite ConverseStream InvokeModel
(Modellanpassung) Summe der On-Demand-Bereitstellungsanfragen für benutzerdefinierte Modelle pro Minute für Amazon Nova Lite	Jede unterstützte Region: 2.000	Nein	Die Summe der an Converse eingereichten On-Demand-Bereitstellungsanfragen für benutzerdefinierte Modelle pro Minute sowie der InvokeModelWithResponseStream Aktionen für Amazon Nova Lite ConverseStream InvokeModel
(Modellanpassung) Summe der On-Demand-Bereitstellungsanfragen für benutzerdefinierte Modelle pro Minute für Amazon Nova Micro	Jede unterstützte Region: 2.000	Nein	Die Summe der an Converse eingereichten On-Demand-Bereitstellungsanfragen für benutzerdefinierte Modelle pro Minute sowie der InvokeModelWithResponseStream Aktionen für Amazon Nova Micro ConverseStream InvokeModel
(Modellanpassung) Summe der On-Demand-Bereitstellungsanfragen für benutzerdefinierte Modelle pro Minute für Amazon Nova Pro	Jede unterstützte Region: 200	Nein	Die Summe der an Converse eingereichten On-Demand-Bereitstellungsanfragen für benutzerdefinierte Modelle pro Minute sowie der InvokeModelWithResponseStream Aktionen für Amazon Nova Pro ConverseStream InvokeModel
(Modellanpassung) Summe der On-Demand-Bereitstellungsanfragen für benutzerdefinierte Modelle pro Minute für Meta Llama 3.3 70B Instruct	Jede unterstützte Region: 400	Nein	Die Summe der an Converse eingereichten On-Demand-Bereitstellungsanfragen für benutzerdefinierte Modelle pro Minute sowie der InvokeModelWithResponseStream Aktionen für Meta ConverseStream InvokeModel Llama 3.3 70B Instruct
(Modellanpassung) Summe der On-Demand-Bereitstellungstoken für benutzerdefinierte Modelle pro Tag für Amazon Nova 2 Lite	Jede unterstützte Region: 5.760.000.000	Nein	Die Summe der On-Demand-Bereitstellungstoken für benutzerdefinierte Modelle pro Tag, die an Converse übermittelt wurden ConverseStream InvokeModel, und InvokeModelWithResponseStream Aktionen für Amazon Nova 2 Lite
(Modellanpassung) Summe der On-Demand-Bereitstellungstoken für benutzerdefinierte Modelle pro Tag für Amazon Nova Lite	Jede unterstützte Region: 5.760.000.000	Nein	Die Summe der On-Demand-Bereitstellungstoken für benutzerdefinierte Modelle pro Tag, die an Converse übermittelt wurden ConverseStream InvokeModel, und InvokeModelWithResponseStream Aktionen für Amazon Nova Lite
(Modellanpassung) Summe der On-Demand-Bereitstellungstoken für benutzerdefinierte Modelle pro Tag für Amazon Nova Micro	Jede unterstützte Region: 5.760.000.000	Nein	Die Summe der On-Demand-Bereitstellungstoken für benutzerdefinierte Modelle pro Tag, die an Converse übermittelt wurden ConverseStream InvokeModel, und InvokeModelWithResponseStream Aktionen für Amazon Nova Micro
(Modellanpassung) Summe der On-Demand-Bereitstellungstoken für benutzerdefinierte Modelle pro Tag für Amazon Nova Pro	Jede unterstützte Region: 1.152.000.000	Nein	Die Summe der On-Demand-Bereitstellungstoken für benutzerdefinierte Modelle pro Tag, die an Converse übermittelt wurden ConverseStream InvokeModel, und InvokeModelWithResponseStream Aktionen für Amazon Nova Pro
(Modellanpassung) Summe der On-Demand-Bereitstellungstoken für benutzerdefinierte Modelle pro Tag für Meta Llama 3.3 70B Instruct	Jede unterstützte Region: 432.000.000	Nein	Die Summe der an Converse eingereichten On-Demand-Bereitstellungstoken für benutzerdefinierte Modelle auf Abruf und Ausgabe sowie der InvokeModelWithResponseStream Aktionen für Meta InvokeModel Llama 3.3 70B Instruct ConverseStream
(Modellanpassung) Summe der On-Demand-Bereitstellungstoken für benutzerdefinierte Modelle pro Minute für Amazon Nova 2 Lite	Jede unterstützte Region: 4.000.000	Nein	Die Summe der On-Demand-Bereitstellungstoken für benutzerdefinierte Modelle pro Minute, die an Converse übermittelt wurden ConverseStream InvokeModel, und der InvokeModelWithResponseStream Aktionen für Amazon Nova 2 Lite
(Modellanpassung) Summe der On-Demand-Bereitstellungstoken für benutzerdefinierte Modelle pro Minute für Amazon Nova Lite	Jede unterstützte Region: 4.000.000	Nein	Die Summe der On-Demand-Bereitstellungstoken für benutzerdefinierte Modelle pro Minute, die an Converse übermittelt wurden ConverseStream InvokeModel, und InvokeModelWithResponseStream Aktionen für Amazon Nova Lite
(Modellanpassung) Summe der On-Demand-Bereitstellungstoken für benutzerdefinierte Modelle pro Minute für Amazon Nova Micro	Jede unterstützte Region: 4.000.000	Nein	Die Summe der On-Demand-Bereitstellungstoken für benutzerdefinierte Modelle pro Minute, die an Converse übermittelt wurden ConverseStream InvokeModel, und InvokeModelWithResponseStream Aktionen für Amazon Nova Micro
(Modellanpassung) Summe der On-Demand-Bereitstellungstoken für benutzerdefinierte Modelle pro Minute für Amazon Nova Pro	Jede unterstützte Region: 800.000	Nein	Die Summe der On-Demand-Bereitstellungstoken für benutzerdefinierte Modelle pro Minute, die an Converse übermittelt wurden ConverseStream InvokeModel, und InvokeModelWithResponseStream Aktionen für Amazon Nova Pro
(Modellanpassung) Summe der On-Demand-Bereitstellungstoken für benutzerdefinierte Modelle pro Minute für Meta Llama 3.3 70B Instruct	Jede unterstützte Region: 300 000	Nein	Die Summe der bei Bedarf eingegebenen und ausgegebenen Tokens für die Bereitstellung benutzerdefinierter Modelle pro Minute, die an den Converse gesendet wurden ConverseStream InvokeModel, und der InvokeModelWithResponseStream Aktionen für Meta Llama 3.3 70B Instruct
(Modellanpassung) Summe der Schulungs- und Validierungsaufzeichnungen für einen Amazon Nova 2 Fine-tuning Lite-Job	Jede unterstützte Region: 20 000	Ja	Die maximale kombinierte Anzahl von Schulungs- und Validierungsdatensätzen, die für einen Amazon Nova 2 Fine-tuning Lite-Job zulässig ist.
(Modellanpassung) Summe der Schulungs- und Validierungsaufzeichnungen für einen Amazon Nova Fine-tuning Lite-Job	Jede unterstützte Region: 20 000	Ja	Die maximale kombinierte Anzahl von Schulungs- und Validierungsdatensätzen, die für einen Amazon Nova Fine-tuning Lite-Job zulässig ist.
(Modellanpassung) Summe der Schulungs- und Validierungsaufzeichnungen für einen Amazon Nova Fine-tuning Micro-Job	Jede unterstützte Region: 20 000	Ja	Die maximale kombinierte Anzahl von Schulungs- und Validierungsdatensätzen, die für einen Amazon Nova Fine-tuning Micro-Job zulässig ist.
(Modellanpassung) Summe der Schulungs- und Validierungsaufzeichnungen für einen Amazon Nova Fine-tuning Pro-Job	Jede unterstützte Region: 20 000	Ja	Die maximale kombinierte Anzahl von Schulungs- und Validierungsdatensätzen, die für einen Amazon Nova Fine-tuning Pro-Job zulässig ist.
(Modellanpassung) Summe der Schulungs- und Validierungsaufzeichnungen für einen Claude 3 Haiku v1-Job Fine-tuning	Jede unterstützte Region: 10 000	Ja	Die maximale kombinierte Anzahl von Schulungs- und Validierungsdatensätzen, die für einen Fine-tuning Claude-3-Haiku-Job zulässig ist.
(Modellanpassung) Summe der Schulungs- und Validierungsaufzeichnungen für einen Claude 3-5-Haiku-V1-Job Fine-tuning	Jede unterstützte Region: 10 000	Ja	Die maximale kombinierte Anzahl von Schulungs- und Validierungsdatensätzen, die für einen Claude 3-5-Haiku-Job zulässig ist. Fine-tuning
(Modellanpassung) Summe der Schulungs- und Validierungsdatensätze für einen Meta Llama 2 13B v1-Job Fine-tuning	Jede unterstützte Region: 10 000	Ja	Die maximale kombinierte Anzahl von Schulungs- und Validierungsdatensätzen, die für einen Meta Llama 2 13B-Job zulässig ist. Fine-tuning
(Modellanpassung) Summe der Schulungs- und Validierungsdatensätze für einen Meta Llama 2 70B v1-Job Fine-tuning	Jede unterstützte Region: 10 000	Ja	Die maximale kombinierte Anzahl von Schulungs- und Validierungsdatensätzen, die für einen Meta Llama 2 70B-Job zulässig ist. Fine-tuning
(Modellanpassung) Summe der Schulungs- und Validierungsdatensätze für einen Meta Llama 3.1 70B Instruct v1-Job Fine-tuning	Jede unterstützte Region: 10 000	Ja	Die maximale kombinierte Anzahl von Schulungs- und Validierungsdatensätzen, die für einen Meta Llama 3.1 70B Instruct-Job zulässig ist. Fine-tuning
(Modellanpassung) Summe der Schulungs- und Validierungsdatensätze für einen Meta Llama 3.1 8B Instruct v1-Job Fine-tuning	Jede unterstützte Region: 10 000	Ja	Die maximale kombinierte Anzahl von Schulungs- und Validierungsdatensätzen, die für einen Meta Llama 3.1 8B Instruct-Job zulässig ist. Fine-tuning
(Modellanpassung) Summe der Schulungs- und Validierungsdatensätze für einen Meta Llama 3.2 11B Instruct v1-Job Fine-tuning	Jede unterstützte Region: 10 000	Ja	Die maximale kombinierte Anzahl von Schulungs- und Validierungsdatensätzen, die für einen Meta Llama 3.2 11B Instruct-Job zulässig ist. Fine-tuning
(Modellanpassung) Summe der Schulungs- und Validierungsdatensätze für einen Meta Llama 3.2 1B Instruct v1-Job Fine-tuning	Jede unterstützte Region: 10 000	Ja	Die maximale kombinierte Anzahl von Schulungs- und Validierungsdatensätzen, die für einen Meta Llama 3.2 1B Instruct-Job zulässig ist. Fine-tuning
(Modellanpassung) Summe der Schulungs- und Validierungsdatensätze für einen Meta Llama 3.2 3B Instruct v1-Job Fine-tuning	Jede unterstützte Region: 10 000	Ja	Die maximale kombinierte Anzahl von Schulungs- und Validierungsdatensätzen, die für einen Meta Llama 3.2 3B Instruct-Job zulässig ist. Fine-tuning
(Modellanpassung) Summe der Schulungs- und Validierungsdatensätze für einen Meta Llama 3.2 90B Instruct v1-Job Fine-tuning	Jede unterstützte Region: 10 000	Ja	Die maximale kombinierte Anzahl von Schulungs- und Validierungsdatensätzen, die für einen Meta Llama 3.2 90B Instruct-Job zulässig ist. Fine-tuning
(Modellanpassung) Summe der Schulungs- und Validierungsdatensätze für einen Meta Llama 3.3 70B Instruct v1-Job Fine-tuning	Jede unterstützte Region: 10 000	Ja	Die maximale kombinierte Anzahl von Schulungs- und Validierungsdatensätzen, die für einen Meta Llama 3.3 70B Instruct-Job zulässig ist. Fine-tuning
(Modellanpassung) Summe der Schulungs- und Validierungsdatensätze für einen Titan Image Generator G1 V1-Job Fine-tuning	Jede unterstützte Region: 10 000	Ja	Die maximale kombinierte Anzahl von Schulungs- und Validierungsdatensätzen, die für einen Titan Image Fine-tuning Generator-Job zulässig ist.
(Modellanpassung) Summe der Schulungs- und Validierungsdatensätze für einen Titan Image Generator G1 V2-Job Fine-tuning	Jede unterstützte Region: 10 000	Ja	Die maximale kombinierte Anzahl von Schulungs- und Validierungsdatensätzen, die für einen Titan Image Generator Fine-tuning V2-Job zulässig ist.
(Modellanpassung) Summe der Schulungs- und Validierungsaufzeichnungen für einen Titan Multimodal Embeddings G1 v1-Job Fine-tuning	Jede unterstützte Region: 50 000	Ja	Die maximale kombinierte Anzahl von Schulungs- und Validierungsdatensätzen, die für einen Titan Multimodal Embeddings-Job zulässig ist. Fine-tuning
(Modellanpassung) Summe der Schulungs- und Validierungsaufzeichnungen für einen Auftrag mit Titan Text G1 — Express v1 Continued Pre-Training	Jede unterstützte Region: 100 000	Ja	Die maximale kombinierte Anzahl von Schulungs- und Validierungsdatensätzen, die für einen Titan Text Express Pre-Training Continued-Job zulässig ist.
(Modellanpassung) Summe der Schulungs- und Validierungsdatensätze für einen Titan Text G1 — Express v1-Job Fine-tuning	Jede unterstützte Region: 10 000	Ja	Die maximale kombinierte Anzahl von Schulungs- und Validierungsdatensätzen, die für einen Titan Text Fine-tuning Express-Auftrag zulässig ist.
(Modellanpassung) Summe der Schulungs- und Validierungsdatensätze für einen Titan Text G1 — Lite v1 Continued Job Pre-Training	Jede unterstützte Region: 100 000	Ja	Die maximale kombinierte Anzahl von Schulungs- und Validierungsdatensätzen, die für einen Titan Text Lite Pre-Training Continued-Job zulässig ist.
(Modellanpassung) Summe der Schulungs- und Validierungsdatensätze für einen Titan Text G1 — Lite v1-Job Fine-tuning	Jede unterstützte Region: 10 000	Ja	Die maximale kombinierte Anzahl von Schulungs- und Validierungsdatensätzen, die für einen Titan Text Fine-tuning Lite-Job zulässig ist.
(Modellanpassung) Summe der Schulungs- und Validierungsdatensätze für einen Titan Text G1 — Premier v1-Job Fine-tuning	Jede unterstützte Region: 20 000	Ja	Die maximale kombinierte Anzahl von Schulungs- und Validierungsdatensätzen, die für einen Titan Text Fine-tuning Premier-Job zulässig ist.
(Modellanpassung) Gesamtzahl der Bereitstellungen benutzerdefinierter Modelle	Jede unterstützte Region: 10	Yes (Ja)	Gesamtzahl der Bereitstellungen benutzerdefinierter Modelle
(Prompt-Verwaltung) CreatePrompt Anfragen pro Sekunde	Jede unterstützte Region: 2	Nein	Die maximale Anzahl von CreatePrompt Anfragen pro Sekunde.
(Prompt-Verwaltung) CreatePromptVersion Anfragen pro Sekunde	Jede unterstützte Region: 2	Nein	Die maximale Anzahl von CreatePromptVersion Anfragen pro Sekunde.
(Prompt-Verwaltung) DeletePrompt Anfragen pro Sekunde	Jede unterstützte Region: 2	Nein	Die maximale Anzahl von DeletePrompt Anfragen pro Sekunde.
(Prompt-Verwaltung) GetPrompt Anfragen pro Sekunde	Jede unterstützte Region: 10	Nein	Die maximale Anzahl von GetPrompt Anfragen pro Sekunde.
(Prompt-Verwaltung) ListPrompts Anfragen pro Sekunde	Jede unterstützte Region: 10	Nein	Die maximale Anzahl von ListPrompts Anfragen pro Sekunde.
(Prompt-Verwaltung) Eingabeaufforderungen pro Konto	Jede unterstützte Region: 500	Ja	Die maximale Anzahl von Eingabeaufforderungen.
(Eingabeaufforderungsverwaltung) UpdatePrompt Anfragen pro Sekunde	Jede unterstützte Region: 2	Nein	Die maximale Anzahl von UpdatePrompt Anfragen pro Sekunde.
(Prompt-Verwaltung) Versionen pro Prompt	Jede unterstützte Region: 10	Nein	Die maximale Anzahl von Versionen pro Eingabeaufforderung.
APIs pro Agent	Jede unterstützte Region: 11	Ja	Die maximale Anzahl von APIs, die Sie einem Agenten hinzufügen können.
Aktionsgruppen pro Agent	Jede unterstützte Region: 20	Ja	Die maximale Anzahl von Aktionsgruppen, die Sie einem Agenten hinzufügen können.
Mitwirkende Agenten pro Agent	Jede unterstützte Region: 1 000	Ja	Die maximale Anzahl von Collaborator-Agenten, die Sie einem Agenten hinzufügen können.
Agenten pro Konto	Jede unterstützte Region: 1 000	Ja	Die maximale Anzahl von Agenten in einem Konto.
AssociateAgentKnowledgeBase Anfragen pro Sekunde	Jede unterstützte Region: 6	Nein	Die maximale Anzahl von AssociateAgentKnowledgeBase API-Anfragen pro Sekunde.
Zugeordnete Aliase pro Agent	Jede unterstützte Region: 10	Nein	Die maximale Anzahl von Aliasen, die Sie einem Agenten zuordnen können.
Zugeordnete Wissensdatenbanken pro Agent	Jede unterstützte Region: 2	Ja	Die maximale Anzahl von Wissensdatenbanken, die Sie einem Agenten zuordnen können.
Größe der Batch-Inferenz-Eingabedatei (in GB) für Amazon Nova 2 Multimodal Embeddings V1	Jede unterstützte Region: 1	Nein	Die maximale Größe einer einzelnen Datei (in GB), die zur Batch-Inferenz für Amazon Nova 2 Multimodal Embeddings V1 eingereicht wurde.
Größe der Batch-Inferenz-Eingabedatei (in GB) für Amazon Nova Premier	Jede unterstützte Region: 1	Nein	Die maximale Größe einer einzelnen Datei (in GB), die zur Batch-Inferenz für Amazon Nova Premier eingereicht wurde.
Größe der Batch-Inferenz-Eingabedatei (in GB) für Claude 3 Haiku	Jede unterstützte Region: 1	Nein	Die maximale Größe einer einzelnen Datei (in GB), die zur Batch-Inferenz für Claude-3-Haiku eingereicht wurde.
Größe der Batch-Inferenz-Eingabedatei (in GB) für Claude 3 Opus	Jede unterstützte Region: 1	Nein	Die maximale Größe einer einzelnen Datei (in GB), die zur Batch-Inferenz für Claude 3 Opus eingereicht wurde.
Größe der Batch-Inferenz-Eingabedatei (in GB) für Claude 3 Sonnet	Jede unterstützte Region: 1	Nein	Die maximale Größe einer einzelnen Datei (in GB), die für die Batch-Inferenz für Claude 3 Sonnet eingereicht wurde.
Größe der Batch-Inferenz-Eingabedatei (in GB) für Claude 3.5 Haiku	Jede unterstützte Region: 1	Nein	Die maximale Größe einer einzelnen Datei (in GB), die für die Batch-Inferenz für Claude 3.5 Haiku eingereicht wurde.
Größe der Batch-Inferenz-Eingabedatei (in GB) für Claude 3.5 Sonnet	Jede unterstützte Region: 1	Nein	Die maximale Größe einer einzelnen Datei (in GB), die für die Batch-Inferenz für Claude 3.5 Sonnet eingereicht wurde.
Größe der Batch-Inferenz-Eingabedatei (in GB) für Claude 3.5 Sonnet v2	Jede unterstützte Region: 1	Nein	Die maximale Größe einer einzelnen Datei (in GB), die für die Batch-Inferenz für Claude 3.5 Sonnet v2 eingereicht wurde.
Größe der Batch-Inferenz-Eingabedatei (in GB) für Claude 3.7 Sonnet	Jede unterstützte Region: 1	Ja	Die maximale Größe einer einzelnen Datei (in GB), die für die Batch-Inferenz für Claude 3.7 Sonnet eingereicht wurde.
Größe der Batch-Inferenz-Eingabedatei (in GB) für Claude Haiku 4.5	Jede unterstützte Region: 1	Nein	Die maximale Größe einer einzelnen Datei (in GB), die zur Batch-Inferenz für Claude Haiku 4.5 eingereicht wurde.
Größe der Batch-Inferenz-Eingabedatei (in GB) für Claude Opus 4.5	Jede unterstützte Region: 1	Nein	Die maximale Größe einer einzelnen Datei (in GB), die zur Batch-Inferenz für Claude Opus 4.5 eingereicht wurde.
Größe der Batch-Inferenz-Eingabedatei (in GB) für Claude Opus 4.6	Jede unterstützte Region: 1	Nein	Die maximale Größe einer einzelnen Datei (in GB), die zur Batch-Inferenz für Claude Opus 4.6 eingereicht wurde.
Größe der Batch-Inferenz-Eingabedatei (in GB) für Claude Sonnet 4	Jede unterstützte Region: 1	Ja	Die maximale Größe einer einzelnen Datei (in GB), die zur Batch-Inferenz für Claude Sonnet 4 eingereicht wurde.
Größe der Batch-Inferenz-Eingabedatei (in GB) für Claude Sonnet 4.5	Jede unterstützte Region: 1	Nein	Die maximale Größe einer einzelnen Datei (in GB), die zur Batch-Inferenz für Claude Sonnet 4.5 eingereicht wurde.
Größe der Batch-Inferenz-Eingabedatei (in GB) für Claude Sonnet 4.6	Jede unterstützte Region: 1	Nein	Die maximale Größe einer einzelnen Datei (in GB), die zur Batch-Inferenz für Claude Sonnet 4.6 eingereicht wurde.
Größe der Batch-Inferenz-Eingabedatei (in GB) für DeepSeek V3.2	Jede unterstützte Region: 1	Nein	Die maximale Größe einer einzelnen Datei (in GB), für die Batch-Inferenz eingereicht wurde. DeepSeek V3.2
Größe der Batch-Inferenz-Eingabedatei (in GB) für v3 DeepSeek	Jede unterstützte Region: 1	Nein	Die maximale Größe einer einzelnen Datei (in GB), die zur Batch-Inferenz für DeepSeek v3 eingereicht wurde.
Größe der Batch-Inferenz-Eingabedatei (in GB) für Devstral 2 123B	Jede unterstützte Region: 1	Nein	Die maximale Größe einer einzelnen Datei (in GB), die für die Batch-Inferenz für Devstral 2 123B eingereicht wurde.
Größe der Batch-Inferenz-Eingabedatei (in GB) für GLM 4.7	Jede unterstützte Region: 1	Nein	Die maximale Größe einer einzelnen Datei (in GB), die zur Batch-Inferenz für GLM 4.7 eingereicht wurde.
Größe der Batch-Inferenz-Eingabedatei (in GB) für GLM 4.7 Flash	Jede unterstützte Region: 1	Nein	Die maximale Größe einer einzelnen Datei (in GB), die zur Batch-Inferenz für GLM 4.7 Flash eingereicht wurde.
Größe der Batch-Inferenz-Eingabedatei (in GB) für GLM 5	Jede unterstützte Region: 1	Nein	Die maximale Größe einer einzelnen Datei (in GB), die zur Batch-Inferenz für GLM 5 eingereicht wurde.
Größe der Batch-Inferenz-Eingabedatei (in GB) für Gemma 3 12B	Jede unterstützte Region: 1	Nein	Die maximale Größe einer einzelnen Datei (in GB), die zur Batch-Inferenz für Gemma 3 12B eingereicht wurde.
Größe der Batch-Inferenz-Eingabedatei (in GB) für Gemma 3 27B	Jede unterstützte Region: 1	Nein	Die maximale Größe einer einzelnen Datei (in GB), die zur Batch-Inferenz für Gemma 3 27B eingereicht wurde.
Größe der Batch-Inferenz-Eingabedatei (in GB) für Gemma 3 4B	Jede unterstützte Region: 1	Nein	Die maximale Größe einer einzelnen Datei (in GB), die zur Batch-Inferenz für Gemma 3 4B eingereicht wurde.
Größe der Batch-Inferenz-Eingabedatei (in GB) für Kimi K2 Thinking	Jede unterstützte Region: 1	Nein	Die maximale Größe einer einzelnen Datei (in GB), die zur Batch-Inferenz für Kimi K2 Thinking eingereicht wurde.
Größe der Batch-Inferenz-Eingabedatei (in GB) für Kimi K2.5	Jede unterstützte Region: 1	Nein	Die maximale Größe einer einzelnen Datei (in GB), die zur Batch-Inferenz für Kimi eingereicht wurde. K2.5
Größe der Batch-Inferenz-Eingabedatei (in GB) für Llama 3.1 405B Instruct	Jede unterstützte Region: 1	Nein	Die maximale Größe einer einzelnen Datei (in GB), die für die Batch-Inferenz für Llama 3.1 405B Instruct eingereicht wurde.
Größe der Batch-Inferenz-Eingabedatei (in GB) für Llama 3.1 70B Instruct	Jede unterstützte Region: 1	Nein	Die maximale Größe einer einzelnen Datei (in GB), die für die Batch-Inferenz für Llama 3.1 70B Instruct eingereicht wurde.
Größe der Batch-Inferenz-Eingabedatei (in GB) für Llama 3.1 8B Instruct	Jede unterstützte Region: 1	Nein	Die maximale Größe einer einzelnen Datei (in GB), die für die Batch-Inferenz für Llama 3.1 8B Instruct eingereicht wurde.
Größe der Batch-Inferenz-Eingabedatei (in GB) für Llama 3.2 11B Instruct	Jede unterstützte Region: 1	Nein	Die maximale Größe einer einzelnen Datei (in GB), die zur Batch-Inferenz für Llama 3.2 11B Instruct eingereicht wurde.
Größe der Batch-Inferenz-Eingabedatei (in GB) für Llama 3.2 1B Instruct	Jede unterstützte Region: 1	Nein	Die maximale Größe einer einzelnen Datei (in GB), die für die Batch-Inferenz Llama 3.2 1B Instruct eingereicht wurde.
Größe der Batch-Inferenz-Eingabedatei (in GB) für Llama 3.2 3B Instruct	Jede unterstützte Region: 1	Nein	Die maximale Größe einer einzelnen Datei (in GB), die zur Batch-Inferenz für Llama 3.2 3B Instruct eingereicht wurde.
Größe der Batch-Inferenz-Eingabedatei (in GB) für Llama 3.2 90B Instruct	Jede unterstützte Region: 1	Nein	Die maximale Größe einer einzelnen Datei (in GB), die zur Batch-Inferenz für Llama 3.2 90B Instruct eingereicht wurde.
Größe der Batch-Inferenz-Eingabedatei (in GB) für Llama 3.3 70B Instruct	Jede unterstützte Region: 1	Nein	Die maximale Größe einer einzelnen Datei (in GB), die für die Batch-Inferenz für Llama 3.3 70B Instruct eingereicht wurde.
Größe der Batch-Inferenz-Eingabedatei (in GB) für Llama 4 Maverick	Jede unterstützte Region: 1	Nein	Die maximale Größe einer einzelnen Datei (in GB), die für die Batch-Inferenz für Llama 4 Maverick eingereicht wurde.
Größe der Batch-Inferenz-Eingabedatei (in GB) für Llama 4 Scout	Jede unterstützte Region: 1	Nein	Die maximale Größe einer einzelnen Datei (in GB), die für die Batch-Inferenz für Llama 4 Scout eingereicht wurde.
Größe der Batch-Inferenz-Eingabedatei (in GB) für Magistral Small 2509	Jede unterstützte Region: 1	Nein	Die maximale Größe einer einzelnen Datei (in GB), die für die Batch-Inferenz für Magistral Small 2509 eingereicht wurde.
Größe der Batch-Inferenz-Eingabedatei (in GB) für M2 MiniMax	Jede unterstützte Region: 1	Nein	Die maximale Größe einer einzelnen Datei (in GB), die zur Batch-Inferenz für MiniMax M2 eingereicht wurde.
Größe der Batch-Inferenz-Eingabedatei (in GB) für MiniMax M2.1	Jede unterstützte Region: 1	Nein	Die maximale Größe einer einzelnen Datei (in GB), für die Batch-Inferenz eingereicht wurde. MiniMax M2.1
Größe der Batch-Inferenz-Eingabedatei (in GB) für MiniMax M2.5	Jede unterstützte Region: 1	Nein	Die maximale Größe einer einzelnen Datei (in GB), für die Batch-Inferenz eingereicht wurde. MiniMax M2.5
Größe der Batch-Inferenz-Eingabedatei (in GB) für Ministral 3 14B	Jede unterstützte Region: 1	Nein	Die maximale Größe einer einzelnen Datei (in GB), die zur Batch-Inferenz für Ministry 3 14B eingereicht wurde.
Größe der Batch-Inferenz-Eingabedatei (in GB) für Ministral 3 8B	Jede unterstützte Region: 1	Nein	Die maximale Größe einer einzelnen Datei (in GB), die zur Batch-Inferenz für Ministral 3 8B eingereicht wurde.
Größe der Batch-Inferenz-Eingabedatei (in GB) für Ministral 3B	Jede unterstützte Region: 1	Nein	Die maximale Größe einer einzelnen Datei (in GB), die zur Batch-Inferenz für Ministry 3B eingereicht wurde.
Größe der Batch-Inferenz-Eingabedatei (in GB) für Mistral Large 2 (24.07)	Jede unterstützte Region: 1	Nein	Die maximale Größe einer einzelnen Datei (in GB), die zur Batch-Inferenz für Mistral Large 2 eingereicht wurde (24.07).
Größe der Batch-Inferenz-Eingabedatei (in GB) für Mistral Large 3	Jede unterstützte Region: 1	Nein	Die maximale Größe einer einzelnen Datei (in GB), die zur Batch-Inferenz für Mistral Large 3 eingereicht wurde.
Größe der Batch-Inferenz-Eingabedatei (in GB) für Mistral Small	Jede unterstützte Region: 1	Nein	Die maximale Größe einer einzelnen Datei (in GB), die zur Batch-Inferenz für Mistral Small eingereicht wurde.
Größe der Batch-Inferenz-Eingabedatei (in GB) für NVIDIA Nemotron 3 Super 120B A12B	Jede unterstützte Region: 1	Nein	Die maximale Größe einer einzelnen Datei (in GB), die für die Batch-Inferenz für NVIDIA Nemotron 3 Super 120B A12B eingereicht wurde.
Größe der Batch-Inferenz-Eingabedatei (in GB) für NVIDIA Nemotron Nano 12B	Jede unterstützte Region: 1	Nein	Die maximale Größe einer einzelnen Datei (in GB), die für die Batch-Inferenz für NVIDIA Nemotron Nano 12B eingereicht wurde.
Größe der Batch-Inferenz-Eingabedatei (in GB) für NVIDIA Nemotron Nano 3 30B	Jede unterstützte Region: 1	Nein	Die maximale Größe einer einzelnen Datei (in GB), die für die Batch-Inferenz für NVIDIA Nemotron Nano 3 30B eingereicht wurde.
Größe der Batch-Inferenz-Eingabedatei (in GB) für NVIDIA Nemotron Nano 9B	Jede unterstützte Region: 1	Nein	Die maximale Größe einer einzelnen Datei (in GB), die für die Batch-Inferenz für NVIDIA Nemotron Nano 9B eingereicht wurde.
Größe der Batch-Inferenz-Eingabedatei (in GB) für Nova 2 Lite	Jede unterstützte Region: 1	Nein	Die maximale Größe einer einzelnen Datei (in GB), die zur Batch-Inferenz für Nova 2 Lite eingereicht wurde.
Größe der Batch-Inferenz-Eingabedatei (in GB) für Nova Lite V1	Jede unterstützte Region: 1	Nein	Die maximale Größe einer einzelnen Datei (in GB), die zur Batch-Inferenz für Nova Lite V1 eingereicht wurde.
Größe der Batch-Inferenz-Eingabedatei (in GB) für Nova Micro V1	Jede unterstützte Region: 1	Nein	Die maximale Größe einer einzelnen Datei (in GB), die zur Batch-Inferenz für Nova Micro V1 eingereicht wurde.
Größe der Batch-Inferenz-Eingabedatei (in GB) für Nova Pro V1	Jede unterstützte Region: 1	Nein	Die maximale Größe einer einzelnen Datei (in GB), die zur Batch-Inferenz für Nova Pro V1 eingereicht wurde.
Größe der Batch-Inferenz-Eingabedatei (in GB) für OpenAI GPT OSS 120b	Jede unterstützte Region: 1	Nein	Die maximale Größe einer einzelnen Datei (in GB), die zur Batch-Inferenz für OpenAI GPT OSS 120b eingereicht wurde.
Größe der Batch-Inferenz-Eingabedatei (in GB) für OpenAI GPT OSS 20b	Jede unterstützte Region: 1	Nein	Die maximale Größe einer einzelnen Datei (in GB), die zur Batch-Inferenz für OpenAI GPT OSS 20b eingereicht wurde.
Größe der Batch-Inferenz-Eingabedatei (in GB) für OpenAI GPT OSS Safeguard 120b	Jede unterstützte Region: 1	Nein	Die maximale Größe einer einzelnen Datei (in GB), die zur Batch-Inferenz für OpenAI GPT OSS Safeguard 120b eingereicht wurde.
Größe der Batch-Inferenz-Eingabedatei (in GB) für OpenAI GPT OSS Safeguard 20b	Jede unterstützte Region: 1	Nein	Die maximale Größe einer einzelnen Datei (in GB), die zur Batch-Inferenz für OpenAI GPT OSS Safeguard 20b eingereicht wurde.
Größe der Batch-Inferenz-Eingabedatei (in GB) für Qwen3 235B	Jede unterstützte Region: 1	Nein	Die maximale Größe einer einzelnen Datei (in GB), die zur Batch-Inferenz für Qwen3 235B eingereicht wurde.
Größe der Batch-Inferenz-Eingabedatei (in GB) für Qwen3 32B	Jede unterstützte Region: 1	Nein	Die maximale Größe einer einzelnen Datei (in GB), die für die Batch-Inferenz für Qwen3 32B eingereicht wurde.
Größe der Batch-Inferenz-Eingabedatei (in GB) für Qwen3 Coder 30B	Jede unterstützte Region: 1	Nein	Die maximale Größe einer einzelnen Datei (in GB), die zur Batch-Inferenz für Qwen3 Coder 30B eingereicht wurde.
Größe der Batch-Inferenz-Eingabedatei (in GB) für Qwen3 Coder 480B	Jede unterstützte Region: 1	Nein	Die maximale Größe einer einzelnen Datei (in GB), die zur Batch-Inferenz für Qwen3 Coder 480B eingereicht wurde.
Größe der Batch-Inferenz-Eingabedatei (in GB) für Qwen3 Coder Next	Jede unterstützte Region: 1	Nein	Die maximale Größe einer einzelnen Datei (in GB), die zur Batch-Inferenz für Qwen3 Coder Next eingereicht wurde.
Größe der Batch-Inferenz-Eingabedatei (in GB) für Qwen3 Next 80B	Jede unterstützte Region: 1	Nein	Die maximale Größe einer einzelnen Datei (in GB), die für die Batch-Inferenz für Qwen3 Next 80B eingereicht wurde.
Größe der Batch-Inferenz-Eingabedatei (in GB) für Qwen3 VL 235B	Jede unterstützte Region: 1	Nein	Die maximale Größe einer einzelnen Datei (in GB), die zur Batch-Inferenz für Qwen3 VL 235B eingereicht wurde.
Größe der Batch-Inferenz-Eingabedatei (in GB) für Titan Multimodal Embeddings G1	Jede unterstützte Region: 1	Nein	Die maximale Größe einer einzelnen Datei (in GB), die für die Batch-Inferenz für Titan Multimodal Embeddings G1 eingereicht wurde.
Größe der Batch-Inferenz-Eingabedatei (in GB) für Titan Text Embeddings V2	Jede unterstützte Region: 1	Nein	Die maximale Größe einer einzelnen Datei (in GB), die für die Batch-Inferenz für Titan Text Embeddings V2 eingereicht wurde.
Größe der Batch-Inferenz-Eingabedatei (in GB) für Voxtral Mini 3B 2507	Jede unterstützte Region: 1	Nein	Die maximale Größe einer einzelnen Datei (in GB), die zur Batch-Inferenz für Voxtral Mini 3B 2507 eingereicht wurde.
Größe der Batch-Inferenz-Eingabedatei (in GB) für Voxtral Small 24B 2507	Jede unterstützte Region: 1	Nein	Die maximale Größe einer einzelnen Datei (in GB), die zur Batch-Inferenz für Voxtral Small 24B 2507 eingereicht wurde.
Größe der Batch-Inferenz-Eingabedatei (in GB) für Writer Palmyra Vision 7B	Jede unterstützte Region: 1	Nein	Die maximale Größe einer einzelnen Datei (in GB), die für die Batch-Inferenz für Writer Palmyra Vision 7B eingereicht wurde.
Auftragsgröße für Batch-Inferenz (in GB) für Qwen3 Next 80B	Jede unterstützte Region: 5	Nein	Die maximale kumulative Größe aller Eingabedateien (in GB), die im Batch-Inferenzjob für Qwen3 Next 80B enthalten sind.
Auftragsgröße für Batch-Inferenz (in GB) für Amazon Nova 2 Multimodal Embeddings V1	Jede unterstützte Region: 100	Nein	Die maximale kumulative Größe aller Eingabedateien (in GB), die im Batch-Inferenz-Job für Amazon Nova 2 Multimodal Embeddings V1 enthalten sind.
Auftragsgröße für Batch-Inferenz (in GB) für Amazon Nova Premier	Jede unterstützte Region: 5	Nein	Die maximale kumulative Größe aller Eingabedateien (in GB), die im Batch-Inferenzjob für Amazon Nova Premier enthalten sind.
Auftragsgröße für Batch-Inferenz (in GB) für Claude 3 Haiku	Jede unterstützte Region: 5	Nein	Die maximale Gesamtgröße aller Eingabedateien (in GB), die im Batch-Inferenzjob für Claude-3-Haiku enthalten sind.
Auftragsgröße für Batch-Inferenz (in GB) für Claude 3 Opus	Jede unterstützte Region: 5	Nein	Die maximale kumulative Größe aller Eingabedateien (in GB), die im Batch-Inferenzjob für Claude 3 Opus enthalten sind.
Auftragsgröße für Batch-Inferenz (in GB) für Claude 3 Sonnet	Jede unterstützte Region: 5	Nein	Die maximale Gesamtgröße aller Eingabedateien (in GB), die im Batch-Inferenzjob für Claude 3 Sonnet enthalten sind.
Auftragsgröße für Batch-Inferenz (in GB) für Claude 3.5 Haiku	Jede unterstützte Region: 5	Nein	Die maximale Gesamtgröße aller Eingabedateien (in GB), die im Batch-Inferenzjob für Claude 3.5 Haiku enthalten sind.
Auftragsgröße für Batch-Inferenz (in GB) für Claude 3.5 Sonnet	Jede unterstützte Region: 5	Nein	Die maximale Gesamtgröße aller Eingabedateien (in GB), die im Batch-Inferenzjob für Claude 3.5 Sonnet enthalten sind.
Auftragsgröße für Batch-Inferenz (in GB) für Claude 3.5 Sonnet v2	Jede unterstützte Region: 5	Nein	Die maximale Gesamtgröße aller Eingabedateien (in GB), die im Batch-Inferenzjob für Claude 3.5 Sonnet v2 enthalten sind.
Auftragsgröße für Batch-Inferenz (in GB) für Claude 3.7 Sonnet	Jede unterstützte Region: 5	Yes (Ja)	Die maximale Gesamtgröße aller Eingabedateien (in GB), die im Batch-Inferenzjob für Claude 3.7 Sonnet enthalten sind.
Auftragsgröße für Batch-Inferenz (in GB) für Claude Haiku 4.5	Jede unterstützte Region: 5	Nein	Die maximale Gesamtgröße aller Eingabedateien (in GB), die im Batch-Inferenzjob für Claude Haiku 4.5 enthalten sind.
Auftragsgröße für Batch-Inferenz (in GB) für Claude Opus 4.5	Jede unterstützte Region: 5	Nein	Die maximale kumulative Größe aller Eingabedateien (in GB), die im Batch-Inferenzjob für Claude Opus 4.5 enthalten sind.
Auftragsgröße für Batch-Inferenz (in GB) für Claude Opus 4.6	Jede unterstützte Region: 5	Nein	Die maximale kumulative Größe aller Eingabedateien (in GB), die im Batch-Inferenzjob für Claude Opus 4.6 enthalten sind.
Auftragsgröße für Batch-Inferenz (in GB) für Claude Sonnet 4	Jede unterstützte Region: 5	Yes (Ja)	Die maximale Gesamtgröße aller Eingabedateien (in GB), die im Batch-Inferenzjob für Claude Sonnet 4 enthalten sind.
Auftragsgröße für Batch-Inferenz (in GB) für Claude Sonnet 4.5	Jede unterstützte Region: 5	Nein	Die maximale Gesamtgröße aller Eingabedateien (in GB), die im Batch-Inferenzjob für Claude Sonnet 4.5 enthalten sind.
Auftragsgröße für Batch-Inferenz (in GB) für Claude Sonnet 4.6	Jede unterstützte Region: 5	Nein	Die maximale Gesamtgröße aller Eingabedateien (in GB), die im Batch-Inferenzjob für Claude Sonnet 4.6 enthalten sind.
Auftragsgröße für Batch-Inferenz (in GB) für DeepSeek V3.2	Jede unterstützte Region: 5	Nein	Die maximale kumulative Größe aller Eingabedateien (in GB), die im Batch-Inferenzjob für enthalten sind. DeepSeek V3.2
Auftragsgröße (in GB) für Batch-Inferenz für v3 DeepSeek	Jede unterstützte Region: 5	Nein	Die maximale kumulative Größe aller Eingabedateien (in GB), die im Batch-Inferenzjob für Version 3 enthalten sind. DeepSeek
Auftragsgröße für Batch-Inferenz (in GB) für Devstral 2 123B	Jede unterstützte Region: 5	Nein	Die maximale kumulative Größe aller Eingabedateien (in GB), die im Batch-Inferenzjob für Devstral 2 123B enthalten sind.
Auftragsgröße für Batch-Inferenz (in GB) für GLM 4.7	Jede unterstützte Region: 5	Nein	Die maximale kumulative Größe aller Eingabedateien (in GB), die im Batch-Inferenz-Job für GLM 4.7 enthalten sind.
Auftragsgröße für Batch-Inferenz (in GB) für GLM 4.7 Flash	Jede unterstützte Region: 5	Nein	Die maximale kumulative Größe aller Eingabedateien (in GB), die im Batch-Inferenz-Job für GLM 4.7 Flash enthalten sind.
Auftragsgröße für Batch-Inferenz (in GB) für GLM 5	Jede unterstützte Region: 5	Nein	Die maximale kumulative Größe aller Eingabedateien (in GB), die im Batch-Inferenz-Job für GLM 5 enthalten sind.
Auftragsgröße für Batch-Inferenz (in GB) für Gemma 3 12B	Jede unterstützte Region: 5	Nein	Die maximale kumulative Größe aller Eingabedateien (in GB), die im Batch-Inferenzjob für Gemma 3 12B enthalten sind.
Auftragsgröße für Batch-Inferenz (in GB) für Gemma 3 27B	Jede unterstützte Region: 5	Nein	Die maximale kumulative Größe aller Eingabedateien (in GB), die im Batch-Inferenzjob für Gemma 3 27B enthalten sind.
Auftragsgröße für Batch-Inferenz (in GB) für Gemma 3 4B	Jede unterstützte Region: 5	Nein	Die maximale kumulative Größe aller Eingabedateien (in GB), die im Batch-Inferenzjob für Gemma 3 4B enthalten sind.
Auftragsgröße für Batch-Inferenz (in GB) für Kimi K2 Thinking	Jede unterstützte Region: 5	Nein	Die maximale Gesamtgröße aller Eingabedateien (in GB), die im Batch-Inferenzjob für Kimi K2 Thinking enthalten sind.
Auftragsgröße für Batch-Inferenz (in GB) für Kimi K2.5	Jede unterstützte Region: 5	Nein	Die maximale Gesamtgröße aller Eingabedateien (in GB), die im Batch-Inferenzjob für Kimi enthalten sind. K2.5
Auftragsgröße für Batch-Inferenz (in GB) für Llama 3.1 405B Instruct	Jede unterstützte Region: 5	Nein	Die maximale kumulative Größe aller Eingabedateien (in GB), die im Batch-Inferenzjob für Llama 3.1 405B Instruct enthalten sind.
Auftragsgröße für Batch-Inferenz (in GB) für Llama 3.1 70B Instruct	Jede unterstützte Region: 5	Nein	Die maximale kumulative Größe aller Eingabedateien (in GB), die im Batch-Inferenzjob für Llama 3.1 70B Instruct enthalten sind.
Auftragsgröße für Batch-Inferenz (in GB) für Llama 3.1 8B Instruct	Jede unterstützte Region: 5	Nein	Die maximale kumulative Größe aller Eingabedateien (in GB), die im Batch-Inferenzjob für Llama 3.1 8B Instruct enthalten sind.
Auftragsgröße für Batch-Inferenz (in GB) für Llama 3.2 11B Instruct	Jede unterstützte Region: 5	Nein	Die maximale kumulative Größe aller Eingabedateien (in GB), die im Batch-Inferenzjob für Llama 3.2 11B Instruct enthalten sind.
Auftragsgröße für Batch-Inferenz (in GB) für Llama 3.2 1B Instruct	Jede unterstützte Region: 5	Nein	Die maximale kumulative Größe aller Eingabedateien (in GB), die im Batch-Inferenzjob für Llama 3.2 1B Instruct enthalten sind.
Auftragsgröße für Batch-Inferenz (in GB) für Llama 3.2 3B Instruct	Jede unterstützte Region: 5	Nein	Die maximale kumulative Größe aller Eingabedateien (in GB), die im Batch-Inferenzjob für Llama 3.2 3B Instruct enthalten sind.
Auftragsgröße für Batch-Inferenz (in GB) für Llama 3.2 90B Instruct	Jede unterstützte Region: 5	Nein	Die maximale kumulative Größe aller Eingabedateien (in GB), die im Batch-Inferenzjob für Llama 3.2 90B Instruct enthalten sind.
Auftragsgröße für Batch-Inferenz (in GB) für Llama 3.3 70B Instruct	Jede unterstützte Region: 5	Nein	Die maximale kumulative Größe aller Eingabedateien (in GB), die im Batch-Inferenzjob für Llama 3.3 70B Instruct enthalten sind.
Auftragsgröße für Batch-Inferenz (in GB) für Llama 4 Maverick	Jede unterstützte Region: 5	Nein	Die maximale kumulative Größe aller Eingabedateien (in GB), die im Batch-Inferenzjob für Llama 4 Maverick enthalten sind.
Auftragsgröße für Batch-Inferenz (in GB) für Llama 4 Scout	Jede unterstützte Region: 5	Nein	Die maximale Gesamtgröße aller Eingabedateien (in GB), die im Batch-Inferenzjob für Llama 4 Scout enthalten sind.
Auftragsgröße für Batch-Inferenz (in GB) für Magistral Small 2509	Jede unterstützte Region: 5	Nein	Die maximale Gesamtgröße aller Eingabedateien (in GB), die im Batch-Inferenzjob für Magistral Small 2509 enthalten sind.
Auftragsgröße für Batch-Inferenz (in GB) für M2 MiniMax	Jede unterstützte Region: 5	Nein	Die maximale kumulative Größe aller Eingabedateien (in GB), die im Batch-Inferenzjob für M2 enthalten sind. MiniMax
Auftragsgröße für Batch-Inferenz (in GB) für MiniMax M2.1	Jede unterstützte Region: 5	Nein	Die maximale kumulative Größe aller Eingabedateien (in GB), die im Batch-Inferenzjob für enthalten sind. MiniMax M2.1
Auftragsgröße für Batch-Inferenz (in GB) für MiniMax M2.5	Jede unterstützte Region: 5	Nein	Die maximale kumulative Größe aller Eingabedateien (in GB), die im Batch-Inferenzjob für enthalten sind. MiniMax M2.5
Auftragsgröße für Batch-Inferenz (in GB) für Ministral 3 14B	Jede unterstützte Region: 5	Nein	Die maximale Gesamtgröße aller Eingabedateien (in GB), die im Batch-Inferenzjob für Ministral 3 14B enthalten sind.
Auftragsgröße (in GB) für Batch-Inferenz für Ministral 3 8B	Jede unterstützte Region: 5	Nein	Die maximale Gesamtgröße aller Eingabedateien (in GB), die im Batch-Inferenzjob für Ministral 3 8B enthalten sind.
Auftragsgröße für Batch-Inferenz (in GB) für Ministral 3B	Jede unterstützte Region: 5	Nein	Die maximale Gesamtgröße aller Eingabedateien (in GB), die im Batch-Inferenzjob für Ministral 3B enthalten sind.
Auftragsgröße für Batch-Inferenz (in GB) für Mistral Large 2 (24,07)	Jede unterstützte Region: 5	Nein	Die maximale kumulative Größe aller Eingabedateien (in GB), die im Batch-Inferenzjob für Mistral Large 2 enthalten sind (24,07).
Auftragsgröße für Batch-Inferenz (in GB) für Mistral Large 3	Jede unterstützte Region: 5	Nein	Die maximale Gesamtgröße aller Eingabedateien (in GB), die im Batch-Inferenzjob für Mistral Large 3 enthalten sind.
Auftragsgröße für Batch-Inferenz (in GB) für Mistral Small	Jede unterstützte Region: 5	Nein	Die maximale Gesamtgröße aller Eingabedateien (in GB), die im Batch-Inferenzjob für Mistral Small enthalten sind.
Auftragsgröße für Batch-Inferenz (in GB) für NVIDIA Nemotron 3 Super 120B A12B	Jede unterstützte Region: 5	Nein	Die maximale kumulative Größe aller Eingabedateien (in GB), die im Batch-Inferenzjob für NVIDIA Nemotron 3 Super 120B A12B enthalten sind.
Auftragsgröße für Batch-Inferenz (in GB) für NVIDIA Nemotron Nano 12B	Jede unterstützte Region: 5	Nein	Die maximale kumulative Größe aller Eingabedateien (in GB), die im Batch-Inferenzjob für NVIDIA Nemotron Nano 12B enthalten sind.
Auftragsgröße für Batch-Inferenz (in GB) für NVIDIA Nemotron Nano 3 30B	Jede unterstützte Region: 5	Nein	Die maximale kumulative Größe aller Eingabedateien (in GB), die im Batch-Inferenzjob für NVIDIA Nemotron Nano 3 30B enthalten sind.
Auftragsgröße für Batch-Inferenz (in GB) für NVIDIA Nemotron Nano 9B	Jede unterstützte Region: 5	Nein	Die maximale kumulative Größe aller Eingabedateien (in GB), die im Batch-Inferenzjob für NVIDIA Nemotron Nano 9B enthalten sind.
Auftragsgröße für Batch-Inferenz (in GB) für Nova Lite V1	Jede unterstützte Region: 100	Nein	Die maximale kumulative Größe aller Eingabedateien (in GB), die im Batch-Inferenzjob für Nova Lite V1 enthalten sind.
Auftragsgröße für Batch-Inferenz (in GB) für Nova Micro V1	Jede unterstützte Region: 5	Nein	Die maximale kumulative Größe aller Eingabedateien (in GB), die im Batch-Inferenzjob für Nova Micro V1 enthalten sind.
Auftragsgröße für Batch-Inferenz (in GB) für Nova Pro V1	Jede unterstützte Region: 100	Nein	Die maximale kumulative Größe aller Eingabedateien (in GB), die im Batch-Inferenzjob für Nova Pro V1 enthalten sind.
Auftragsgröße für Batch-Inferenz (in GB) für OpenAI GPT OSS 120b	Jede unterstützte Region: 5	Nein	Die maximale kumulative Größe aller Eingabedateien (in GB), die im Batch-Inferenzjob für OpenAI GPT OSS 120b enthalten sind.
Auftragsgröße für Batch-Inferenz (in GB) für OpenAI GPT OSS 20b	Jede unterstützte Region: 5	Nein	Die maximale kumulative Größe aller Eingabedateien (in GB), die im Batch-Inferenzjob für OpenAI GPT OSS 20b enthalten sind.
Auftragsgröße für Batch-Inferenz (in GB) für OpenAI GPT OSS Safeguard 120b	Jede unterstützte Region: 5	Nein	Die maximale kumulative Größe aller Eingabedateien (in GB), die im Batch-Inferenzjob für OpenAI GPT OSS Safeguard 120b enthalten sind.
Auftragsgröße für Batch-Inferenz (in GB) für OpenAI GPT OSS Safeguard 20b	Jede unterstützte Region: 5	Nein	Die maximale kumulative Größe aller Eingabedateien (in GB), die im Batch-Inferenzjob für OpenAI GPT OSS Safeguard 20b enthalten sind.
Auftragsgröße für Batch-Inferenz (in GB) für Qwen3 235B	Jede unterstützte Region: 5	Nein	Die maximale kumulative Größe aller Eingabedateien (in GB), die im Batch-Inferenzjob für Qwen3 235B enthalten sind.
Auftragsgröße für Batch-Inferenz (in GB) für Qwen3 32B	Jede unterstützte Region: 5	Nein	Die maximale kumulative Größe aller Eingabedateien (in GB), die im Batch-Inferenzjob für Qwen3 32B enthalten sind.
Auftragsgröße für Batch-Inferenz (in GB) für Qwen3 Coder 30B	Jede unterstützte Region: 5	Nein	Die maximale kumulative Größe aller Eingabedateien (in GB), die im Batch-Inferenzjob für Qwen3 Coder 30B enthalten sind.
Auftragsgröße für Batch-Inferenz (in GB) für Qwen3 Coder 480B	Jede unterstützte Region: 5	Nein	Die maximale kumulative Größe aller Eingabedateien (in GB), die im Batch-Inferenzjob für Qwen3 Coder 480B enthalten sind.
Auftragsgröße für Batch-Inferenz (in GB) für Qwen3 Coder Next	Jede unterstützte Region: 5	Nein	Die maximale kumulative Größe aller Eingabedateien (in GB), die im Batch-Inferenzjob für Qwen3 Coder Next enthalten sind.
Auftragsgröße für Batch-Inferenz (in GB) für Qwen3 VL 235B	Jede unterstützte Region: 5	Nein	Die maximale kumulative Größe aller Eingabedateien (in GB), die im Batch-Inferenzjob für Qwen3 VL 235B enthalten sind.
Auftragsgröße für Batch-Inferenz (in GB) für Titan Multimodal Embeddings G1	Jede unterstützte Region: 5	Nein	Die maximale kumulative Größe aller Eingabedateien (in GB), die im Batch-Inferenzjob für Titan Multimodal Embeddings G1 enthalten sind.
Auftragsgröße für Batch-Inferenz (in GB) für Titan Text Embeddings V2	Jede unterstützte Region: 5	Nein	Die maximale kumulative Größe aller Eingabedateien (in GB), die im Batch-Inferenzjob für Titan Text Embeddings V2 enthalten sind.
Auftragsgröße für Batch-Inferenz (in GB) für Voxtral Mini 3B 2507	Jede unterstützte Region: 5	Nein	Die maximale kumulative Größe aller Eingabedateien (in GB), die im Batch-Inferenzjob für Voxtral Mini 3B 2507 enthalten sind.
Auftragsgröße für Batch-Inferenz (in GB) für Voxtral Small 24B 2507	Jede unterstützte Region: 5	Nein	Die maximale kumulative Größe aller Eingabedateien (in GB), die im Batch-Inferenzjob für Voxtral Small 24B 2507 enthalten sind.
Auftragsgröße für Batch-Inferenz (in GB) für Writer Palmyra Vision 7B	Jede unterstützte Region: 5	Nein	Die maximale kumulative Größe aller Eingabedateien (in GB), die im Batch-Inferenzjob für Writer Palmyra Vision 7B enthalten sind.
Charaktere in den Anweisungen für Agenten	Jede unterstützte Region: 20 000	Nein	Die maximale Anzahl von Zeichen in den Anweisungen für einen Agenten.
Gleichzeitige Modellimportaufträge	Jede unterstützte Region: 1	Nein	Die maximale Anzahl von Modellimportaufträgen, die gleichzeitig ausgeführt werden.
CreateAgent Anfragen pro Sekunde	Jede unterstützte Region: 6	Nein	Die maximale Anzahl von CreateAgent API-Anfragen pro Sekunde.
CreateAgentActionGroup Anfragen pro Sekunde	Jede unterstützte Region: 12	Nein	Die maximale Anzahl von CreateAgentActionGroup API-Anfragen pro Sekunde.
CreateAgentAlias Anfragen pro Sekunde	Jede unterstützte Region: 2	Nein	Die maximale Anzahl von CreateAgentAlias API-Anfragen pro Sekunde.
Cross-Region Modellieren Sie Inferenzanfragen pro Minute für Anthropic Claude 3.5 Haiku	Jede unterstützte Region: 2.000	Nein	Die maximale Anzahl von Anrufen, die Sie innerhalb einer Minute tätigen InvokeModel können. InvokeModelWithResponseStream Die Quote bezieht sich auf die Summe von InvokeModel und InvokeModelWithResponseStream Tokens für Anthropic Claude 3.5 Haiku.
Cross-Region Modellieren Sie Inferenzanfragen pro Minute für Anthropic Claude 3.5 Sonnet V2	us-west-2: 500 Jede der anderen unterstützten Regionen: 100	Nein	Die maximale Häufigkeit, mit der Sie Modellinferenz in einer Minute für Anthropic Claude 3.5 Sonnet V2 aufrufen können. Das Kontingent berücksichtigt die Summe aus Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream
Cross-Region modellieren Sie Inferenz-Token pro Minute für Anthropic Claude 3.5 Haiku	Jede unterstützte Region: 4.000.000	Ja	Die maximale Anzahl von On-Demand-Token, die Sie innerhalb einer Minute zur Modellinferenz einreichen können. Die Quote berücksichtigt die Summe der Eingabe- und Ausgabetoken aller Anfragen an Converse InvokeModel und InvokeModelWithResponseStream für Anthropic Claude 3.5 Haiku. ConverseStream
Cross-Region Modellieren Sie Inferenz-Token pro Minute für Anthropic Claude 3.5 Sonnet V2	us-west-2:4.000.000 Jede der anderen unterstützten Regionen: 800.000	Ja	Die maximale Anzahl von Tokens, die Sie in einer Minute für Anthropic Claude 3.5 Sonnet V2 zur Modellinferenz einreichen können. Das Kontingent berücksichtigt die Summe aus Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream
Cross-region Modellieren Sie Inferenzanfragen pro Minute für Amazon Nova 2 Lite	Jede unterstützte Region: 2.000	Nein	Die maximale Anzahl von regionsübergreifenden Anfragen, die Sie für Amazon Nova 2 Lite innerhalb einer Minute zur Modellinferenz einreichen können. Dieses Kontingent entspricht der Gesamtzahl der Anfragen an die Converse ConverseStream, InvokeModel und der Aktionen. InvokeModelWithResponseStream
Cross-region Modellieren Sie Inferenzanfragen pro Minute für Amazon Nova 2 Omni	Jede unterstützte Region: 2.000	Nein	Die maximale Anzahl von regionsübergreifenden Anfragen, die Sie für Amazon Nova 2 Omni innerhalb einer Minute zur Modellinferenz einreichen können. Dieses Kontingent entspricht der Gesamtzahl der Anfragen an die Converse,, ConverseStream und der Aktionen. InvokeModel InvokeModelWithResponseStream
Cross-region Modellinferenzanfragen pro Minute für Amazon Nova 2 Pro Preview	Jede unterstützte Region: 100	Nein	Die maximale Anzahl von regionsübergreifenden Anfragen, die Sie innerhalb einer Minute zur Modellinferenz für Amazon Nova 2 Pro Preview einreichen können. Dieses Kontingent entspricht der Gesamtzahl der Anfragen an die Converse, ConverseStream, InvokeModel und der Aktionen. InvokeModelWithResponseStream
Cross-region Modellieren Sie Inferenzanfragen pro Minute für Amazon Nova Lite	us-east-1:4.000 us-east-2:4.000 us-west-1:4.000 us-west-2:4.000 Jede der anderen unterstützten Regionen: 400	Nein	Die maximale Anzahl von regionsübergreifenden Anfragen, die Sie für Amazon Nova Lite innerhalb einer Minute zur Modellinferenz einreichen können. Dieses Kontingent entspricht der Gesamtzahl der Anfragen an die Converse, ConverseStream, InvokeModel und der Aktionen. InvokeModelWithResponseStream
Cross-region Modellieren Sie Inferenzanfragen pro Minute für Amazon Nova Micro	us-east-1:4.000 us-east-2:4.000 us-west-2:4.000 Jede der anderen unterstützten Regionen: 400	Nein	Die maximale Anzahl von regionsübergreifenden Anfragen, die Sie für Amazon Nova Micro innerhalb einer Minute zur Modellinferenz einreichen können. Dieses Kontingent entspricht der Gesamtzahl der Anfragen an die Converse, ConverseStream, InvokeModel und der Aktionen. InvokeModelWithResponseStream
Cross-region Modellieren Sie Inferenzanfragen pro Minute für Amazon Nova Premier V1	Jede unterstützte Region: 500	Nein	Die maximale Anzahl von regionsübergreifenden Anfragen, die Sie für Amazon Nova Premier V1 innerhalb einer Minute zur Modellinferenz einreichen können. Dieses Kontingent entspricht der Gesamtzahl der Anfragen an die Converse, ConverseStream, InvokeModel und der Aktionen. InvokeModelWithResponseStream
Cross-region Modellieren Sie Inferenzanfragen pro Minute für Amazon Nova Pro	Jede unterstützte Region: 500	Nein	Die maximale Anzahl von regionsübergreifenden Anfragen, die Sie für Amazon Nova Pro innerhalb einer Minute zur Modellinferenz einreichen können. Dieses Kontingent entspricht der Gesamtzahl der Anfragen an die Converse, ConverseStream, InvokeModel und der Aktionen. InvokeModelWithResponseStream
Cross-region Modellieren Sie Inferenzanfragen pro Minute für Anthropic Claude 3 Haiku	us-east-1: 2 000 us-west-2: 2 000 ap-northeast-1:400 ap-southeast-1:400 Jede der anderen unterstützten Regionen: 800	Nein	Die maximale Häufigkeit, mit der Sie in einer Minute Modellinferenz aufrufen können. Die Quote berücksichtigt die Summe aus Converse, ConverseStream, InvokeModel und InvokeModelWithResponseStream für Anthropic Claude 3 Haiku.
Cross-region Modellieren Sie Inferenzanfragen pro Minute für Anthropic Claude 3 Opus	Jede unterstützte Region: 100	Nein	Die maximale Anzahl von regionsübergreifenden Anfragen, die Sie für Anthropic Claude 3 Opus innerhalb einer Minute zur Modellinferenz einreichen können. Dieses Kontingent entspricht der Gesamtzahl der Anfragen an die Converse,, und der Aktionen. ConverseStream InvokeModel InvokeModelWithResponseStream
Cross-region Modellieren Sie Inferenzanfragen pro Minute für Anthropic Claude 3 Sonnet	us-east-1: 1,000 us-west-2: 1,000 Jede der anderen unterstützten Regionen: 200	Nein	Die maximale Häufigkeit, mit der Sie Modellinferenz in einer Minute aufrufen können. Die Quote berücksichtigt die Summe aus Converse, ConverseStream, InvokeModel und InvokeModelWithResponseStream für Anthropic Claude 3 Sonnet.
Cross-region Modellieren Sie Inferenzanfragen pro Minute für Anthropic Claude 3.5 Sonnet	us-west-2: 500 ap-northeast-1:40 ap-southeast-1:40 eu-central-1:40 eu-west-1: 40 EU-West-3:40 Jede der anderen unterstützten Regionen: 100	Nein	Die maximale Häufigkeit, mit der Sie in einer Minute Modellinferenz für Anthropic Claude 3.5 Sonnet aufrufen können. Das Kontingent berücksichtigt die Summe aus Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream
Cross-region Modellieren Sie Inferenzanfragen pro Minute für Anthropic Claude 3.7 Sonnet V1	us-east-1:250 us-east-2:250 US-West-2:250 eu-central-1: 100 eu-north-1:100 eu-west-1:100 eu-west-3:100 Jede der anderen unterstützten Regionen: 50	Nein	Die maximale Anzahl von regionsübergreifenden Anfragen, die Sie für Anthropic Claude 3.7 Sonnet V1 innerhalb einer Minute zur Modellinferenz einreichen können. Dieses Kontingent entspricht der Gesamtzahl der Anfragen an die Converse, und der Aktionen. ConverseStream InvokeModel InvokeModelWithResponseStream
Cross-region Modellieren Sie Inferenzanfragen pro Minute für Anthropic Claude Haiku 4.5	Jede unterstützte Region: 10 000	Ja	Die maximale Anzahl von regionsübergreifenden Anfragen, die Sie für Anthropic Claude Haiku 4.5 innerhalb einer Minute zur Modellinferenz einreichen können. Dieses Kontingent entspricht der Gesamtzahl der Anfragen an die Converse,, und der Aktionen. ConverseStream InvokeModel InvokeModelWithResponseStream
Cross-region Modellieren Sie Inferenzanfragen pro Minute für Anthropic Claude Opus 4 V1	Jede unterstützte Region: 200	Nein	Die maximale Anzahl von regionsübergreifenden Anfragen, die Sie für Anthropic Claude Opus 4 V1 innerhalb einer Minute zur Modellinferenz einreichen können. Dieses Kontingent entspricht der Gesamtzahl der Anfragen an die Converse,, und der Aktionen. ConverseStream InvokeModel InvokeModelWithResponseStream
Cross-region Modellieren Sie Inferenzanfragen pro Minute für Anthropic Claude Opus 4.1	Jede unterstützte Region: 50	Nein	Die maximale Anzahl von regionsübergreifenden Anfragen, die Sie für Anthropic Claude Opus 4.1 innerhalb einer Minute zur Modellinferenz einreichen können. Dieses Kontingent entspricht der Gesamtzahl der Anfragen an die Converse,, und der Aktionen. ConverseStream InvokeModel InvokeModelWithResponseStream
Cross-region Modellieren Sie Inferenzanfragen pro Minute für Anthropic Claude Opus 4.5	Jede unterstützte Region: 10 000	Ja	Die maximale Anzahl von regionsübergreifenden Anfragen, die Sie für Anthropic Claude Opus 4.5 innerhalb einer Minute zur Modellinferenz einreichen können. Dieses Kontingent entspricht der Gesamtzahl der Anfragen an die Converse, und der Aktionen. ConverseStream InvokeModel InvokeModelWithResponseStream
Cross-region modellieren Sie Inferenzanfragen pro Minute für Anthropic Claude Opus 4.6 V1	Jede unterstützte Region: 10 000	Ja	Die maximale Anzahl von regionsübergreifenden Anfragen, die Sie für Anthropic Claude Opus 4.6 V1 innerhalb einer Minute zur Modellinferenz einreichen können. Dieses Kontingent entspricht der Gesamtzahl der Anfragen an die Converse,, und der Aktionen. ConverseStream InvokeModel InvokeModelWithResponseStream
Cross-region Modellieren Sie Inferenzanfragen pro Minute für Anthropic Claude Sonnet 4 V1	Jede unterstützte Region: 200	Ja	Die maximale Anzahl von regionsübergreifenden Anfragen, die Sie für Anthropic Claude Sonnet 4 V1 innerhalb einer Minute zur Modellinferenz einreichen können. Dieses Kontingent entspricht der Gesamtzahl der Anfragen an die Converse,, und der Aktionen. ConverseStream InvokeModel InvokeModelWithResponseStream
Cross-region Modellieren Sie Inferenzanfragen pro Minute für Anthropic Claude Sonnet 4 V1 1M Context Length	Jede unterstützte Region: 5	Yes (Ja)	Die maximale Anzahl von regionsübergreifenden Anfragen, die Sie innerhalb einer Minute zur Modellinferenz für Anthropic Claude Sonnet 4 V1 1M Context Length einreichen können. Dieses Kontingent entspricht der Gesamtzahl der Anfragen an die Converse,, und Aktionen. ConverseStream InvokeModel InvokeModelWithResponseStream
Cross-region modellieren Sie Inferenzanfragen pro Minute für Anthropic Claude Sonnet 4.5 V1	Jede unterstützte Region: 10 000	Ja	Die maximale Anzahl von regionsübergreifenden Anfragen, die Sie für Anthropic Claude Sonnet 4.5 V1 innerhalb einer Minute zur Modellinferenz einreichen können. Dieses Kontingent entspricht der Gesamtzahl der Anfragen an die Converse,, und der Aktionen. ConverseStream InvokeModel InvokeModelWithResponseStream
Cross-region Modellieren Sie Inferenzanfragen pro Minute für Anthropic Claude Sonnet 4.5 V1 1M Context Length	Jede unterstützte Region: 1 000	Ja	Die maximale Anzahl von regionsübergreifenden Anfragen, die Sie innerhalb einer Minute zur Modellinferenz für Anthropic Claude Sonnet 4.5 V1 1M Context Length einreichen können. Dieses Kontingent entspricht der Gesamtzahl der Anfragen an die Converse,, und Aktionen. ConverseStream InvokeModel InvokeModelWithResponseStream
Cross-region Modellieren Sie Inferenzanfragen pro Minute für Anthropic Claude Sonnet 4.6	Jede unterstützte Region: 10 000	Ja	Die maximale Anzahl von regionsübergreifenden Anfragen, die Sie für Anthropic Claude Sonnet 4.6 innerhalb einer Minute zur Modellinferenz einreichen können. Dieses Kontingent entspricht der Gesamtzahl der Anfragen an die Converse, und der Aktionen. ConverseStream InvokeModel InvokeModelWithResponseStream
Cross-region modellieren Sie Inferenzanfragen pro Minute für Cohere Embed V4	Jede unterstützte Region: 2.000	Nein	Die maximale Anzahl von regionsübergreifenden Anfragen, die Sie für Cohere Embed V4 innerhalb einer Minute zur Modellinferenz einreichen können. Dieses Kontingent entspricht der Gesamtzahl der Anfragen an die Converse,, ConverseStream und der Aktionen. InvokeModel InvokeModelWithResponseStream
Cross-region Modellieren Sie Inferenzanfragen pro Minute für DeepSeek R1 V1	Jede unterstützte Region: 200	Nein	Die maximale Anzahl von regionsübergreifenden Anfragen, die Sie in einer Minute für R1 V1 zur Modellinferenz einreichen können. DeepSeek Dieses Kontingent entspricht der Gesamtzahl der Anfragen an die Converse,, ConverseStream und der Aktionen. InvokeModel InvokeModelWithResponseStream
Cross-region Modellieren Sie Inferenzanfragen pro Minute für Meta Llama 3.1 405B Instruct	Jede unterstützte Region: 400	Nein	Die maximale Anzahl von regionsübergreifenden Anfragen, die Sie innerhalb einer Minute zur Modellinferenz für Meta Llama 3.1 405B Instruct einreichen können. Dieses Kontingent entspricht der Gesamtzahl der Anfragen an die Converse,, und der Aktionen. ConverseStream InvokeModel InvokeModelWithResponseStream
Cross-region Modellieren Sie Inferenzanfragen pro Minute für Meta Llama 3.1 70B Instruct	Jede unterstützte Region: 800	Nein	Die maximale Anzahl von regionsübergreifenden Anfragen, die Sie innerhalb einer Minute zur Modellinferenz für Meta Llama 3.1 70B Instruct einreichen können. Dieses Kontingent entspricht der Gesamtzahl der Anfragen an die Converse,, und der Aktionen. ConverseStream InvokeModel InvokeModelWithResponseStream
Cross-region Modellieren Sie Inferenzanfragen pro Minute für Meta Llama 3.1 8B Instruct	Jede unterstützte Region: 1 600	Nein	Die maximale Anzahl von regionsübergreifenden Anfragen, die Sie innerhalb einer Minute zur Modellinferenz für Meta Llama 3.1 8B Instruct einreichen können. Dieses Kontingent entspricht der Gesamtzahl der Anfragen an die Converse,, und der Aktionen. ConverseStream InvokeModel InvokeModelWithResponseStream
Cross-region modellieren Sie Inferenzanfragen pro Minute für Meta Llama 3.2 1B Instruct	Jede unterstützte Region: 1 600	Nein	Die maximale Anzahl von regionsübergreifenden Anfragen, die Sie innerhalb einer Minute zur Modellinferenz für Meta Llama 3.2 1B Instruct einreichen können. Dieses Kontingent entspricht der Gesamtzahl der Anfragen an die Converse, und der Aktionen. ConverseStream InvokeModel InvokeModelWithResponseStream
Cross-region Modellieren Sie Inferenzanfragen pro Minute für Meta Llama 3.2 3B Instruct	Jede unterstützte Region: 1 600	Nein	Die maximale Häufigkeit, mit der Sie Modellinferenz in einer Minute für Meta Llama 3.2 3B Instruct aufrufen können. Das Kontingent berücksichtigt die kombinierte Summe der Anfragen für InvokeModel, InvokeModelWithResponseStream, Converse und. ConverseStream
Cross-region modellieren Sie Inferenzanfragen pro Minute für Meta Llama 3.3 70B Instruct	Jede unterstützte Region: 800	Nein	Die maximale Anzahl von regionsübergreifenden Anfragen, die Sie innerhalb einer Minute zur Modellinferenz für Meta Llama 3.3 70B Instruct einreichen können. Dieses Kontingent entspricht der Gesamtzahl der Anfragen an die Converse,, und der Aktionen. ConverseStream InvokeModel InvokeModelWithResponseStream
Cross-region Modellieren Sie Inferenzanfragen pro Minute für Meta Llama 4 Maverick V1	Jede unterstützte Region: 800	Nein	Die maximale Anzahl von regionsübergreifenden Anfragen, die Sie in einer Minute für Meta Llama 4 Maverick V1 zur Modellinferenz einreichen können. Dieses Kontingent entspricht der Gesamtzahl der Anfragen an die Converse,, und der Aktionen. ConverseStream InvokeModel InvokeModelWithResponseStream
Cross-region modellieren Sie Inferenzanfragen pro Minute für Meta Llama 4 Scout V1	Jede unterstützte Region: 800	Nein	Die maximale Anzahl von regionsübergreifenden Anfragen, die Sie in einer Minute für Meta Llama 4 Scout V1 zur Modellinferenz einreichen können. Dieses Kontingent entspricht der Gesamtzahl der Anfragen an die Converse,, ConverseStream und der Aktionen. InvokeModel InvokeModelWithResponseStream
Cross-region Modellieren Sie Inferenzanfragen pro Minute für Mistral Pixtral Large 25.02 V1	Jede unterstützte Region: 10	Nein	Die maximale Anzahl von regionsübergreifenden Anfragen, die Sie innerhalb einer Minute zur Modellinferenz für Mistral Pixtral Large 25.02 V1 einreichen können. Dieses Kontingent entspricht der Gesamtzahl der Anfragen an Converse,, und Aktionen. ConverseStream InvokeModel InvokeModelWithResponseStream
Cross-region Modellieren Sie Inferenzanfragen pro Minute für Stable Image Conservative Upscale	Jede unterstützte Region: 4	Nein	Die maximale Anzahl von regionsübergreifenden Anfragen, die Sie innerhalb einer Minute zur Modellinferenz für Stable Image Conservative Upscale einreichen können. Dieses Kontingent stellt die Gesamtzahl der Anfragen und Aktionen an die Converse dar. ConverseStream InvokeModel InvokeModelWithResponseStream
Cross-region Modellieren Sie Inferenzanfragen pro Minute für Stable Image Control Sketch	Jede unterstützte Region: 20	Nein	Die maximale Anzahl von regionsübergreifenden Anfragen, die Sie innerhalb einer Minute zur Modellinferenz für Stable Image Control Sketch einreichen können. Dieses Kontingent stellt die Gesamtzahl der Anfragen und Aktionen an die Converse dar. ConverseStream InvokeModel InvokeModelWithResponseStream
Cross-region Modellieren Sie Inferenzanfragen pro Minute für eine stabile Bildkontrollstruktur	Jede unterstützte Region: 20	Nein	Die maximale Anzahl von regionsübergreifenden Anfragen, die Sie für Stable Image Control Structure innerhalb einer Minute zur Modellinferenz einreichen können. Dieses Kontingent stellt die Gesamtzahl der Anfragen und Aktionen an die Converse dar. ConverseStream InvokeModel InvokeModelWithResponseStream
Cross-region Modellieren Sie Inferenzanfragen pro Minute für Stable Image Creative Upscale	Jede unterstützte Region: 4	Nein	Die maximale Anzahl von regionsübergreifenden Anfragen, die Sie innerhalb einer Minute zur Modellinferenz für Stable Image Creative Upscale einreichen können. Dieses Kontingent entspricht der Gesamtzahl der Anfragen und Aktionen an Converse. ConverseStream InvokeModel InvokeModelWithResponseStream
Cross-region Modellieren Sie Inferenzanfragen pro Minute für das Objekt Stable Image Erase	Jede unterstützte Region: 20	Nein	Die maximale Anzahl von regionsübergreifenden Anfragen, die Sie innerhalb einer Minute zur Modellinferenz für Stable Image Erase Object einreichen können. Dieses Kontingent stellt die Gesamtzahl der Anfragen und Aktionen an Converse dar. ConverseStream InvokeModel InvokeModelWithResponseStream
Cross-region Modellieren Sie Inferenzanfragen pro Minute für Stable Image Fast Upscale	Jede unterstützte Region: 20	Nein	Die maximale Anzahl von regionsübergreifenden Anfragen, die Sie innerhalb einer Minute zur Modellinferenz für Stable Image Fast Upscale einreichen können. Dieses Kontingent stellt die Gesamtzahl der Anfragen und Aktionen an die Converse dar. ConverseStream InvokeModel InvokeModelWithResponseStream
Cross-region Modellieren Sie Inferenzanfragen pro Minute für Stable Image Inpaint	Jede unterstützte Region: 20	Nein	Die maximale Anzahl von regionsübergreifenden Anfragen, die Sie innerhalb einer Minute zur Modellinferenz für Stable Image Inpaint einreichen können. Dieses Kontingent stellt die Gesamtzahl der Anfragen und Aktionen an die Converse dar. ConverseStream InvokeModel InvokeModelWithResponseStream
Cross-region Modellieren Sie Inferenzanfragen pro Minute für Stable Image Outpaint	Jede unterstützte Region: 4	Nein	Die maximale Anzahl von regionsübergreifenden Anfragen, die Sie innerhalb einer Minute zur Modellinferenz für Stable Image Outpaint einreichen können. Dieses Kontingent stellt die Gesamtzahl der Anfragen und Aktionen an die Converse dar. ConverseStream InvokeModel InvokeModelWithResponseStream
Cross-region Modellieren Sie Inferenzanfragen pro Minute für Stable Image Remove Background	Jede unterstützte Region: 20	Nein	Die maximale Anzahl von regionsübergreifenden Anfragen, die Sie innerhalb einer Minute zur Modellinferenz für die Option Stable Image Remove Background einreichen können. Dieses Kontingent entspricht der Gesamtzahl der Anfragen und Aktionen an Converse. ConverseStream InvokeModel InvokeModelWithResponseStream
Cross-region Modellieren Sie Inferenzanfragen pro Minute für Stable Image Search und Recolor	Jede unterstützte Region: 20	Nein	Die maximale Anzahl von regionsübergreifenden Anfragen, die Sie für Stable Image Search und Recolor innerhalb einer Minute zur Modellinferenz einreichen können. Dieses Kontingent entspricht der Gesamtzahl der Anfragen an Converse,, und ConverseStream Aktionen. InvokeModel InvokeModelWithResponseStream
Cross-region Modellieren Sie Inferenzanfragen pro Minute für Stable Image Search and Replace	Jede unterstützte Region: 20	Nein	Die maximale Anzahl von regionsübergreifenden Anfragen, die Sie innerhalb einer Minute zur Modellinferenz für Stable Image Search and Replace einreichen können. Dieses Kontingent entspricht der Gesamtzahl der Anfragen und Aktionen an Converse. ConverseStream InvokeModel InvokeModelWithResponseStream
Cross-region Modellieren Sie Inferenzanfragen pro Minute für den Stable Image Style Guide	Jede unterstützte Region: 20	Nein	Die maximale Anzahl von regionsübergreifenden Anfragen, die Sie innerhalb einer Minute zur Modellinferenz für den Stable Image Style Guide einreichen können. Dieses Kontingent entspricht der Gesamtzahl der Anfragen an die Converse, ConverseStream, InvokeModel und der Aktionen. InvokeModelWithResponseStream
Cross-region Modellieren Sie Inferenzanfragen pro Minute für Stable Image Style Transfer	Jede unterstützte Region: 20	Nein	Die maximale Anzahl von regionsübergreifenden Anfragen, die Sie innerhalb einer Minute zur Modellinferenz für Stable Image Style Transfer einreichen können. Dieses Kontingent stellt die Gesamtzahl der Anfragen und Aktionen an die Converse dar. ConverseStream InvokeModel InvokeModelWithResponseStream
Cross-region modellieren Sie Inferenzanfragen pro Minute für Twelve Labs Marengo	Jede unterstützte Region: 200	Nein	Die maximale Anzahl von regionsübergreifenden Anfragen, die Sie innerhalb einer Minute zur Modellinferenz für Twelve Labs Marengo einreichen können. Dieses Kontingent entspricht der Gesamtzahl der Anfragen an die Converse,, und der Aktionen. ConverseStream InvokeModel InvokeModelWithResponseStream
Cross-region modellieren Sie Inferenzanfragen pro Minute für Twelve Labs Pegasus	Jede unterstützte Region: 120	Ja	Die maximale Anzahl von regionsübergreifenden Anfragen, die Sie innerhalb einer Minute zur Modellinferenz für Twelve Labs Pegasus einreichen können. Das Kontingent berücksichtigt die Summe aus Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream
Cross-region Modellieren Sie Inferenzanfragen pro Minute für TwelveLabs Marengo Embed 3.0	Jede unterstützte Region: 1 000	Ja	Die maximale Anzahl von regionsübergreifenden Anfragen, die Sie für Marengo Embed 3.0 innerhalb einer Minute zur Modellinferenz einreichen können. TwelveLabs Dieses Kontingent entspricht der Gesamtzahl der Anfragen und Aktionen an Converse. ConverseStream InvokeModel InvokeModelWithResponseStream
Cross-region Modellieren Sie Inferenzanfragen pro Minute für Writer AI Palmyra X4 V1	Jede unterstützte Region: 10	Nein	Die maximale Anzahl von regionsübergreifenden Anfragen, die Sie in einer Minute zur Modellinferenz für Writer AI Palmyra X4 V1 einreichen können. Dieses Kontingent entspricht der Gesamtzahl der Anfragen an die Converse,, und der Aktionen. ConverseStream InvokeModel InvokeModelWithResponseStream
Cross-region Modellieren Sie Inferenzanfragen pro Minute für Writer AI Palmyra X5 V1	Jede unterstützte Region: 10	Nein	Die maximale Anzahl von regionsübergreifenden Anfragen, die Sie in einer Minute zur Modellinferenz für Writer AI Palmyra X5 V1 einreichen können. Dieses Kontingent entspricht der Gesamtzahl der Anfragen an die Converse,, und der Aktionen. ConverseStream InvokeModel InvokeModelWithResponseStream
Cross-region Modellieren Sie Inferenz-Token pro Minute für Amazon Nova 2 Lite	Jede unterstützte Region: 8.000.000	Ja	Die maximale Anzahl von regionsübergreifenden Token, die Sie innerhalb einer Minute für Amazon Nova 2 Lite zur Modellinferenz einreichen können. Das Kontingent berücksichtigt die kombinierte Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, ConverseStream und. InvokeModel InvokeModelWithResponseStream
Cross-region Modellieren Sie Inferenz-Token pro Minute für Amazon Nova 2 Omni	Jede unterstützte Region: 8.000.000	Ja	Die maximale Anzahl von regionsübergreifenden Token, die Sie innerhalb einer Minute für Amazon Nova 2 Omni zur Modellinferenz einreichen können. Das Kontingent berücksichtigt die kombinierte Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream
Cross-region Modellieren Sie Inferenz-Token pro Minute für Amazon Nova 2 Pro Preview	Jede unterstützte Region: 1 000 000	Ja	Die maximale Anzahl an regionsübergreifenden Tokens, die Sie innerhalb einer Minute zur Modellinferenz für Amazon Nova 2 Pro Preview einreichen können. Das Kontingent berücksichtigt die kombinierte Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, ConverseStream und. InvokeModel InvokeModelWithResponseStream
Cross-region Modellieren Sie Inferenz-Token pro Minute für Amazon Nova Lite	us-east-1:8.000.000 us-east-2:8.000.000 us-west-1:8.000.000 us-west-2:8.000.000 Jede der anderen unterstützten Regionen: 400.000	Ja	Die maximale Anzahl von regionsübergreifenden Token, die Sie innerhalb einer Minute für Amazon Nova Lite zur Modellinferenz einreichen können. Das Kontingent berücksichtigt die kombinierte Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, ConverseStream und. InvokeModel InvokeModelWithResponseStream
Cross-region Modellieren Sie Inferenz-Token pro Minute für Amazon Nova Micro	us-east-1:8.000.000 us-east-2:8.000.000 us-west-2:8.000.000 Jede der anderen unterstützten Regionen: 400.000	Ja	Die maximale Anzahl von regionsübergreifenden Token, die Sie innerhalb einer Minute für Amazon Nova Micro zur Modellinferenz einreichen können. Das Kontingent berücksichtigt die kombinierte Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, ConverseStream und. InvokeModel InvokeModelWithResponseStream
Cross-region Modellieren Sie Inferenz-Token pro Minute für Amazon Nova Premier V1	Jede unterstützte Region: 2.000.000	Ja	Die maximale Anzahl von regionsübergreifenden Token, die Sie innerhalb einer Minute für Amazon Nova Premier V1 zur Modellinferenz einreichen können. Das Kontingent berücksichtigt die kombinierte Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, ConverseStream und. InvokeModel InvokeModelWithResponseStream
Cross-region Modellieren Sie Inferenz-Token pro Minute für Amazon Nova Pro	Jede unterstützte Region: 2.000.000	Ja	Die maximale Anzahl von regionsübergreifenden Token, die Sie innerhalb einer Minute für Amazon Nova Pro zur Modellinferenz einreichen können. Das Kontingent berücksichtigt die kombinierte Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, ConverseStream und. InvokeModel InvokeModelWithResponseStream
Cross-region modellieren Sie Inferenz-Token pro Minute für das anthropische Claude-3-Haiku	us-east-1:4.000.000 us-west-2:4.000.000 ap-northeast-1:400.000 ap-southeast-1:400.000 Jede der anderen unterstützten Regionen: 600.000	Ja	Die maximale Anzahl von On-Demand-Token, die Sie innerhalb einer Minute zur Modellinferenz einreichen können. Die Quote berücksichtigt die Summe der Eingabe- und Ausgabetoken aller Anfragen an Converse InvokeModel und InvokeModelWithResponseStream für Anthropic Claude 3 Haiku. ConverseStream
Cross-region modellieren Sie Inferenz-Token pro Minute für Anthropic Claude 3 Opus	Jede unterstützte Region: 800.000	Ja	Die maximale Anzahl an regionsübergreifenden Tokens, die Sie innerhalb einer Minute für Anthropic Claude 3 Opus zur Modellinferenz einreichen können. Das Kontingent berücksichtigt die kombinierte Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream
Cross-region modellieren Sie Inferenz-Token pro Minute für Anthropic Claude 3 Sonnet	us-east-1:2.000.000 us-west-2:2.000.000 Jede der anderen unterstützten Regionen: 400.000	Ja	Die maximale Anzahl von On-Demand-Token, die Sie innerhalb einer Minute zur Modellinferenz einreichen können. Das Kontingent berücksichtigt die Summe der Eingabe- und Ausgabetoken aller Anfragen an Converse InvokeModel und InvokeModelWithResponseStream für Anthropic Claude 3 Sonnet. ConverseStream
Cross-region modellieren Sie Inferenz-Token pro Minute für Anthropic Claude 3.5 Sonnet	us-west-2:4.000.000 ap-northeast-1:400.000 ap-southeast-1:400.000 eu-central-1:400.000 eu-west-1:400.000 eu-west-3:400.000 Jede der anderen unterstützten Regionen: 800.000	Ja	Die maximale Anzahl von Tokens, die Sie in einer Minute für Anthropic Claude 3.5 Sonnet zur Modellinferenz einreichen können. Das Kontingent berücksichtigt die Summe aus Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream
Cross-region Modellieren Sie Inferenz-Token pro Minute für Anthropic Claude 3.7 Sonnet V1	us-east-1:1.000.000 us-east-2:1.000.000 us-west-2:1.000.000 eu-central-1:100.000 eu-north-1:100.000 eu-west-1:100.000 eu-west-3:100.000 Jede der anderen unterstützten Regionen: 50.000	Ja	Die maximale Anzahl regionsübergreifender Token, die Sie in einer Minute für Anthropic Claude 3.7 Sonnet V1 zur Modellinferenz einreichen können. Das Kontingent berücksichtigt die kombinierte Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream
Cross-region Modellieren Sie Inferenz-Token pro Minute für Anthropic Claude Fable 5	Jede unterstützte Region: 200 000	Ja	Die maximale Anzahl an regionsübergreifenden Tokens, die Sie für Anthropic Claude Fable 5 innerhalb einer Minute zur Modellinferenz einreichen können. Das Kontingent berücksichtigt die kombinierte Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream
Cross-region modellieren Sie Inferenz-Token pro Minute für Anthropic Claude Haiku 4.5	Jede unterstützte Region: 5 000 000	Ja	Die maximale Anzahl an regionsübergreifenden Tokens, die Sie für Anthropic Claude Haiku 4.5 innerhalb einer Minute zur Modellinferenz einreichen können. Das Kontingent berücksichtigt die kombinierte Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream
Cross-region modellieren Sie Inferenz-Token pro Minute für Anthropic Claude Opus 4 V1	Jede unterstützte Region: 200 000	Ja	Die maximale Anzahl von regionsübergreifenden Token, die Sie innerhalb einer Minute zur Modellinferenz für Anthropic Claude Opus 4 V1 einreichen können. Das Kontingent berücksichtigt die kombinierte Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream
Cross-region modellieren Sie Inferenz-Token pro Minute für Anthropic Claude Opus 4.1	Jede unterstützte Region: 500 000	Ja	Die maximale Anzahl von regionsübergreifenden Tokens, die Sie für Anthropic Claude Opus 4.1 innerhalb einer Minute zur Modellinferenz einreichen können. Das Kontingent berücksichtigt die kombinierte Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream
Cross-region modellieren Sie Inferenz-Token pro Minute für Anthropic Claude Opus 4.5	Jede unterstützte Region: 2.000.000	Ja	Die maximale Anzahl regionsübergreifender Token, die Sie für Anthropic Claude Opus 4.5 innerhalb einer Minute zur Modellinferenz einreichen können. Das Kontingent berücksichtigt die kombinierte Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream
Cross-region modellieren Sie Inferenz-Token pro Minute für Anthropic Claude Opus 4.6 V1	Jede unterstützte Region: 3.000.000	Ja	Die maximale Anzahl regionsübergreifender Token, die Sie für Anthropic Claude Opus 4.6 V1 innerhalb einer Minute zur Modellinferenz einreichen können. Das Kontingent berücksichtigt die kombinierte Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream
Cross-region modellieren Sie Inferenz-Token pro Minute für Anthropic Claude Opus 4.7	Jede unterstützte Region: 10 000 000	Ja	Die maximale Anzahl von regionsübergreifenden Tokens, die Sie für Anthropic Claude Opus 4.7 innerhalb einer Minute zur Modellinferenz einreichen können. Das Kontingent berücksichtigt die kombinierte Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream
Cross-region modellieren Sie Inferenz-Token pro Minute für Anthropic Claude Opus 4.8	Jede unterstützte Region: 30.000.000	Ja	Die maximale Anzahl regionsübergreifender Token, die Sie für Anthropic Claude Opus 4.8 innerhalb einer Minute zur Modellinferenz einreichen können. Das Kontingent berücksichtigt die kombinierte Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream
Cross-region modellieren Sie Inferenz-Token pro Minute für Anthropic Claude Sonnet 4 V1	Jede unterstützte Region: 200 000	Ja	Die maximale Anzahl von regionsübergreifenden Token, die Sie für Anthropic Claude Sonnet 4 V1 innerhalb einer Minute zur Modellinferenz einreichen können. Das Kontingent berücksichtigt die kombinierte Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream
Cross-region Modellieren Sie Inferenz-Token pro Minute für Anthropic Claude Sonnet 4 V1 1M Kontextlänge	Jede unterstützte Region: 1 000 000	Ja	Die maximale Anzahl von regionsübergreifenden Token, die Sie innerhalb einer Minute zur Modellinferenz für Anthropic Claude Sonnet 4 V1 1M Context Length einreichen können. Das Kontingent berücksichtigt die kombinierte Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream
Cross-region modellieren Sie Inferenz-Token pro Minute für Anthropic Claude Sonnet 4.5 V1	Jede unterstützte Region: 5 000 000	Ja	Die maximale Anzahl von regionsübergreifenden Token, die Sie für Anthropic Claude Sonnet 4.5 V1 innerhalb einer Minute zur Modellinferenz einreichen können. Das Kontingent berücksichtigt die kombinierte Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream
Cross-region Modellieren Sie Inferenz-Token pro Minute für Anthropic Claude Sonnet 4.5 V1 1M Kontextlänge	Jede unterstützte Region: 1 000 000	Ja	Die maximale Anzahl von regionsübergreifenden Tokens, die Sie für Anthropic Claude Sonnet 4.5 V1 1M Context Length innerhalb einer Minute zur Modellinferenz einreichen können. Das Kontingent berücksichtigt die kombinierte Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream
Cross-region modellieren Sie Inferenz-Token pro Minute für Anthropic Claude Sonnet 4.6	Jede unterstützte Region: 6.000.000	Ja	Die maximale Anzahl regionsübergreifender Token, die Sie für Anthropic Claude Sonnet 4.6 innerhalb einer Minute zur Modellinferenz einreichen können. Das Kontingent berücksichtigt die kombinierte Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream
Cross-region modellieren Sie Inferenz-Token pro Minute für Anthropic Claude Sonnet 5	Jede unterstützte Region: 6.000.000	Ja	Die maximale Anzahl regionsübergreifender Token, die Sie für Anthropic Claude Sonnet 5 innerhalb einer Minute zur Modellinferenz einreichen können. Das Kontingent berücksichtigt die kombinierte Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream
Cross-region modellieren Sie Inferenz-Token pro Minute für Cohere Embed V4	Jede unterstützte Region: 300 000	Ja	Die maximale Anzahl von regionsübergreifenden Token, die Sie für Cohere Embed V4 innerhalb einer Minute zur Modellinferenz einreichen können. Das Kontingent berücksichtigt die kombinierte Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream
Cross-region modellieren Sie Inferenz-Token pro Minute für DeepSeek R1 V1	Jede unterstützte Region: 200 000	Ja	Die maximale Anzahl von regionsübergreifenden Token, die Sie in einer Minute für R1 V1 zur Modellinferenz einreichen können. DeepSeek Das Kontingent berücksichtigt die kombinierte Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream
Cross-region modellieren Sie Inferenz-Token pro Minute für Meta Llama 3.1 405B Instruct	Jede unterstützte Region: 800.000	Ja	Die maximale Anzahl regionsübergreifender Token, die Sie innerhalb einer Minute zur Modellinferenz für Meta Llama 3.1 405B Instruct einreichen können. Das Kontingent berücksichtigt die kombinierte Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream
Cross-region modellieren Sie Inferenz-Token pro Minute für Meta Llama 3.1 70B Instruct	Jede unterstützte Region: 600.000	Ja	Die maximale Anzahl regionsübergreifender Token, die Sie innerhalb einer Minute zur Modellinferenz für Meta Llama 3.1 70B Instruct einreichen können. Das Kontingent berücksichtigt die kombinierte Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream
Cross-region modellieren Sie Inferenz-Token pro Minute für Meta Llama 3.1 8B Instruct	Jede unterstützte Region: 600.000	Ja	Die maximale Anzahl regionsübergreifender Token, die Sie innerhalb einer Minute zur Modellinferenz für Meta Llama 3.1 8B Instruct einreichen können. Das Kontingent berücksichtigt die kombinierte Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream
Cross-region modellieren Sie Inferenz-Token pro Minute für Meta Llama 3.2 1B Instruct	Jede unterstützte Region: 600.000	Ja	Die maximale Anzahl regionsübergreifender Token, die Sie innerhalb einer Minute zur Modellinferenz für Meta Llama 3.2 1B Instruct einreichen können. Das Kontingent berücksichtigt die kombinierte Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream
Cross-region modellieren Sie Inferenz-Token pro Minute für Meta Llama 3.2 3B Instruct	Jede unterstützte Region: 600.000	Ja	Die maximale Anzahl von Tokens, die Sie in einer Minute zur Modellinferenz für Meta Llama 3.2 3B Instruct einreichen können. Die Quote berücksichtigt die kombinierte Summe der Tokens für InvokeModel, InvokeModelWithResponseStream, Converse und. ConverseStream
Cross-region modellieren Sie Inferenz-Token pro Minute für Meta Llama 3.3 70B Instruct	Jede unterstützte Region: 600.000	Ja	Die maximale Anzahl regionsübergreifender Token, die Sie innerhalb einer Minute zur Modellinferenz für Meta Llama 3.3 70B Instruct einreichen können. Das Kontingent berücksichtigt die kombinierte Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream
Cross-region Modellieren Sie Inferenz-Token pro Minute für Meta Llama 4 Maverick V1	Jede unterstützte Region: 600.000	Ja	Die maximale Anzahl regionsübergreifender Token, die Sie in einer Minute für Meta Llama 4 Maverick V1 zur Modellinferenz einreichen können. Das Kontingent berücksichtigt die kombinierte Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream
Cross-region modellieren Sie Inferenz-Token pro Minute für Meta Llama 4 Scout V1	Jede unterstützte Region: 600.000	Ja	Die maximale Anzahl regionsübergreifender Token, die Sie in einer Minute für Meta Llama 4 Scout V1 zur Modellinferenz einreichen können. Das Kontingent berücksichtigt die kombinierte Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream
Cross-region Modellieren Sie Inferenz-Token pro Minute für Mistral Pixtral Large 25.02 V1	Jede unterstützte Region: 80 000	Ja	Die maximale Anzahl von regionsübergreifenden Token, die Sie innerhalb einer Minute zur Modellinferenz für Mistral Pixtral Large 25.02 V1 einreichen können. Das Kontingent berücksichtigt die kombinierte Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream
Cross-region modellieren Sie Inferenz-Token pro Minute für Writer AI Palmyra X4 V1	Jede unterstützte Region: 150 000	Ja	Die maximale Anzahl von regionsübergreifenden Token, die Sie in einer Minute zur Modellinferenz für Writer AI Palmyra X4 V1 einreichen können. Das Kontingent berücksichtigt die kombinierte Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream
Cross-region Modellieren Sie Inferenz-Token pro Minute für Writer AI Palmyra X5 V1	Jede unterstützte Region: 150 000	Ja	Die maximale Anzahl von regionsübergreifenden Token, die Sie in einer Minute zur Modellinferenz für Writer AI Palmyra X5 V1 einreichen können. Das Kontingent berücksichtigt die kombinierte Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream
Benutzerdefinierte Modelle mit einem Erstellungsstatus pro Konto	Jede unterstützte Region: 2	Ja	Die maximale Anzahl von benutzerdefinierten Modellen mit dem Status „Erstellen“.
DeleteAgent Anfragen pro Sekunde	Jede unterstützte Region: 2	Nein	Die maximale Anzahl von DeleteAgent API-Anfragen pro Sekunde.
DeleteAgentActionGroup Anfragen pro Sekunde	Jede unterstützte Region: 2	Nein	Die maximale Anzahl von DeleteAgentActionGroup API-Anfragen pro Sekunde.
DeleteAgentAlias Anfragen pro Sekunde	Jede unterstützte Region: 2	Nein	Die maximale Anzahl von DeleteAgentAlias API-Anfragen pro Sekunde.
DeleteAgentVersion Anfragen pro Sekunde	Jede unterstützte Region: 2	Nein	Die maximale Anzahl von DeleteAgentVersion API-Anfragen pro Sekunde.
DisassociateAgentKnowledgeBase Anfragen pro Sekunde	Jede unterstützte Region: 4	Nein	Die maximale Anzahl von DisassociateAgentKnowledgeBase API-Anfragen pro Sekunde.
Aktivierte Aktionsgruppen pro Agent	Jede unterstützte Region: 15	Ja	Die maximale Anzahl von Aktionsgruppen, die Sie in einem Agenten aktivieren können.
Endpunkte pro Inferenzprofil	Jede unterstützte Region: 5	Nein	Die maximale Anzahl von Endpunkten in einem Inferenzprofil. Ein Endpunkt wird durch ein Modell und die Region definiert, an die die Aufrufanforderungen an das Modell gesendet werden.
GetAgent Anfragen pro Sekunde	Jede unterstützte Region: 15	Nein	Die maximale Anzahl von GetAgent API-Anfragen pro Sekunde.
GetAgentActionGroup Anfragen pro Sekunde	Jede unterstützte Region: 20	Nein	Die maximale Anzahl von GetAgentActionGroup API-Anfragen pro Sekunde.
GetAgentAlias Anfragen pro Sekunde	Jede unterstützte Region: 10	Nein	Die maximale Anzahl von GetAgentAlias API-Anfragen pro Sekunde.
GetAgentKnowledgeBase Anfragen pro Sekunde	Jede unterstützte Region: 15	Nein	Die maximale Anzahl von GetAgentKnowledgeBase API-Anfragen pro Sekunde.
GetAgentVersion Anfragen pro Sekunde	Jede unterstützte Region: 10	Nein	Die maximale Anzahl von GetAgentVersion API-Anfragen pro Sekunde.
Globale regionsübergreifende Modellinferenzanfragen pro Minute für Amazon Nova 2 Lite	Jede unterstützte Region: 2.000	Ja	Die maximale Anzahl globaler regionsübergreifender Anfragen, die Sie für Amazon Nova 2 Lite innerhalb einer Minute zur Modellinferenz einreichen können. Dieses Kontingent entspricht der Gesamtzahl der Anfragen an die Converse, ConverseStream, InvokeModel und der Aktionen. InvokeModelWithResponseStream
Globale regionsübergreifende Modellinferenzanfragen pro Minute für Amazon Nova 2 Omni	Jede unterstützte Region: 2.000	Ja	Die maximale Anzahl globaler regionsübergreifender Anfragen, die Sie für Amazon Nova 2 Omni innerhalb einer Minute zur Modellinferenz einreichen können. Dieses Kontingent entspricht der Gesamtzahl der Anfragen an die Converse, ConverseStream und der Aktionen. InvokeModel InvokeModelWithResponseStream
Globale regionsübergreifende Modellinferenzanfragen pro Minute für Amazon Nova 2 Pro Preview	Jede unterstützte Region: 100	Yes (Ja)	Die maximale Anzahl globaler regionsübergreifender Anfragen, die Sie innerhalb einer Minute zur Modellinferenz für Amazon Nova 2 Pro Preview einreichen können. Dieses Kontingent entspricht der Gesamtzahl der Anfragen an die Converse ConverseStream, InvokeModel und der Aktionen. InvokeModelWithResponseStream
Globales regionsübergreifendes Modell Inferenzanfragen pro Minute für Anthropic Claude Haiku 4.5	Jede unterstützte Region: 10 000	Ja	Die maximale Anzahl globaler regionsübergreifender Anfragen, die Sie für Anthropic Claude Haiku 4.5 innerhalb einer Minute zur Modellinferenz einreichen können. Dieses Kontingent entspricht der Gesamtzahl der Anfragen an die Converse,, und der Aktionen. ConverseStream InvokeModel InvokeModelWithResponseStream
Globales regionsübergreifendes Modell Inferenzanfragen pro Minute für Anthropic Claude Opus 4.5	Jede unterstützte Region: 10 000	Ja	Die maximale Anzahl globaler regionsübergreifender Anfragen, die Sie für Anthropic Claude Opus 4.5 innerhalb einer Minute zur Modellinferenz einreichen können. Dieses Kontingent entspricht der Gesamtzahl der Anfragen an die Converse, und der Aktionen. ConverseStream InvokeModel InvokeModelWithResponseStream
Globales regionsübergreifendes Modell Inferenzanfragen pro Minute für Anthropic Claude Opus 4.6 V1	Jede unterstützte Region: 10 000	Ja	Die maximale Anzahl globaler regionsübergreifender Anfragen, die Sie innerhalb einer Minute zur Modellinferenz für Anthropic Claude Opus 4.6 V1 einreichen können. Dieses Kontingent entspricht der Gesamtzahl der Anfragen an die Converse,, und der Aktionen. ConverseStream InvokeModel InvokeModelWithResponseStream
Globales regionsübergreifendes Modell Inferenzanfragen pro Minute für Anthropic Claude Sonnet 4 V1	Jede unterstützte Region: 200	Ja	Die maximale Anzahl globaler regionsübergreifender Anfragen, die Sie innerhalb einer Minute zur Modellinferenz für Anthropic Claude Sonnet 4 V1 einreichen können. Dieses Kontingent entspricht der Gesamtzahl der Anfragen an die Converse,, und der Aktionen. ConverseStream InvokeModel InvokeModelWithResponseStream
Globales regionsübergreifendes Modell Inferenzanfragen pro Minute für Anthropic Claude Sonnet 4.5 V1	Jede unterstützte Region: 10 000	Ja	Die maximale Anzahl globaler regionsübergreifender Anfragen, die Sie innerhalb einer Minute zur Modellinferenz für Anthropic Claude Sonnet 4.5 V1 einreichen können. Dieses Kontingent entspricht der Gesamtzahl der Anfragen an die Converse,, und der Aktionen. ConverseStream InvokeModel InvokeModelWithResponseStream
Globales regionsübergreifendes Modell Inferenzanfragen pro Minute für Anthropic Claude Sonnet 4.5 V1 1M Context Length	Jede unterstützte Region: 1 000	Ja	Die maximale Anzahl globaler regionsübergreifender Anfragen, die Sie innerhalb einer Minute zur Modellinferenz für Anthropic Claude Sonnet 4.5 V1 1M Context Length einreichen können. Dieses Kontingent entspricht der Gesamtzahl der Anfragen an die Converse,, und Aktionen. ConverseStream InvokeModel InvokeModelWithResponseStream
Globales regionsübergreifendes Modell Inferenzanfragen pro Minute für Anthropic Claude Sonnet 4.6	Jede unterstützte Region: 10 000	Ja	Die maximale Anzahl globaler regionsübergreifender Anfragen, die Sie für Anthropic Claude Sonnet 4.6 innerhalb einer Minute zur Modellinferenz einreichen können. Dieses Kontingent entspricht der Gesamtzahl der Anfragen an die Converse, und der Aktionen. ConverseStream InvokeModel InvokeModelWithResponseStream
Globales regionsübergreifendes Modell Inferenzanfragen pro Minute für Cohere Embed V4	Jede unterstützte Region: 2.000	Ja	Die maximale Anzahl globaler regionsübergreifender Anfragen, die Sie innerhalb einer Minute zur Modellinferenz für Cohere Embed V4 einreichen können. Dieses Kontingent entspricht der Gesamtzahl der Anfragen an die Converse,, ConverseStream und der Aktionen. InvokeModel InvokeModelWithResponseStream
Globales regionsübergreifendes Modell Inferenz-Token pro Tag für Amazon Nova 2 Lite	Jede unterstützte Region: 11.520.000.000	Nein	Die maximale Anzahl globaler regionsübergreifender Token, die Sie an einem Tag für Amazon Nova 2 Lite zur Modellinferenz einreichen können. Das Kontingent berücksichtigt die kombinierte Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, ConverseStream und. InvokeModel InvokeModelWithResponseStream
Globales regionsübergreifendes Modell Inferenz-Token pro Tag für Amazon Nova 2 Omni	Jede unterstützte Region: 11.520.000.000	Nein	Die maximale Anzahl globaler regionsübergreifender Token, die Sie an einem Tag zur Modellinferenz für Amazon Nova 2 Omni einreichen können. Das Kontingent berücksichtigt die kombinierte Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream
Globales regionsübergreifendes Modell Inferenz-Token pro Tag für Amazon Nova 2 Pro Preview	Jede unterstützte Region: 1.440.000.000	Nein	Die maximale Anzahl globaler regionsübergreifender Token, die Sie an einem Tag zur Modellinferenz für Amazon Nova 2 Pro Preview einreichen können. Das Kontingent berücksichtigt die kombinierte Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, ConverseStream und. InvokeModel InvokeModelWithResponseStream
Globales regionsübergreifendes Modell Inferenz-Token pro Tag für Anthropic Claude Fable 5	Jede unterstützte Region: 720.000.000	Nein	Die maximale Anzahl globaler regionsübergreifender Token, die Sie an einem Tag zur Modellinferenz für Anthropic Claude Fable 5 einreichen können. Das Kontingent berücksichtigt die kombinierte Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream
Globales regionsübergreifendes Modell Inferenz-Token pro Tag für Anthropic Claude Haiku 4.5	Jede unterstützte Region: 7.200.000.000	Nein	Die maximale Anzahl globaler regionsübergreifender Token, die Sie an einem Tag zur Modellinferenz für Anthropic Claude Haiku 4.5 einreichen können. Das Kontingent berücksichtigt die kombinierte Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream
Globales regionsübergreifendes Modell Inferenz-Token pro Tag für Anthropic Claude Opus 4.5	Jede unterstützte Region: 2.880.000.000	Nein	Die maximale Anzahl globaler regionsübergreifender Token, die Sie an einem Tag für Anthropic Claude Opus 4.5 zur Modellinferenz einreichen können. Das Kontingent berücksichtigt die kombinierte Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream
Globales regionsübergreifendes Modell Inferenz-Token pro Tag für Anthropic Claude Opus 4.6 V1	Jede unterstützte Region: 4.320.000.000	Nein	Die maximale Anzahl globaler regionsübergreifender Token, die Sie an einem Tag für Anthropic Claude Opus 4.6 V1 zur Modellinferenz einreichen können. Das Kontingent berücksichtigt die kombinierte Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream
Globales regionsübergreifendes Modell Inferenz-Token pro Tag für Anthropic Claude Opus 4.7	Jede unterstützte Region: 14.400.000.000	Nein	Die maximale Anzahl globaler regionsübergreifender Token, die Sie an einem Tag zur Modellinferenz für Anthropic Claude Opus 4.7 einreichen können. Das Kontingent berücksichtigt die kombinierte Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream
Globales regionsübergreifendes Modell Inferenz-Token pro Tag für Anthropic Claude Opus 4.8	Jede unterstützte Region: 43.200.000.000	Nein	Die maximale Anzahl globaler regionsübergreifender Token, die Sie an einem Tag zur Modellinferenz für Anthropic Claude Opus 4.8 einreichen können. Das Kontingent berücksichtigt die kombinierte Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream
Globales regionsübergreifendes Modell Inferenz-Token pro Tag für Anthropic Claude Sonnet 4 V1	Jede unterstützte Region: 288.000.000	Nein	Die maximale Anzahl globaler regionsübergreifender Token, die Sie an einem Tag zur Modellinferenz für Anthropic Claude Sonnet 4 V1 einreichen können. Das Kontingent berücksichtigt die kombinierte Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream
Globales regionsübergreifendes Modell Inferenz-Token pro Tag für Anthropic Claude Sonnet 4.5 V1	Jede unterstützte Region: 7.200.000.000	Nein	Die maximale Anzahl globaler regionsübergreifender Token, die Sie an einem Tag zur Modellinferenz für Anthropic Claude Sonnet 4.5 V1 einreichen können. Das Kontingent berücksichtigt die kombinierte Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream
Globales regionsübergreifendes Modell Inferenz-Token pro Tag für Anthropic Claude Sonnet 4.5 V1 1M Context Length	Jede unterstützte Region: 1.440.000.000	Nein	Die maximale Anzahl globaler regionsübergreifender Token, die Sie an einem Tag zur Modellinferenz für Anthropic Claude Sonnet 4.5 V1 1M Context Length einreichen können. Das Kontingent berücksichtigt die kombinierte Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream
Globales regionsübergreifendes Modell Inferenz-Token pro Tag für Anthropic Claude Sonnet 4.6	Jede unterstützte Region: 8.640.000.000	Nein	Die maximale Anzahl globaler regionsübergreifender Token, die Sie an einem Tag zur Modellinferenz für Anthropic Claude Sonnet 4.6 einreichen können. Das Kontingent berücksichtigt die kombinierte Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream
Globales regionsübergreifendes Modell Inferenz-Token pro Tag für Anthropic Claude Sonnet 5	Jede unterstützte Region: 8.640.000.000	Nein	Die maximale Anzahl globaler regionsübergreifender Token, die Sie an einem Tag zur Modellinferenz für Anthropic Claude Sonnet 5 einreichen können. Das Kontingent berücksichtigt die kombinierte Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream
Globales regionsübergreifendes Modell Inferenz-Token pro Tag für Cohere Embed V4	Jede unterstützte Region: 432.000.000	Nein	Die maximale Anzahl globaler regionsübergreifender Token, die Sie an einem Tag zur Modellinferenz für Cohere Embed V4 einreichen können. Das Kontingent berücksichtigt die kombinierte Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream
Globales regionsübergreifendes Modell Inferenz-Token pro Minute für Amazon Nova 2 Lite	Jede unterstützte Region: 8.000.000	Ja	Die maximale Anzahl globaler regionsübergreifender Token, die Sie innerhalb einer Minute für Amazon Nova 2 Lite zur Modellinferenz einreichen können. Das Kontingent berücksichtigt die kombinierte Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, ConverseStream und. InvokeModel InvokeModelWithResponseStream
Globales regionsübergreifendes Modell Inferenz-Token pro Minute für Amazon Nova 2 Omni	Jede unterstützte Region: 8.000.000	Ja	Die maximale Anzahl globaler regionsübergreifender Token, die Sie innerhalb einer Minute zur Modellinferenz für Amazon Nova 2 Omni einreichen können. Das Kontingent berücksichtigt die kombinierte Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream
Globales regionsübergreifendes Modell Inferenz-Token pro Minute für Amazon Nova 2 Pro Preview	Jede unterstützte Region: 1 000 000	Ja	Die maximale Anzahl globaler regionsübergreifender Token, die Sie innerhalb einer Minute zur Modellinferenz für Amazon Nova 2 Pro Preview einreichen können. Das Kontingent berücksichtigt die kombinierte Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, ConverseStream und. InvokeModel InvokeModelWithResponseStream
Globales regionsübergreifendes Modell Inferenz-Token pro Minute für Anthropic Claude Fable 5	Jede unterstützte Region: 500 000	Ja	Die maximale Anzahl globaler regionsübergreifender Tokens, die Sie innerhalb einer Minute zur Modellinferenz für Anthropic Claude Fable 5 einreichen können. Das Kontingent berücksichtigt die kombinierte Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream
Globales regionsübergreifendes Modell Inferenz-Token pro Minute für Anthropic Claude Haiku 4.5	Jede unterstützte Region: 5 000 000	Ja	Die maximale Anzahl globaler regionsübergreifender Tokens, die Sie für Anthropic Claude Haiku 4.5 innerhalb einer Minute zur Modellinferenz einreichen können. Das Kontingent berücksichtigt die kombinierte Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream
Globales regionsübergreifendes Modell Inferenz-Token pro Minute für Anthropic Claude Opus 4.5	Jede unterstützte Region: 2.000.000	Ja	Die maximale Anzahl globaler regionsübergreifender Token, die Sie in einer Minute für Anthropic Claude Opus 4.5 zur Modellinferenz einreichen können. Das Kontingent berücksichtigt die kombinierte Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream
Globales regionsübergreifendes Modell Inferenz-Token pro Minute für Anthropic Claude Opus 4.6 V1	Jede unterstützte Region: 3.000.000	Ja	Die maximale Anzahl globaler regionsübergreifender Token, die Sie in einer Minute für Anthropic Claude Opus 4.6 V1 zur Modellinferenz einreichen können. Das Kontingent berücksichtigt die kombinierte Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream
Globales regionsübergreifendes Modell Inferenz-Token pro Minute für Anthropic Claude Opus 4.7	Jede unterstützte Region: 10 000 000	Ja	Die maximale Anzahl globaler regionsübergreifender Tokens, die Sie innerhalb einer Minute zur Modellinferenz für Anthropic Claude Opus 4.7 einreichen können. Das Kontingent berücksichtigt die kombinierte Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream
Globales regionsübergreifendes Modell Inferenz-Token pro Minute für Anthropic Claude Opus 4.8	Jede unterstützte Region: 30.000.000	Ja	Die maximale Anzahl globaler regionsübergreifender Tokens, die Sie innerhalb einer Minute zur Modellinferenz für Anthropic Claude Opus 4.8 einreichen können. Das Kontingent berücksichtigt die kombinierte Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream
Globales regionsübergreifendes Modell Inferenz-Token pro Minute für Anthropic Claude Sonnet 4 V1	Jede unterstützte Region: 200 000	Ja	Die maximale Anzahl globaler regionsübergreifender Tokens, die Sie innerhalb einer Minute zur Modellinferenz für Anthropic Claude Sonnet 4 V1 einreichen können. Das Kontingent berücksichtigt die kombinierte Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream
Globales regionsübergreifendes Modell Inferenz-Token pro Minute für Anthropic Claude Sonnet 4.5 V1	Jede unterstützte Region: 5 000 000	Ja	Die maximale Anzahl globaler regionsübergreifender Tokens, die Sie für Anthropic Claude Sonnet 4.5 V1 innerhalb einer Minute zur Modellinferenz einreichen können. Das Kontingent berücksichtigt die kombinierte Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream
Globales regionsübergreifendes Modell Inferenz-Token pro Minute für Anthropic Claude Sonnet 4.5 V1 1M Context Length	Jede unterstützte Region: 1 000 000	Ja	Die maximale Anzahl globaler regionsübergreifender Tokens, die Sie innerhalb einer Minute zur Modellinferenz für Anthropic Claude Sonnet 4.5 V1 1M Context Length einreichen können. Das Kontingent berücksichtigt die kombinierte Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream
Globales regionsübergreifendes Modell Inferenz-Token pro Minute für Anthropic Claude Sonnet 4.6	Jede unterstützte Region: 6.000.000	Ja	Die maximale Anzahl globaler regionsübergreifender Token, die Sie für Anthropic Claude Sonnet 4.6 innerhalb einer Minute zur Modellinferenz einreichen können. Das Kontingent berücksichtigt die kombinierte Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream
Globales regionsübergreifendes Modell Inferenz-Token pro Minute für Anthropic Claude Sonnet 5	Jede unterstützte Region: 6.000.000	Ja	Die maximale Anzahl globaler regionsübergreifender Token, die Sie innerhalb einer Minute zur Modellinferenz für Anthropic Claude Sonnet 5 einreichen können. Das Kontingent berücksichtigt die kombinierte Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream
Globales regionsübergreifendes Modell Inferenz-Token pro Minute für Cohere Embed V4	Jede unterstützte Region: 300 000	Ja	Die maximale Anzahl globaler regionsübergreifender Token, die Sie innerhalb einer Minute zur Modellinferenz für Cohere Embed V4 einreichen können. Das Kontingent berücksichtigt die kombinierte Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream
Importierte Modelle pro Konto	Jede unterstützte Region: 3	Ja	Die maximale Anzahl importierter Modelle in einem Konto.
Inferenzprofile pro Konto	Jede unterstützte Region: 1 000	Ja	Die maximale Anzahl von Inferenzprofilen in einem Konto.
ListAgentActionGroups Anfragen pro Sekunde	Jede unterstützte Region: 10	Nein	Die maximale Anzahl von ListAgentActionGroups API-Anfragen pro Sekunde.
ListAgentAliases Anfragen pro Sekunde	Jede unterstützte Region: 10	Nein	Die maximale Anzahl von ListAgentAliases API-Anfragen pro Sekunde.
ListAgentKnowledgeBases Anfragen pro Sekunde	Jede unterstützte Region: 10	Nein	Die maximale Anzahl von ListAgentKnowledgeBases API-Anfragen pro Sekunde.
ListAgentVersions Anfragen pro Sekunde	Jede unterstützte Region: 10	Nein	Die maximale Anzahl von ListAgentVersions API-Anfragen pro Sekunde.
ListAgents Anfragen pro Sekunde	Jede unterstützte Region: 10	Nein	Die maximale Anzahl von ListAgents API-Anfragen pro Sekunde.
Mindestanzahl von Datensätzen pro Batch-Inferenzjob für Amazon Nova 2 Multimodal Embeddings V1	Jede unterstützte Region: 100	Nein	Die Mindestanzahl von Datensätzen in allen Eingabedateien in einem Batch-Inferenzjob für Amazon Nova 2 Multimodal Embeddings V1.
Mindestanzahl von Datensätzen pro Batch-Inferenzauftrag für Amazon Nova Premier	Jede unterstützte Region: 100	Nein	Die Mindestanzahl von Datensätzen in allen Eingabedateien in einem Batch-Inferenzjob für Amazon Nova Premier.
Mindestanzahl von Datensätzen pro Batch-Inferenzauftrag für Claude 3 Haiku	Jede unterstützte Region: 100	Nein	Die Mindestanzahl von Datensätzen in allen Eingabedateien in einem Batch-Inferenzjob für Claude-3-Haiku.
Mindestanzahl von Datensätzen pro Batch-Inferenzauftrag für Claude 3 Opus	Jede unterstützte Region: 100	Nein	Die Mindestanzahl von Datensätzen in allen Eingabedateien in einem Batch-Inferenzjob für Claude 3 Opus.
Mindestanzahl von Datensätzen pro Batch-Inferenzauftrag für Claude 3 Sonnet	Jede unterstützte Region: 100	Nein	Die Mindestanzahl von Datensätzen in allen Eingabedateien in einem Batch-Inferenzjob für Claude 3 Sonnet.
Mindestanzahl von Datensätzen pro Batch-Inferenzauftrag für Claude 3.5 Haiku	Jede unterstützte Region: 100	Nein	Die Mindestanzahl von Datensätzen in allen Eingabedateien in einem Batch-Inferenzjob für Claude 3.5 Haiku.
Mindestanzahl von Datensätzen pro Batch-Inferenzauftrag für Claude 3.5 Sonnet	Jede unterstützte Region: 100	Nein	Die Mindestanzahl von Datensätzen in allen Eingabedateien in einem Batch-Inferenzjob für Claude 3.5 Sonnet.
Mindestanzahl von Datensätzen pro Batch-Inferenzauftrag für Claude 3.5 Sonnet v2	Jede unterstützte Region: 100	Nein	Die Mindestanzahl von Datensätzen in allen Eingabedateien in einem Batch-Inferenzjob für Claude 3.5 Sonnet v2.
Mindestanzahl von Datensätzen pro Batch-Inferenzauftrag für Claude 3.7 Sonnet	Jede unterstützte Region: 100	Yes (Ja)	Die Mindestanzahl von Datensätzen in allen Eingabedateien in einem Batch-Inferenzjob für Claude 3.7 Sonnet.
Mindestanzahl von Datensätzen pro Batch-Inferenzauftrag für Claude Haiku 4.5	Jede unterstützte Region: 100	Nein	Die Mindestanzahl von Datensätzen in allen Eingabedateien in einem Batch-Inferenzjob für Claude Haiku 4.5.
Mindestanzahl von Datensätzen pro Batch-Inferenzauftrag für Claude Opus 4.5	Jede unterstützte Region: 100	Nein	Die Mindestanzahl von Datensätzen in allen Eingabedateien in einem Batch-Inferenzjob für Claude Opus 4.5.
Mindestanzahl von Datensätzen pro Batch-Inferenzjob für Claude Opus 4.6	Jede unterstützte Region: 100	Nein	Die Mindestanzahl von Datensätzen in allen Eingabedateien in einem Batch-Inferenzjob für Claude Opus 4.6.
Mindestanzahl von Datensätzen pro Batch-Inferenzjob für Claude Sonnet 4	Jede unterstützte Region: 100	Yes (Ja)	Die Mindestanzahl von Datensätzen in allen Eingabedateien in einem Batch-Inferenzjob für Claude Sonnet 4.
Mindestanzahl von Datensätzen pro Batch-Inferenzauftrag für Claude Sonnet 4.5.	Jede unterstützte Region: 100	Nein	Die Mindestanzahl von Datensätzen in allen Eingabedateien in einem Batch-Inferenzjob für Claude Sonnet 4.5.
Mindestanzahl von Datensätzen pro Batch-Inferenzauftrag für Claude Sonnet 4.6	Jede unterstützte Region: 100	Nein	Die Mindestanzahl von Datensätzen in allen Eingabedateien in einem Batch-Inferenzjob für Claude Sonnet 4.6.
Mindestanzahl von Datensätzen pro Batch-Inferenzjob für DeepSeek V3.2	Jede unterstützte Region: 100	Nein	Die Mindestanzahl von Datensätzen in allen Eingabedateien in einem Batch-Inferenzjob für. DeepSeek V3.2
Mindestanzahl von Datensätzen pro Batch-Inferenzjob für v3 DeepSeek	Jede unterstützte Region: 100	Nein	Die Mindestanzahl von Datensätzen in allen Eingabedateien in einem Batch-Inferenzjob für DeepSeek v3.
Mindestanzahl von Datensätzen pro Batch-Inferenzjob für Devstral 2 123B	Jede unterstützte Region: 100	Nein	Die Mindestanzahl von Datensätzen in allen Eingabedateien in einem Batch-Inferenzjob für Devstral 2 123B.
Mindestanzahl von Datensätzen pro Batch-Inferenzjob für GLM 4.7	Jede unterstützte Region: 100	Nein	Die Mindestanzahl von Datensätzen in allen Eingabedateien in einem Batch-Inferenzjob für GLM 4.7.
Mindestanzahl von Datensätzen pro Batch-Inferenzjob für GLM 4.7 Flash	Jede unterstützte Region: 100	Nein	Die Mindestanzahl von Datensätzen in allen Eingabedateien in einem Batch-Inferenzjob für GLM 4.7 Flash.
Mindestanzahl von Datensätzen pro Batch-Inferenzjob für GLM 5	Jede unterstützte Region: 100	Nein	Die Mindestanzahl von Datensätzen in allen Eingabedateien in einem Batch-Inferenzjob für GLM 5.
Mindestanzahl von Datensätzen pro Batch-Inferenzjob für Gemma 3 12B	Jede unterstützte Region: 100	Nein	Die Mindestanzahl von Datensätzen in allen Eingabedateien in einem Batch-Inferenzjob für Gemma 3 12B.
Mindestanzahl von Datensätzen pro Batch-Inferenzjob für Gemma 3 27B	Jede unterstützte Region: 100	Nein	Die Mindestanzahl von Datensätzen in allen Eingabedateien in einem Batch-Inferenzjob für Gemma 3 27B.
Mindestanzahl von Datensätzen pro Batch-Inferenzjob für Gemma 3 4B	Jede unterstützte Region: 100	Nein	Die Mindestanzahl von Datensätzen in allen Eingabedateien in einem Batch-Inferenzjob für Gemma 3 4B.
Mindestanzahl von Datensätzen pro Batch-Inferenzjob für Kimi K2 Thinking	Jede unterstützte Region: 100	Nein	Die Mindestanzahl von Datensätzen in allen Eingabedateien in einem Batch-Inferenzjob für Kimi K2 Thinking.
Mindestanzahl von Datensätzen pro Batch-Inferenzjob für Kimi K2.5	Jede unterstützte Region: 100	Nein	Die Mindestanzahl von Datensätzen in allen Eingabedateien in einem Batch-Inferenzjob für Kimi. K2.5
Mindestanzahl von Datensätzen pro Batch-Inferenzjob für Llama 3.1 405B Instruct	Jede unterstützte Region: 100	Nein	Die Mindestanzahl von Datensätzen in allen Eingabedateien in einem Batch-Inferenzjob für Llama 3.1 405B Instruct.
Mindestanzahl von Datensätzen pro Batch-Inferenzjob für Llama 3.1 70B Instruct	Jede unterstützte Region: 100	Nein	Die Mindestanzahl von Datensätzen in allen Eingabedateien in einem Batch-Inferenzjob für Llama 3.1 70B Instruct.
Mindestanzahl von Datensätzen pro Batch-Inferenzjob für Llama 3.1 8B Instruct	Jede unterstützte Region: 100	Nein	Die Mindestanzahl von Datensätzen in allen Eingabedateien in einem Batch-Inferenzjob für Llama 3.1 8B Instruct.
Mindestanzahl von Datensätzen pro Batch-Inferenzjob für Llama 3.2 11B Instruct	Jede unterstützte Region: 100	Nein	Die Mindestanzahl von Datensätzen in allen Eingabedateien in einem Batch-Inferenzjob für Llama 3.2 11B Instruct.
Mindestanzahl von Datensätzen pro Batch-Inferenzjob für Llama 3.2 1B Instruct	Jede unterstützte Region: 100	Nein	Die Mindestanzahl von Datensätzen in allen Eingabedateien in einem Batch-Inferenzjob Llama 3.2 1B Instruct.
Mindestanzahl von Datensätzen pro Batch-Inferenzjob für Llama 3.2 3B Instruct	Jede unterstützte Region: 100	Nein	Die Mindestanzahl von Datensätzen in allen Eingabedateien in einem Batch-Inferenzjob für Llama 3.2 3B Instruct.
Mindestanzahl von Datensätzen pro Batch-Inferenzjob für Llama 3.2 90B Instruct	Jede unterstützte Region: 100	Nein	Die Mindestanzahl von Datensätzen in allen Eingabedateien in einem Batch-Inferenzjob für Llama 3.2 90B Instruct.
Mindestanzahl von Datensätzen pro Batch-Inferenzjob für Llama 3.3 70B Instruct	Jede unterstützte Region: 100	Nein	Die Mindestanzahl von Datensätzen in allen Eingabedateien in einem Batch-Inferenzjob für Llama 3.3 70B Instruct.
Mindestanzahl von Datensätzen pro Batch-Inferenzjob für Llama 4 Maverick	Jede unterstützte Region: 100	Nein	Die Mindestanzahl von Datensätzen in allen Eingabedateien in einem Batch-Inferenzjob für Llama 4 Maverick.
Mindestanzahl von Datensätzen pro Batch-Inferenzjob für Llama 4 Scout	Jede unterstützte Region: 100	Nein	Die Mindestanzahl von Datensätzen in allen Eingabedateien in einem Batch-Inferenzjob für Llama 4 Scout.
Mindestanzahl von Datensätzen pro Batch-Inferenzjob für Magistral Small 2509	Jede unterstützte Region: 100	Nein	Die Mindestanzahl von Datensätzen in allen Eingabedateien in einem Batch-Inferenzjob für Magistral Small 2509.
Mindestanzahl von Datensätzen pro Batch-Inferenzjob für M2 MiniMax	Jede unterstützte Region: 100	Nein	Die Mindestanzahl von Datensätzen in allen Eingabedateien in einem Batch-Inferenzjob für MiniMax M2.
Mindestanzahl von Datensätzen pro Batch-Inferenzjob für MiniMax M2.1	Jede unterstützte Region: 100	Nein	Die Mindestanzahl von Datensätzen in allen Eingabedateien in einem Batch-Inferenzjob für. MiniMax M2.1
Mindestanzahl von Datensätzen pro Batch-Inferenzjob für MiniMax M2.5	Jede unterstützte Region: 100	Nein	Die Mindestanzahl von Datensätzen in allen Eingabedateien in einem Batch-Inferenzjob für. MiniMax M2.5
Mindestanzahl von Datensätzen pro Batch-Inferenzauftrag für Ministral 3 14B	Jede unterstützte Region: 100	Nein	Die Mindestanzahl von Datensätzen in allen Eingabedateien in einem Batch-Inferenzjob für Ministral 3 14B.
Mindestanzahl von Datensätzen pro Batch-Inferenzauftrag für Ministral 3 8B	Jede unterstützte Region: 100	Nein	Die Mindestanzahl von Datensätzen in allen Eingabedateien in einem Batch-Inferenzjob für Ministral 3 8B.
Mindestanzahl von Datensätzen pro Batch-Inferenzauftrag für Ministral 3B	Jede unterstützte Region: 100	Nein	Die Mindestanzahl von Datensätzen in allen Eingabedateien in einem Batch-Inferenzjob für Ministral 3B.
Mindestanzahl von Datensätzen pro Batch-Inferenzauftrag für Mistral Large 2 (24.07)	Jede unterstützte Region: 100	Nein	Die Mindestanzahl von Datensätzen in allen Eingabedateien in einem Batch-Inferenzjob für Mistral Large 2 (24.07).
Mindestanzahl von Datensätzen pro Batch-Inferenzjob für Mistral Large 3	Jede unterstützte Region: 100	Nein	Die Mindestanzahl von Datensätzen in allen Eingabedateien in einem Batch-Inferenzjob für Mistral Large 3.
Mindestanzahl von Datensätzen pro Batch-Inferenzjob für Mistral Small	Jede unterstützte Region: 100	Nein	Die Mindestanzahl von Datensätzen in allen Eingabedateien in einem Batch-Inferenzjob für Mistral Small.
Mindestanzahl von Datensätzen pro Batch-Inferenzjob für NVIDIA Nemotron 3 Super 120B A12B	Jede unterstützte Region: 100	Nein	Die Mindestanzahl von Datensätzen in allen Eingabedateien in einem Batch-Inferenzjob für NVIDIA Nemotron 3 Super 120B A12B.
Mindestanzahl von Datensätzen pro Batch-Inferenzjob für NVIDIA Nemotron Nano 12B	Jede unterstützte Region: 100	Nein	Die Mindestanzahl von Datensätzen in allen Eingabedateien in einem Batch-Inferenzjob für NVIDIA Nemotron Nano 12B.
Mindestanzahl von Datensätzen pro Batch-Inferenzjob für NVIDIA Nemotron Nano 3 30B	Jede unterstützte Region: 100	Nein	Die Mindestanzahl von Datensätzen in allen Eingabedateien in einem Batch-Inferenzjob für NVIDIA Nemotron Nano 3 30B.
Mindestanzahl von Datensätzen pro Batch-Inferenzjob für NVIDIA Nemotron Nano 9B	Jede unterstützte Region: 100	Nein	Die Mindestanzahl von Datensätzen in allen Eingabedateien in einem Batch-Inferenzjob für NVIDIA Nemotron Nano 9B.
Mindestanzahl von Datensätzen pro Batch-Inferenzjob für Nova 2 Lite	Jede unterstützte Region: 100	Nein	Die Mindestanzahl von Datensätzen in allen Eingabedateien in einem Batch-Inferenzjob für Nova 2 Lite.
Mindestanzahl von Datensätzen pro Batch-Inferenzjob für Nova Lite V1	Jede unterstützte Region: 100	Nein	Die Mindestanzahl von Datensätzen in allen Eingabedateien in einem Batch-Inferenzjob für Nova Lite V1.
Mindestanzahl von Datensätzen pro Batch-Inferenzjob für Nova Micro V1	Jede unterstützte Region: 100	Nein	Die Mindestanzahl von Datensätzen in allen Eingabedateien in einem Batch-Inferenzjob für Nova Micro V1.
Mindestanzahl von Datensätzen pro Batch-Inferenzjob für Nova Pro V1	Jede unterstützte Region: 100	Nein	Die Mindestanzahl von Datensätzen in allen Eingabedateien in einem Batch-Inferenzjob für Nova Pro V1.
Mindestanzahl von Datensätzen pro Batch-Inferenzjob für OpenAI GPT OSS 120b	Jede unterstützte Region: 100	Nein	Die Mindestanzahl von Datensätzen in allen Eingabedateien in einem Batch-Inferenzjob für OpenAI GPT OSS 120b.
Mindestanzahl von Datensätzen pro Batch-Inferenzjob für OpenAI GPT OSS 20b	Jede unterstützte Region: 100	Nein	Die Mindestanzahl von Datensätzen in allen Eingabedateien in einem Batch-Inferenzjob für OpenAI GPT OSS 20b.
Mindestanzahl von Datensätzen pro Batch-Inferenzjob für OpenAI GPT OSS Safeguard 120b	Jede unterstützte Region: 100	Nein	Die Mindestanzahl von Datensätzen in allen Eingabedateien in einem Batch-Inferenzjob für OpenAI GPT OSS Safeguard 120b.
Mindestanzahl von Datensätzen pro Batch-Inferenzjob für OpenAI GPT OSS Safeguard 20b	Jede unterstützte Region: 100	Nein	Die Mindestanzahl von Datensätzen in allen Eingabedateien in einem Batch-Inferenzjob für OpenAI GPT OSS Safeguard 20b.
Mindestanzahl von Datensätzen pro Batch-Inferenzjob für Qwen3 235B	Jede unterstützte Region: 100	Nein	Die Mindestanzahl von Datensätzen in allen Eingabedateien in einem Batch-Inferenzjob für Qwen3 235B.
Mindestanzahl von Datensätzen pro Batch-Inferenzjob für Qwen3 32B	Jede unterstützte Region: 100	Nein	Die Mindestanzahl von Datensätzen in allen Eingabedateien in einem Batch-Inferenzjob für Qwen3 32B.
Mindestanzahl von Datensätzen pro Batch-Inferenzjob für Qwen3 Coder 30B	Jede unterstützte Region: 100	Nein	Die Mindestanzahl von Datensätzen in allen Eingabedateien in einem Batch-Inferenzjob für Qwen3 Coder 30B.
Mindestanzahl von Datensätzen pro Batch-Inferenzjob für Qwen3 Coder 480B	Jede unterstützte Region: 100	Nein	Die Mindestanzahl von Datensätzen in allen Eingabedateien in einem Batch-Inferenzjob für Qwen3 Coder 480B.
Mindestanzahl von Datensätzen pro Batch-Inferenzjob für Qwen3 Coder Next	Jede unterstützte Region: 100	Nein	Die Mindestanzahl von Datensätzen in allen Eingabedateien in einem Batch-Inferenzjob für Qwen3 Coder Next.
Mindestanzahl von Datensätzen pro Batch-Inferenzjob für Qwen3 Next 80B	Jede unterstützte Region: 100	Nein	Die Mindestanzahl von Datensätzen in allen Eingabedateien in einem Batch-Inferenzjob für Qwen3 Next 80B.
Mindestanzahl von Datensätzen pro Batch-Inferenzjob für Qwen3 VL 235B	Jede unterstützte Region: 100	Nein	Die Mindestanzahl von Datensätzen in allen Eingabedateien in einem Batch-Inferenzjob für Qwen3 VL 235B.
Mindestanzahl von Datensätzen pro Batch-Inferenzjob für Titan Multimodal Embeddings G1	Jede unterstützte Region: 100	Nein	Die Mindestanzahl von Datensätzen in allen Eingabedateien in einem Batch-Inferenzjob für Titan Multimodal Embeddings G1.
Mindestanzahl von Datensätzen pro Batch-Inferenzjob für Titan Text Embeddings V2	Jede unterstützte Region: 100	Nein	Die Mindestanzahl von Datensätzen in allen Eingabedateien in einem Batch-Inferenzjob für Titan Text Embeddings V2.
Mindestanzahl von Datensätzen pro Batch-Inferenzjob für Voxtral Mini 3B 2507	Jede unterstützte Region: 100	Nein	Die Mindestanzahl von Datensätzen in allen Eingabedateien in einem Batch-Inferenzjob für Voxtral Mini 3B 2507.
Mindestanzahl von Datensätzen pro Batch-Inferenzjob für Voxtral Small 24B 2507	Jede unterstützte Region: 100	Nein	Die Mindestanzahl von Datensätzen in allen Eingabedateien in einem Batch-Inferenzjob für Voxtral Small 24B 2507.
Mindestanzahl von Datensätzen pro Batch-Inferenzauftrag für Writer Palmyra Vision 7B	Jede unterstützte Region: 100	Nein	Die Mindestanzahl von Datensätzen in allen Eingabedateien in einem Batch-Inferenzjob für Writer Palmyra Vision 7B.
Max. Latenzoptimierte Tokens pro Tag für Modellaufruf für Amazon Nova Pro V1	Jede unterstützte Region: 57.600.000	Nein	Die maximale Anzahl von Token, die Sie an einem Tag für die latenzoptimierte Modellinferenz für Amazon Nova Pro V1 einreichen können. Das Kontingent berücksichtigt die kombinierte Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream
Modellieren Sie die maximale Anzahl an Tokens pro Tag für AI21 Labs Jamba 1.5 Large (verdoppelt bei regionsübergreifenden Aufrufen)	Jede unterstützte Region: 432.000.000	Nein	Tageshöchstzahl an Tokens für Modellinferenz für AI21 Labs Jamba 1.5 Large. Kombiniert die Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream Verdoppelt bei regionsübergreifenden Anrufen; gilt nicht für den Fall einer genehmigten TPM-Erhöhung.
Modell: Max. Anzahl an Tokens pro Tag für AI21 Labs Jamba 1.5 Mini (verdoppelt bei regionsübergreifenden Anrufen)	Jede unterstützte Region: 432.000.000	Nein	Tageshöchstzahl an Tokens für Modellinferenz für AI21 Labs Jamba 1.5 Mini. Kombiniert die Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream Verdoppelt bei regionsübergreifenden Anrufen; gilt nicht für den Fall einer genehmigten TPM-Erhöhung.
Max. Anzahl an Tokens pro Tag für Modellaufrufe für Amazon Nova 2 Lite (verdoppelt bei regionsübergreifenden Anrufen)	Jede unterstützte Region: 5.760.000.000	Nein	Tägliche maximale Tokenanzahl für Modellinferenz für Amazon Nova 2 Lite. Kombiniert die Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse ConverseStream, InvokeModel und. InvokeModelWithResponseStream Verdoppelt bei regionsübergreifenden Anrufen; gilt nicht für den Fall einer genehmigten TPM-Erhöhung.
Max. Anzahl an Tokens pro Tag für Modellaufrufe für Amazon Nova 2 Omni (verdoppelt bei regionsübergreifenden Anrufen)	Jede unterstützte Region: 5.760.000.000	Nein	Tägliche maximale Tokenanzahl für Modellinferenz für Amazon Nova 2 Omni. Kombiniert die Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, ConverseStream und. InvokeModel InvokeModelWithResponseStream Verdoppelt bei regionsübergreifenden Anrufen; gilt nicht für den Fall einer genehmigten TPM-Erhöhung.
Max. Anzahl an Tokens pro Tag für den Modellaufruf für Amazon Nova 2 Pro Preview (verdoppelt bei regionsübergreifenden Anrufen)	Jede unterstützte Region: 720.000.000	Nein	Tägliche maximale Tokens für Modellinferenz für Amazon Nova 2 Pro Preview. Kombiniert die Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse ConverseStream, InvokeModel und. InvokeModelWithResponseStream Verdoppelt bei regionsübergreifenden Anrufen; gilt nicht für den Fall einer genehmigten TPM-Erhöhung.
Max. Anzahl an Tokens pro Tag für Modellaufrufe für Amazon Nova Lite (verdoppelt bei regionsübergreifenden Anrufen)	Jede unterstützte Region: 5.760.000.000	Nein	Tägliche maximale Tokenanzahl für Modellinferenz für Amazon Nova Lite. Kombiniert die Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse ConverseStream, InvokeModel und. InvokeModelWithResponseStream Verdoppelt bei regionsübergreifenden Anrufen; gilt nicht für den Fall einer genehmigten TPM-Erhöhung.
Max. Anzahl an Tokens pro Tag für Modellaufrufe für Amazon Nova Micro (verdoppelt bei regionsübergreifenden Anrufen)	Jede unterstützte Region: 5.760.000.000	Nein	Tägliche maximale Tokenanzahl für Modellinferenz für Amazon Nova Micro. Kombiniert die Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse ConverseStream, InvokeModel und. InvokeModelWithResponseStream Verdoppelt bei regionsübergreifenden Anrufen; gilt nicht für den Fall einer genehmigten TPM-Erhöhung.
Maximale Anzahl an Tokens pro Tag für Modellaufrufe für Amazon Nova Premier V1 (verdoppelt bei regionsübergreifenden Anrufen)	Jede unterstützte Region: 1.440.000.000	Nein	Tägliche maximale Tokenanzahl für Modellinferenz für Amazon Nova Premier V1. Kombiniert die Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse ConverseStream, InvokeModel und. InvokeModelWithResponseStream Verdoppelt bei regionsübergreifenden Anrufen; gilt nicht für den Fall einer genehmigten TPM-Erhöhung.
Max. Anzahl an Tokens pro Tag für Modellaufrufe für Amazon Nova Pro (verdoppelt bei regionsübergreifenden Anrufen)	Jede unterstützte Region: 1.440.000.000	Nein	Tägliche maximale Tokenanzahl für Modellinferenz für Amazon Nova Pro. Kombiniert die Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse ConverseStream, InvokeModel und. InvokeModelWithResponseStream Verdoppelt bei regionsübergreifenden Anrufen; gilt nicht für den Fall einer genehmigten TPM-Erhöhung.
Modellieren Sie die maximale Anzahl an Tokens pro Tag für Anthropic Claude 3 Haiku (verdoppelt bei regionsübergreifenden Anrufen)	us-east-1:2.880.000.000 US-West-2:2.880.000.000 ap-northeast-1:288.000.000 ap-southeast-1:288.000.000 Jede der anderen unterstützten Regionen: 432.000.000	Nein	Tägliches Maximum an Tokens für Modellinferenz für Anthropic Claude 3 Haiku. Kombiniert die Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream Verdoppelt bei regionsübergreifenden Anrufen; gilt nicht für den Fall einer genehmigten TPM-Erhöhung.
Modellieren Sie die maximale Anzahl an Tokens pro Tag für Anthropic Claude 3.5 Haiku (verdoppelt bei regionsübergreifenden Anrufen)	Jede unterstützte Region: 2.880.000.000	Nein	Tägliches Maximum an Tokens für Modellinferenz für Anthropic Claude 3.5 Haiku. Kombiniert die Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream Verdoppelt bei regionsübergreifenden Anrufen; gilt nicht für den Fall einer genehmigten TPM-Erhöhung.
Modellieren Sie die maximale Anzahl an Tokens pro Tag für Anthropic Claude 3.5 Sonnet V1 (verdoppelt bei regionsübergreifenden Anrufen)	Jede unterstützte Region: 2.880.000.000	Nein	Tageshöchstzahl an Tokens für Modellinferenz für Anthropic Claude 3.5 Sonnet V1. Kombiniert die Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream Verdoppelt bei regionsübergreifenden Anrufen; gilt nicht für den Fall einer genehmigten TPM-Erhöhung.
Modellieren Sie die maximale Anzahl an Tokens pro Tag für Anthropic Claude 3.5 Sonnet V2 (verdoppelt bei regionsübergreifenden Anrufen)	us-east-1:2.880.000.000 US-West-2:2.880.000.000 Jede der anderen unterstützten Regionen: 576.000.000	Nein	Tageshöchstzahl an Tokens für Modellinferenz für Anthropic Claude 3.5 Sonnet V2. Kombiniert die Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream Verdoppelt bei regionsübergreifenden Anrufen; gilt nicht für den Fall einer genehmigten TPM-Erhöhung.
Modellieren Sie die maximale Anzahl an Tokens pro Tag für Anthropic Claude 3.7 Sonnet V1 (verdoppelt bei regionsübergreifenden Anrufen)	Jede unterstützte Region: 720.000.000	Nein	Tageshöchstzahl an Tokens für Modellinferenz für Anthropic Claude 3.7 Sonnet V1. Kombiniert die Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream Verdoppelt bei regionsübergreifenden Anrufen; gilt nicht für den Fall einer genehmigten TPM-Erhöhung.
Modellieren Sie die maximale Anzahl an Tokens pro Tag für Anthropic Claude Fable 5 (verdoppelt bei regionsübergreifenden Anrufen)	Jede unterstützte Region: 144.000.000	Nein	Tägliches Maximum an Tokens für Modellinferenz für Anthropic Claude Fable 5. Kombiniert die Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream Verdoppelt bei regionsübergreifenden Anrufen; gilt nicht für den Fall einer genehmigten TPM-Erhöhung.
Modellieren Sie die maximale Anzahl an Tokens pro Tag für Anthropic Claude Haiku 4.5 (verdoppelt bei regionsübergreifenden Anrufen)	Jede unterstützte Region: 3.600.000.000	Nein	Tägliches Maximum an Tokens für Modellinferenz für Anthropic Claude Haiku 4.5. Kombiniert die Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream Verdoppelt bei regionsübergreifenden Anrufen; gilt nicht für den Fall einer genehmigten TPM-Erhöhung.
Modellieren Sie die maximale Anzahl an Tokens pro Tag für Anthropic Claude Opus 4 V1 (verdoppelt bei regionsübergreifenden Aufrufen)	Jede unterstützte Region: 144.000.000	Nein	Tägliches Maximum an Tokens für Modellinferenz für Anthropic Claude Opus 4 V1. Kombiniert die Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream Verdoppelt bei regionsübergreifenden Anrufen; gilt nicht für den Fall einer genehmigten TPM-Erhöhung.
Modellieren Sie die maximale Anzahl an Tokens pro Tag für Anthropic Claude Opus 4.1 (verdoppelt bei regionsübergreifenden Aufrufen)	Jede unterstützte Region: 360.000.000	Nein	Tägliches Maximum an Tokens für Modellinferenz für Anthropic Claude Opus 4.1. Kombiniert die Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream Verdoppelt bei regionsübergreifenden Anrufen; gilt nicht für den Fall einer genehmigten TPM-Erhöhung.
Modellieren Sie die maximale Anzahl an Tokens pro Tag für Anthropic Claude Opus 4.5 (verdoppelt bei regionsübergreifenden Aufrufen)	Jede unterstützte Region: 1.440.000.000	Nein	Tägliches Maximum an Tokens für Modellinferenz für Anthropic Claude Opus 4.5. Kombiniert die Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream Verdoppelt bei regionsübergreifenden Anrufen; gilt nicht für den Fall einer genehmigten TPM-Erhöhung.
Modellieren Sie die maximale Anzahl an Tokens pro Tag für Anthropic Claude Opus 4.6 V1 (verdoppelt bei regionsübergreifenden Aufrufen)	Jede unterstützte Region: 2.160.000.000	Nein	Tageshöchstzahl an Tokens für Modellinferenz für Anthropic Claude Opus 4.6 V1. Kombiniert die Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream Verdoppelt bei regionsübergreifenden Anrufen; gilt nicht für den Fall einer genehmigten TPM-Erhöhung.
Modellieren Sie die maximale Anzahl an Tokens pro Tag für Anthropic Claude Opus 4.7 (verdoppelt bei regionsübergreifenden Anrufen)	Jede unterstützte Region: 7.200.000.000	Nein	Tägliches Maximum an Tokens für Modellinferenz für Anthropic Claude Opus 4.7. Kombiniert die Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream Verdoppelt bei regionsübergreifenden Anrufen; gilt nicht für den Fall einer genehmigten TPM-Erhöhung.
Modellieren Sie die maximale Anzahl an Tokens pro Tag für Anthropic Claude Opus 4.8 (verdoppelt bei regionsübergreifenden Aufrufen)	Jede unterstützte Region: 21.600.000.000	Nein	Tägliches Maximum an Tokens für Modellinferenz für Anthropic Claude Opus 4.8. Kombiniert die Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream Verdoppelt bei regionsübergreifenden Anrufen; gilt nicht für den Fall einer genehmigten TPM-Erhöhung.
Modellieren Sie die maximale Anzahl an Tokens pro Tag für Anthropic Claude Sonnet 4 V1 (verdoppelt bei regionsübergreifenden Anrufen)	Jede unterstützte Region: 144.000.000	Nein	Tageshöchstzahl an Tokens für Modellinferenz für Anthropic Claude Sonnet 4 V1. Kombiniert die Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream Verdoppelt bei regionsübergreifenden Anrufen; gilt nicht für den Fall einer genehmigten TPM-Erhöhung.
Modellieren Sie die maximale Anzahl an Tokens pro Tag für Anthropic Claude Sonnet 4 V1 1M Context Length (verdoppelt bei regionsübergreifenden Aufrufen)	Jede unterstützte Region: 720.000.000	Nein	Tägliche maximale Tokens für Modellinferenz für Anthropic Claude Sonnet 4 V1 1M Kontextlänge. Kombiniert die Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream Verdoppelt bei regionsübergreifenden Anrufen; gilt nicht für den Fall einer genehmigten TPM-Erhöhung.
Modellieren Sie die maximale Anzahl an Tokens pro Tag für Anthropic Claude Sonnet 4.5 V1 (verdoppelt bei regionsübergreifenden Anrufen)	Jede unterstützte Region: 3.600.000.000	Nein	Tageshöchstzahl an Tokens für Modellinferenz für Anthropic Claude Sonnet 4.5 V1. Kombiniert die Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream Verdoppelt bei regionsübergreifenden Anrufen; gilt nicht für den Fall einer genehmigten TPM-Erhöhung.
Modellieren Sie die maximale Anzahl an Tokens pro Tag für Anthropic Claude Sonnet 4.5 V1 1M Context Length (verdoppelt bei regionsübergreifenden Aufrufen)	Jede unterstützte Region: 720.000.000	Nein	Tägliche maximale Tokens für Modellinferenz für Anthropic Claude Sonnet 4.5 V1 1M Kontextlänge. Kombiniert die Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream Verdoppelt bei regionsübergreifenden Anrufen; gilt nicht für den Fall einer genehmigten TPM-Erhöhung.
Modellieren Sie die maximale Anzahl an Tokens pro Tag für Anthropic Claude Sonnet 4.6 (verdoppelt bei regionsübergreifenden Anrufen)	Jede unterstützte Region: 4.320.000.000	Nein	Tageshöchstzahl an Tokens für Modellinferenz für Anthropic Claude Sonnet 4.6. Kombiniert die Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream Verdoppelt bei regionsübergreifenden Anrufen; gilt nicht für den Fall einer genehmigten TPM-Erhöhung.
Modellieren Sie die maximale Anzahl an Tokens pro Tag für Anthropic Claude Sonnet 5 (verdoppelt bei regionsübergreifenden Anrufen)	Jede unterstützte Region: 4.320.000.000	Nein	Tägliches Maximum an Tokens für Modellinferenz für Anthropic Claude Sonnet 5. Kombiniert die Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream Verdoppelt bei regionsübergreifenden Anrufen; gilt nicht für den Fall einer genehmigten TPM-Erhöhung.
Maximale Anzahl an Tokens pro Tag für Modellaufrufe für Cohere Embed V4 (verdoppelt bei regionsübergreifenden Aufrufen)	Jede unterstützte Region: 216.000.000	Nein	Tageshöchstzahl an Tokens für Modellinferenz für Cohere Embed V4. Kombiniert die Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, ConverseStream und. InvokeModel InvokeModelWithResponseStream Verdoppelt bei regionsübergreifenden Anrufen; gilt nicht für den Fall einer genehmigten TPM-Erhöhung.
Modellieren Sie die maximale Anzahl an Tokens pro Tag für DeepSeek R1 V1 (verdoppelt bei regionsübergreifenden Aufrufen)	Jede unterstützte Region: 144.000.000	Nein	Tageshöchstzahl an Tokens für Modellinferenz für R1 V1. DeepSeek Kombiniert die Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, ConverseStream und. InvokeModel InvokeModelWithResponseStream Verdoppelt bei regionsübergreifenden Anrufen; gilt nicht für den Fall einer genehmigten TPM-Erhöhung.
Modellieren Sie die maximale Anzahl an Tokens pro Tag für DeepSeek V3 V1 (verdoppelt bei regionsübergreifenden Aufrufen)	Jede unterstützte Region: 144.000.000.000	Nein	Tageshöchstzahl an Tokens für Modellinferenz für V3 V1. DeepSeek Kombiniert die Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse ConverseStream, InvokeModel und. InvokeModelWithResponseStream Verdoppelt bei regionsübergreifenden Anrufen; gilt nicht für den Fall einer genehmigten TPM-Erhöhung.
Modellieren Sie die maximale Anzahl an Tokens pro Tag für DeepSeek V3.2 (verdoppelt bei regionsübergreifenden Anrufen)	Jede unterstützte Region: 144.000.000.000	Nein	Tageshöchstzahl an Tokens für Modellinferenz für. DeepSeek V3.2 Kombiniert die Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse ConverseStream, InvokeModel und. InvokeModelWithResponseStream Verdoppelt bei regionsübergreifenden Anrufen; gilt nicht für den Fall einer genehmigten TPM-Erhöhung.
Max. Anzahl der Tokens pro Tag beim Modellaufruf für GPT OSS Safeguard 120B (verdoppelt bei regionsübergreifenden Aufrufen)	Jede unterstützte Region: 144.000.000.000	Nein	Tageshöchstzahl an Tokens für Modellinferenz für GPT OSS Safeguard 120B. Kombiniert die Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream Verdoppelt bei regionsübergreifenden Anrufen; gilt nicht für den Fall einer genehmigten TPM-Erhöhung.
Max. Anzahl an Tokens pro Tag für den Modellaufruf für GPT OSS Safeguard 20B (verdoppelt bei regionsübergreifenden Aufrufen)	Jede unterstützte Region: 144.000.000.000	Nein	Tageshöchstzahl an Tokens für Modellinferenz für GPT OSS Safeguard 20B. Kombiniert die Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream Verdoppelt bei regionsübergreifenden Anrufen; gilt nicht für den Fall einer genehmigten TPM-Erhöhung.
Modellieren Sie die maximale Anzahl an Tokens pro Tag für Gemma 3 12B (verdoppelt bei regionsübergreifenden Anrufen)	Jede unterstützte Region: 144.000.000.000	Nein	Tageshöchstzahl an Tokens für Modellinferenz für Gemma 3 12B. Kombiniert die Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream Verdoppelt bei regionsübergreifenden Anrufen; gilt nicht für den Fall einer genehmigten TPM-Erhöhung.
Modellieren Sie die maximale Anzahl an Tokens pro Tag für Gemma 3 27B (verdoppelt bei regionsübergreifenden Anrufen)	Jede unterstützte Region: 144.000.000.000	Nein	Tageshöchstzahl an Tokens für Modellinferenz für Gemma 3 27B. Kombiniert die Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream Verdoppelt bei regionsübergreifenden Anrufen; gilt nicht für den Fall einer genehmigten TPM-Erhöhung.
Modellieren Sie die maximale Anzahl an Tokens pro Tag für Gemma 3 4B (verdoppelt bei regionsübergreifenden Anrufen)	Jede unterstützte Region: 144.000.000.000	Nein	Tageshöchstzahl an Tokens für Modellinferenz für Gemma 3 4B. Kombiniert die Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, ConverseStream und. InvokeModel InvokeModelWithResponseStream Verdoppelt bei regionsübergreifenden Anrufen; gilt nicht für den Fall einer genehmigten TPM-Erhöhung.
Modellieren Sie die maximale Anzahl an Tokens pro Tag für Kimi K2 Thinking (verdoppelt bei regionsübergreifenden Anrufen)	Jede unterstützte Region: 144.000.000.000	Nein	Tägliches Maximum an Tokens für Modellinferenz für Kimi K2 Thinking. Kombiniert die Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream Verdoppelt bei regionsübergreifenden Anrufen; gilt nicht für den Fall einer genehmigten TPM-Erhöhung.
Modellieren Sie die maximale Anzahl an Tokens pro Tag für Magistral Small 1.2 (verdoppelt bei regionsübergreifenden Anrufen)	Jede unterstützte Region: 144.000.000.000	Nein	Tageshöchstzahl an Tokens für Modellinferenz für Magistral Small 1.2. Kombiniert die Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream Verdoppelt bei regionsübergreifenden Anrufen; gilt nicht für den Fall einer genehmigten TPM-Erhöhung.
Modellieren Sie die maximale Anzahl an Tokens pro Tag für Meta Llama 3.2 11B Instruct (verdoppelt bei regionsübergreifenden Aufrufen)	Jede unterstützte Region: 432.000.000	Nein	Tageshöchstzahl an Tokens für Modellinferenz für Meta Llama 3.2 11B Instruct. Kombiniert die Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream Verdoppelt bei regionsübergreifenden Anrufen; gilt nicht für den Fall einer genehmigten TPM-Erhöhung.
Modellieren Sie die maximale Anzahl an Tokens pro Tag für Meta Llama 3.2 1B Instruct (verdoppelt bei regionsübergreifenden Aufrufen)	Jede unterstützte Region: 432.000.000	Nein	Tageshöchstzahl an Tokens für Modellinferenz für Meta Llama 3.2 1B Instruct. Kombiniert die Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream Verdoppelt bei regionsübergreifenden Anrufen; gilt nicht für den Fall einer genehmigten TPM-Erhöhung.
Modellieren Sie die maximale Anzahl an Tokens pro Tag für Meta Llama 3.2 3B Instruct (verdoppelt bei regionsübergreifenden Aufrufen)	Jede unterstützte Region: 432.000.000	Nein	Tageshöchstzahl an Tokens für Modellinferenz für Meta Llama 3.2 3B Instruct. Kombiniert die Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream Verdoppelt bei regionsübergreifenden Anrufen; gilt nicht für den Fall einer genehmigten TPM-Erhöhung.
Modellieren Sie die maximale Anzahl an Tokens pro Tag für Meta Llama 3.2 90B Instruct (verdoppelt bei regionsübergreifenden Aufrufen)	Jede unterstützte Region: 432.000.000	Nein	Tageshöchstzahl an Tokens für Modellinferenz für Meta Llama 3.2 90B Instruct. Kombiniert die Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream Verdoppelt bei regionsübergreifenden Anrufen; gilt nicht für den Fall einer genehmigten TPM-Erhöhung.
Modellieren Sie die maximale Anzahl an Tokens pro Tag für Meta Llama 4 Maverick V1 (verdoppelt bei regionsübergreifenden Aufrufen)	Jede unterstützte Region: 432.000.000	Nein	Tageshöchstzahl an Tokens für Modellinferenz für Meta Llama 4 Maverick V1. Kombiniert die Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream Verdoppelt bei regionsübergreifenden Anrufen; gilt nicht für den Fall einer genehmigten TPM-Erhöhung.
Modellieren Sie die maximale Anzahl an Tokens pro Tag für Meta Llama 4 Scout V1 (verdoppelt bei regionsübergreifenden Aufrufen)	Jede unterstützte Region: 432.000.000	Nein	Tageshöchstzahl an Tokens für Modellinferenz für Meta Llama 4 Scout V1. Kombiniert die Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, ConverseStream und. InvokeModel InvokeModelWithResponseStream Verdoppelt bei regionsübergreifenden Anrufen; gilt nicht für den Fall einer genehmigten TPM-Erhöhung.
Modellieren Sie die maximale Anzahl an Tokens pro Tag für MiniMax M2.5 (verdoppelt bei regionsübergreifenden Anrufen)	Jede unterstützte Region: 144.000.000.000	Nein	Tageshöchstzahl an Tokens für Modellinferenz für. MiniMax M2.5 Kombiniert die Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse ConverseStream, InvokeModel und. InvokeModelWithResponseStream Verdoppelt bei regionsübergreifenden Anrufen; gilt nicht für den Fall einer genehmigten TPM-Erhöhung.
Modellieren Sie die maximale Anzahl an Tokens pro Tag für Minimax M2 (verdoppelt bei regionsübergreifenden Anrufen)	Jede unterstützte Region: 144.000.000.000	Nein	Tageshöchstzahl an Tokens für Modellinferenz für Minimax M2. Kombiniert die Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, ConverseStream und. InvokeModel InvokeModelWithResponseStream Verdoppelt bei regionsübergreifenden Anrufen; gilt nicht für den Fall einer genehmigten TPM-Erhöhung.
Modellieren Sie die maximale Anzahl an Tokens pro Tag für Minimax M2.1 (verdoppelt bei regionsübergreifenden Anrufen)	Jede unterstützte Region: 144.000.000.000	Nein	Tageshöchstzahl an Tokens für Modellinferenz für Minimax. M2.1 Kombiniert die Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, ConverseStream und. InvokeModel InvokeModelWithResponseStream Verdoppelt bei regionsübergreifenden Anrufen; gilt nicht für den Fall einer genehmigten TPM-Erhöhung.
Modellieren Sie die maximale Anzahl an Tokens pro Tag für Ministral 14B 3.0 (verdoppelt bei regionsübergreifenden Anrufen)	Jede unterstützte Region: 144.000.000.000	Nein	Tageshöchstzahl an Tokens für Modellinferenz für Ministral 14B 3.0. Kombiniert die Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream Verdoppelt bei regionsübergreifenden Anrufen; gilt nicht für den Fall einer genehmigten TPM-Erhöhung.
Modell: Max. Anzahl an Tokens pro Tag für Ministral 3B 3.0 (verdoppelt bei regionsübergreifenden Anrufen)	Jede unterstützte Region: 144.000.000.000	Nein	Tageshöchstzahl an Tokens für Modellinferenz für Ministral 3B 3.0. Kombiniert die Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, ConverseStream und. InvokeModel InvokeModelWithResponseStream Verdoppelt bei regionsübergreifenden Anrufen; gilt nicht für den Fall einer genehmigten TPM-Erhöhung.
Modellieren Sie die maximale Anzahl an Tokens pro Tag für Ministral 8B 3.0 (verdoppelt bei regionsübergreifenden Anrufen)	Jede unterstützte Region: 144.000.000.000	Nein	Tageshöchstzahl an Tokens für Modellinferenz für Ministral 8B 3.0. Kombiniert die Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream Verdoppelt bei regionsübergreifenden Anrufen; gilt nicht für den Fall einer genehmigten TPM-Erhöhung.
Modellieren Sie die maximale Anzahl an Tokens pro Tag für Mistral AI Mistral 7B Instruct (verdoppelt bei regionsübergreifenden Aufrufen)	Jede unterstützte Region: 432.000.000	Nein	Tageshöchstzahl an Tokens für Modellinferenz für Mistral AI Mistral 7B Instruct. Kombiniert die Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream Verdoppelt bei regionsübergreifenden Anrufen; gilt nicht für den Fall einer genehmigten TPM-Erhöhung.
Modellieren Sie die maximale Anzahl an Tokens pro Tag für Mistral AI Mistral Large (verdoppelt bei regionsübergreifenden Aufrufen)	Jede unterstützte Region: 432.000.000	Nein	Tageshöchstzahl an Tokens für Modellinferenz für Mistral AI Mistral Large. Kombiniert die Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream Verdoppelt bei regionsübergreifenden Anrufen; gilt nicht für den Fall einer genehmigten TPM-Erhöhung.
Modellieren Sie die maximale Anzahl an Tokens pro Tag für Mistral AI Mistral Small (verdoppelt bei regionsübergreifenden Aufrufen)	Jede unterstützte Region: 432.000.000	Nein	Tageshöchstzahl an Tokens für Modellinferenz für Mistral AI Mistral Small. Kombiniert die Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream Verdoppelt bei regionsübergreifenden Anrufen; gilt nicht für den Fall einer genehmigten TPM-Erhöhung.
Modellieren Sie die maximale Anzahl an Tokens pro Tag für Mistral AI Mixtral 8X7B Instruct (verdoppelt bei regionsübergreifenden Aufrufen)	Jede unterstützte Region: 432.000.000	Nein	Tageshöchstzahl an Tokens für Modellinferenz für Mistral AI Mixtral 8X7B Instruct. Kombiniert die Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream Verdoppelt bei regionsübergreifenden Anrufen; gilt nicht für den Fall einer genehmigten TPM-Erhöhung.
Modellieren Sie die maximale Anzahl an Tokens pro Tag für Mistral Devstral 2 123b (verdoppelt bei regionsübergreifenden Aufrufen)	Jede unterstützte Region: 144.000.000.000	Nein	Tageshöchstzahl an Tokens für Modellinferenz für Mistral Devstral 2 123b. Kombiniert die Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream Verdoppelt bei regionsübergreifenden Anrufen; gilt nicht für den Fall einer genehmigten TPM-Erhöhung.
Modellieren Sie die maximale Anzahl an Tokens pro Tag für Mistral Large 3 (verdoppelt bei regionsübergreifenden Aufrufen)	Jede unterstützte Region: 144.000.000.000	Nein	Tageshöchstzahl an Tokens für Modellinferenz für Mistral Large 3. Kombiniert die Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream Verdoppelt bei regionsübergreifenden Anrufen; gilt nicht für den Fall einer genehmigten TPM-Erhöhung.
Modellieren Sie die maximale Anzahl an Tokens pro Tag für Mistral Pixtral Large 25.02 V1 (verdoppelt bei regionsübergreifenden Aufrufen)	Jede unterstützte Region: 57.600.000	Nein	Tageshöchstzahl an Tokens für Modellinferenz für Mistral Pixtral Large 25.02 V1. Kombiniert die Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream Verdoppelt bei regionsübergreifenden Anrufen; gilt nicht für den Fall einer genehmigten TPM-Erhöhung.
Modellieren Sie die maximale Anzahl an Tokens pro Tag für Moonshot AI Kimi K2.5 (verdoppelt bei regionsübergreifenden Anrufen)	Jede unterstützte Region: 144.000.000.000	Nein	Tageshöchstzahl an Tokens für Modellinferenz für Moonshot AI Kimi. K2.5 Kombiniert die Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream Verdoppelt bei regionsübergreifenden Anrufen; gilt nicht für den Fall einer genehmigten TPM-Erhöhung.
Maximale Anzahl an Tokens pro Tag beim Modellaufruf für NVIDIA Nemotron 3 Super 120B A12B (verdoppelt bei regionsübergreifenden Anrufen)	Jede unterstützte Region: 144.000.000.000	Nein	Tageshöchstzahl an Tokens für Modellinferenz für NVIDIA Nemotron 3 Super 120B A12B. Kombiniert die Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream Verdoppelt bei regionsübergreifenden Anrufen; gilt nicht für den Fall einer genehmigten TPM-Erhöhung.
Max. Anzahl an Tokens pro Tag für den Modellaufruf für NVIDIA Nemotron Nano 2 (verdoppelt bei regionsübergreifenden Aufrufen)	Jede unterstützte Region: 144.000.000.000	Nein	Tageshöchstzahl an Tokens für Modellinferenz für NVIDIA Nemotron Nano 2. Kombiniert die Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream Verdoppelt bei regionsübergreifenden Anrufen; gilt nicht für den Fall einer genehmigten TPM-Erhöhung.
Max. Anzahl an Tokens pro Tag für den Modellaufruf für NVIDIA Nemotron Nano 2 VL (verdoppelt bei regionsübergreifenden Aufrufen)	Jede unterstützte Region: 144.000.000.000	Nein	Tageshöchstzahl an Tokens für Modellinferenz für NVIDIA Nemotron Nano 2 VL. Kombiniert die Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream Verdoppelt bei regionsübergreifenden Anrufen; gilt nicht für den Fall einer genehmigten TPM-Erhöhung.
Maximale Anzahl an Tokens pro Tag für Modellaufrufe für Nemotron Nano 3 30B (verdoppelt bei regionsübergreifenden Anrufen)	Jede unterstützte Region: 144.000.000.000	Nein	Tageshöchstzahl an Tokens für Modellinferenz für Nemotron Nano 3 30B. Kombiniert die Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream Verdoppelt bei regionsübergreifenden Anrufen; gilt nicht für den Fall einer genehmigten TPM-Erhöhung.
Max. Anzahl der Tokens pro Tag für den Modellaufruf für OpenAI GPT OSS 120B (verdoppelt für regionsübergreifende Anrufe)	Jede unterstützte Region: 144.000.000.000	Nein	Tägliche maximale Tokens für Modellinferenz für OpenAI GPT OSS 120B. Kombiniert die Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream Verdoppelt bei regionsübergreifenden Anrufen; gilt nicht für den Fall einer genehmigten TPM-Erhöhung.
Max. Tokens pro Tag für Model-Aufrufe für OpenAI GPT OSS 20B (verdoppelt für regionsübergreifende Anrufe)	Jede unterstützte Region: 144.000.000.000	Nein	Tägliche maximale Tokens für Modellinferenz für OpenAI GPT OSS 20B. Kombiniert die Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream Verdoppelt bei regionsübergreifenden Anrufen; gilt nicht für den Fall einer genehmigten TPM-Erhöhung.
Modellieren Sie die maximale Anzahl an Tokens pro Tag für Qwen3 235B a22b 2507 V1 (verdoppelt bei regionsübergreifenden Anrufen)	Jede unterstützte Region: 144.000.000.000	Nein	Tageshöchstzahl an Tokens für Modellinferenz für Qwen3 235B a22b 2507 V1. Kombiniert die Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream Verdoppelt bei regionsübergreifenden Anrufen; gilt nicht für den Fall einer genehmigten TPM-Erhöhung.
Modellieren Sie die maximale Anzahl an Tokens pro Tag für Qwen3 32B V1 (verdoppelt bei regionsübergreifenden Anrufen)	Jede unterstützte Region: 144.000.000.000	Nein	Tageshöchstzahl an Tokens für Modellinferenz für Qwen3 32B V1. Kombiniert die Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream Verdoppelt bei regionsübergreifenden Anrufen; gilt nicht für den Fall einer genehmigten TPM-Erhöhung.
Modellieren Sie die maximale Anzahl an Tokens pro Tag für Qwen3 Coder 30B a3b V1 (verdoppelt bei regionsübergreifenden Anrufen)	Jede unterstützte Region: 144.000.000.000	Nein	Tageshöchstzahl an Tokens für Modellinferenz für Qwen3 Coder 30B a3b V1. Kombiniert die Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream Verdoppelt bei regionsübergreifenden Anrufen; gilt nicht für den Fall einer genehmigten TPM-Erhöhung.
Max. Anzahl der Tokens pro Tag beim Modellaufruf für Qwen3 Coder 480B A35b V1 (verdoppelt bei regionsübergreifenden Anrufen)	Jede unterstützte Region: 144.000.000.000	Nein	Tageshöchstzahl an Tokens für Modellinferenz für Qwen3 Coder 480B a35b V1. Kombiniert die Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream Verdoppelt bei regionsübergreifenden Anrufen; gilt nicht für den Fall einer genehmigten TPM-Erhöhung.
Modellieren Sie die maximale Anzahl an Tokens pro Tag für Qwen3 Coder Next (verdoppelt bei regionsübergreifenden Anrufen)	Jede unterstützte Region: 144.000.000.000	Nein	Tageshöchstzahl an Tokens für Modellinferenz für Qwen3 Coder Next. Kombiniert die Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream Verdoppelt bei regionsübergreifenden Anrufen; gilt nicht für den Fall einer genehmigten TPM-Erhöhung.
Modellieren Sie die maximale Anzahl an Tokens pro Tag für Qwen3 Next 80B A3B (verdoppelt bei regionsübergreifenden Anrufen)	Jede unterstützte Region: 144.000.000.000	Nein	Tageshöchstzahl an Tokens für Modellinferenz für Qwen3 Next 80B A3B. Kombiniert die Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream Verdoppelt bei regionsübergreifenden Anrufen; gilt nicht für den Fall einer genehmigten TPM-Erhöhung.
Modellieren Sie die maximale Anzahl an Tokens pro Tag für Qwen3 VL 235B A22B (verdoppelt bei regionsübergreifenden Anrufen)	Jede unterstützte Region: 144.000.000.000	Nein	Tageshöchstzahl an Tokens für Modellinferenz für Qwen3 VL 235B A22B. Kombiniert die Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream Verdoppelt bei regionsübergreifenden Anrufen; gilt nicht für den Fall einer genehmigten TPM-Erhöhung.
Modellieren Sie die maximale Anzahl an Tokens pro Tag für Voxtral Mini 1.0 (verdoppelt bei regionsübergreifenden Anrufen)	Jede unterstützte Region: 144.000.000.000	Nein	Tageshöchstzahl an Tokens für Modellinferenz für Voxtral Mini 1.0. Kombiniert die Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream Verdoppelt bei regionsübergreifenden Anrufen; gilt nicht für den Fall einer genehmigten TPM-Erhöhung.
Modellieren Sie die maximale Anzahl an Tokens pro Tag für Voxtral Small 1.0 (verdoppelt bei regionsübergreifenden Anrufen)	Jede unterstützte Region: 144.000.000.000	Nein	Tageshöchstzahl an Tokens für Modellinferenz für Voxtral Small 1.0. Kombiniert die Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream Verdoppelt bei regionsübergreifenden Anrufen; gilt nicht für den Fall einer genehmigten TPM-Erhöhung.
Modellieren Sie die maximale Anzahl an Tokens pro Tag für Writer AI Palmyra X4 V1 (verdoppelt bei regionsübergreifenden Aufrufen)	Jede unterstützte Region: 108.000.000	Nein	Tageshöchstzahl an Tokens für Modellinferenz für Writer AI Palmyra X4 V1. Kombiniert die Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream Verdoppelt bei regionsübergreifenden Anrufen; gilt nicht für den Fall einer genehmigten TPM-Erhöhung.
Modellieren Sie die maximale Anzahl an Tokens pro Tag für Writer AI Palmyra X5 V1 (verdoppelt bei regionsübergreifenden Aufrufen)	Jede unterstützte Region: 108.000.000	Nein	Tageshöchstzahl an Tokens für Modellinferenz für Writer AI Palmyra X5 V1. Kombiniert die Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream Verdoppelt bei regionsübergreifenden Anrufen; gilt nicht für den Fall einer genehmigten TPM-Erhöhung.
Modellieren Sie die maximale Anzahl an Tokens pro Tag für Writer Palmyra Vision 7B (verdoppelt bei regionsübergreifenden Aufrufen)	Jede unterstützte Region: 144.000.000.000	Nein	Tageshöchstzahl an Tokens für Modellinferenz für Writer Palmyra Vision 7B. Kombiniert die Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream Verdoppelt bei regionsübergreifenden Anrufen; gilt nicht für den Fall einer genehmigten TPM-Erhöhung.
Modellieren Sie die maximale Anzahl an Tokens pro Tag für Z.ai GLM 5 (verdoppelt bei regionsübergreifenden Anrufen)	Jede unterstützte Region: 144.000.000.000	Nein	Tageshöchstzahl an Tokens für Modellinferenz für GLM 5. Z.ai Kombiniert die Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, ConverseStream und. InvokeModel InvokeModelWithResponseStream Verdoppelt bei regionsübergreifenden Anrufen; gilt nicht für den Fall einer genehmigten TPM-Erhöhung.
Modellieren Sie die maximale Anzahl an Tokens pro Tag für Z.ai GLM-4.7 (verdoppelt bei regionsübergreifenden Anrufen)	Jede unterstützte Region: 144.000.000.000	Nein	Tageshöchstzahl an Tokens für Modellinferenz für. Z.ai GLM-4.7 Kombiniert die Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse ConverseStream, InvokeModel und. InvokeModelWithResponseStream Verdoppelt bei regionsübergreifenden Anrufen; gilt nicht für den Fall einer genehmigten TPM-Erhöhung.
Modellieren Sie die maximale Anzahl an Tokens pro Tag für Z.ai GLM-4.7 Flash (verdoppelt bei regionsübergreifenden Aufrufen)	Jede unterstützte Region: 144.000.000.000	Nein	Tageshöchstzahl an Tokens für Modellinferenz für Flash. Z.ai GLM-4.7 Kombiniert die Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse ConverseStream, InvokeModel und. InvokeModelWithResponseStream Verdoppelt bei regionsübergreifenden Anrufen; gilt nicht für den Fall einer genehmigten TPM-Erhöhung.
Modelleinheiten unverbindlich Bereitgestellte Durchsätze für alle Basismodelle	Jede unterstützte Region: 0	Ja	Die maximale Anzahl von Modelleinheiten, die auf unverbindliche Provisioned Throughputs für Basismodelle verteilt werden können
Modelleinheiten unverbindlich Bereitgestellte Durchsätze auf benutzerdefinierte Modelle	Jede unterstützte Region: 0	Ja	Die maximale Anzahl von Modelleinheiten, die auf unverbindlich bereitgestellte Durchsätze für benutzerdefinierte Modelle verteilt werden können
Modelleinheiten pro bereitgestelltem Modell für AI21 Labs Mid Jurassic-2	Jede unterstützte Region: 0	Ja	Die maximale Anzahl von Modelleinheiten, die einem bereitgestellten Modell für AI21 Labs Mid zugewiesen werden können. Jurassic-2
Modelleinheiten pro bereitgestelltem Modell für AI21 Labs Ultra Jurassic-2	Jede unterstützte Region: 0	Ja	Die maximale Anzahl von Modelleinheiten, die einem bereitgestellten Modell für AI21 Labs Ultra zugewiesen werden können. Jurassic-2
Modelleinheiten pro bereitgestelltem Modell für Amazon Nova 2 Lite 256.000 V1.0	Jede unterstützte Region: 0	Ja	Die maximale Anzahl von Modelleinheiten, die einem bereitgestellten Modell für Amazon Nova 2 Lite 256.000 zugewiesen werden können. V1.0
Modelleinheiten pro bereitgestelltem Modell für Amazon Nova Canvas	Jede unterstützte Region: 0	Ja	Die maximale Anzahl von Modelleinheiten, die einem bereitgestellten Modell für Amazon Nova Canvas zugewiesen werden können.
Modelleinheiten pro bereitgestelltem Modell für Amazon Titan Embeddings G1 — Text	Jede unterstützte Region: 0	Ja	Die maximale Anzahl von Modelleinheiten, die einem bereitgestellten Modell für Amazon Titan Embeddings G1 — Text zugewiesen werden können.
Modelleinheiten pro bereitgestelltem Modell für Amazon Titan Image Generator G1	Jede unterstützte Region: 0	Ja	Die maximale Anzahl von Modelleinheiten, die einem bereitgestellten Modell für Amazon Titan Image Generator G1 zugewiesen werden können.
Modelleinheiten pro bereitgestelltem Modell für Amazon Titan Image Generator G2	Jede unterstützte Region: 0	Ja	Die maximale Anzahl von Modelleinheiten, die einem bereitgestellten Modell für Amazon Titan Image Generator G2 zugewiesen werden können.
Modelleinheiten pro bereitgestelltem Modell für Amazon Titan Lite V1 4K	Jede unterstützte Region: 0	Ja	Die maximale Anzahl von Modelleinheiten, die einem bereitgestellten Modell für Amazon Titan Text Lite V1 4K zugewiesen werden können.
Modelleinheiten pro bereitgestelltem Modell für Amazon Titan Multimodal Embeddings G1	Jede unterstützte Region: 0	Ja	Die maximale Anzahl von Modelleinheiten, die einem bereitgestellten Modell für Amazon Titan Multimodal Embeddings G1 zugewiesen werden können.
Modelleinheiten pro bereitgestelltem Modell für Amazon Titan Text Embeddings V2	Jede unterstützte Region: 0	Ja	Die maximale Anzahl von Modelleinheiten, die einem bereitgestellten Modell für Amazon Titan Text Embeddings V2 zugewiesen werden können.
Modelleinheiten pro bereitgestelltem Modell für Amazon Titan Text G1 — Express 8K	Jede unterstützte Region: 0	Ja	Die maximale Anzahl von Modelleinheiten, die einem bereitgestellten Modell für Amazon Titan Text G1 — Express 8K zugewiesen werden können.
Modelleinheiten pro bereitgestelltem Modell für Amazon Titan Text Premier V1 32K	Jede unterstützte Region: 0	Ja	Die maximale Anzahl von Modelleinheiten, die einem bereitgestellten Modell für Amazon Titan Text Premier V1 32K zugewiesen werden können.
Modelleinheiten pro bereitgestelltem Modell für Anthropic Claude 3 Haiku 200K	Jede unterstützte Region: 0	Ja	Die maximale Anzahl von Modelleinheiten, die einem bereitgestellten Modell für Anthropic Claude 3 Haiku 200K zugewiesen werden können.
Modelleinheiten pro bereitgestelltem Modell für Anthropic Claude 3 Haiku 48K	Jede unterstützte Region: 0	Ja	Die maximale Anzahl von Modelleinheiten, die einem bereitgestellten Modell für Anthropic Claude 3 Haiku 48K zugewiesen werden können.
Modelleinheiten pro bereitgestelltem Modell für Anthropic Claude 3 Sonnet 200K	Jede unterstützte Region: 0	Ja	Die maximale Anzahl von Modelleinheiten, die einem bereitgestellten Modell für Anthropic Claude 3 Sonnet 200K zugewiesen werden können.
Modelleinheiten pro bereitgestelltem Modell für Anthropic Claude 3 Sonnet 28K	Jede unterstützte Region: 0	Ja	Die maximale Anzahl von Modelleinheiten, die einem bereitgestellten Modell für Anthropic Claude 3 Sonnet 28K zugewiesen werden können.
Modelleinheiten pro bereitgestelltem Modell für Anthropic Claude 3.5 Haiku 16K	Jede unterstützte Region: 0	Ja	Die maximale Anzahl von Modelleinheiten, die einem bereitgestellten Modell für Anthropic Claude 3.5 Haiku 16K zugewiesen werden können.
Modelleinheiten pro bereitgestelltem Modell für Anthropic Claude 3.5 Haiku 200K	Jede unterstützte Region: 0	Ja	Die maximale Anzahl von Modelleinheiten, die einem bereitgestellten Modell für Anthropic Claude 3.5 Haiku 200K zugewiesen werden können.
Modelleinheiten pro bereitgestelltem Modell für Anthropic Claude 3.5 Haiku 64K	Jede unterstützte Region: 0	Ja	Die maximale Anzahl von Modelleinheiten, die einem bereitgestellten Modell für Anthropic Claude 3.5 Haiku 64K zugewiesen werden können.
Modelleinheiten pro bereitgestelltem Modell für Anthropic Claude 3.5 Sonnet 18K	Jede unterstützte Region: 0	Ja	Die maximale Anzahl von Modelleinheiten, die einem bereitgestellten Modell für Anthropic Claude 3.5 Sonnet 18K zugewiesen werden können.
Modelleinheiten pro bereitgestelltem Modell für Anthropic Claude 3.5 Sonnet 200K	Jede unterstützte Region: 0	Ja	Die maximale Anzahl von Modelleinheiten, die einem bereitgestellten Modell für Anthropic Claude 3.5 Sonnet 200K zugewiesen werden können.
Modelleinheiten pro bereitgestelltem Modell für Anthropic Claude 3.5 Sonnet 51.000	Jede unterstützte Region: 0	Ja	Die maximale Anzahl von Modelleinheiten, die einem bereitgestellten Modell für Anthropic Claude 3.5 Sonnet 51K zugewiesen werden können.
Modelleinheiten pro bereitgestelltem Modell für Anthropic Claude 3.5 Sonnet V2 18K	Jede unterstützte Region: 0	Ja	Die maximale Anzahl von Modelleinheiten, die einem bereitgestellten Modell für Anthropic Claude 3.5 Sonnet V2 18K zugewiesen werden können.
Modelleinheiten pro bereitgestelltem Modell für Anthropic Claude 3.5 Sonnet V2 200K	Jede unterstützte Region: 0	Ja	Die maximale Anzahl von Modelleinheiten, die einem bereitgestellten Modell für Anthropic Claude 3.5 Sonnet V2 200K zugewiesen werden können.
Modelleinheiten pro bereitgestelltem Modell für Anthropic Claude 3.5 Sonnet V2 51.000	Jede unterstützte Region: 0	Ja	Die maximale Anzahl von Modelleinheiten, die einem bereitgestellten Modell für Anthropic Claude 3.5 Sonnet V2 51K zugewiesen werden können.
Modelleinheiten pro bereitgestelltem Modell für Anthropic Claude 3.7 Sonnet 18K V1.0	Jede unterstützte Region: 0	Ja	Die maximale Anzahl von Modelleinheiten, die einem bereitgestellten Modell für Anthropic Claude 3.7 Sonnet 18K zugewiesen werden können. V1.0
Modelleinheiten pro bereitgestelltem Modell für Anthropic Claude 3.7 Sonnet 200K V1.0	Jede unterstützte Region: 0	Ja	Die maximale Anzahl von Modelleinheiten, die einem bereitgestellten Modell für Anthropic Claude 3.7 Sonnet 200K zugewiesen werden können. V1.0
Modelleinheiten pro bereitgestelltem Modell für Anthropic Claude 3.7 Sonnet 51.000 V1.0	Jede unterstützte Region: 0	Ja	Die maximale Anzahl von Modelleinheiten, die einem bereitgestellten Modell für Anthropic Claude 3.7 Sonnet 51K zugewiesen werden können. V1.0
Modelleinheiten pro bereitgestelltem Modell für Anthropic Claude Instant V1:100.000	Jede unterstützte Region: 0	Ja	Die maximale Anzahl von Modelleinheiten, die einem bereitgestellten Modell für Anthropic Claude Instant V1 100.000 zugewiesen werden können.
Modelleinheiten pro bereitgestelltem Modell für Anthropic Claude V2 (100.000)	Jede unterstützte Region: 0	Ja	Die maximale Anzahl von Modelleinheiten, die einem bereitgestellten Modell für Anthropic Claude V2 100K zugewiesen werden können.
Modelleinheiten pro bereitgestelltem Modell für Anthropic Claude V2 18K	Jede unterstützte Region: 0	Ja	Die maximale Anzahl von Modelleinheiten, die einem bereitgestellten Modell für Anthropic Claude V2 18K zugewiesen werden können.
Modelleinheiten pro bereitgestelltem Modell für Anthropic Claude 18K V2.1	Jede unterstützte Region: 0	Ja	Die maximale Anzahl von Modelleinheiten, die einem bereitgestellten Modell für Anthropic Claude 18K zugewiesen werden können. V2.1
Modelleinheiten pro bereitgestelltem Modell für Anthropic Claude 200K V2.1	Jede unterstützte Region: 0	Ja	Die maximale Anzahl von Modelleinheiten, die einem bereitgestellten Modell für Anthropic Claude 200K zugewiesen werden können. V2.1
Modelleinheiten pro bereitgestelltem Modell für Cohere Command	Jede unterstützte Region: 0	Ja	Die maximale Anzahl von Modelleinheiten, die einem bereitgestellten Modell für Cohere Command zugewiesen werden können.
Modelleinheiten pro bereitgestelltem Modell für Cohere Command Light	Jede unterstützte Region: 0	Ja	Die maximale Anzahl von Modelleinheiten, die einem bereitgestellten Modell für Cohere Command Light zugewiesen werden können.
Modelleinheiten pro bereitgestelltem Modell für Cohere Command R	Jede unterstützte Region: 0	Ja	Die maximale Anzahl von Modelleinheiten, die einem bereitgestellten Modell für Cohere Command R 128k zugewiesen werden können.
Modelleinheiten pro bereitgestelltem Modell für Cohere Command R Plus	Jede unterstützte Region: 0	Ja	Die maximale Anzahl von Modelleinheiten, die einem bereitgestellten Modell für Cohere Command R Plus 128k zugewiesen werden können.
Modelleinheiten pro bereitgestelltem Modell für Cohere Embed English	Jede unterstützte Region: 0	Ja	Die maximale Anzahl von Modelleinheiten, die einem bereitgestellten Modell für Cohere Embed English zugewiesen werden können.
Modelleinheiten pro bereitgestelltem Modell für Cohere Embed Multilingual	Jede unterstützte Region: 0	Ja	Die maximale Anzahl von Modelleinheiten, die einem bereitgestellten Modell für Cohere Embed Multilingual zugewiesen werden können.
Modelleinheiten pro bereitgestelltem Modell für Meta Llama 2 13B	Jede unterstützte Region: 0	Ja	Die maximale Anzahl von Modelleinheiten, die einem bereitgestellten Modell für Meta Llama 2 13B zugewiesen werden können.
Modelleinheiten pro bereitgestelltem Modell für Meta Llama 2 70B	Jede unterstützte Region: 0	Ja	Die maximale Anzahl von Modelleinheiten, die einem bereitgestellten Modell für Meta Llama 2 70B zugewiesen werden können.
Modelleinheiten pro bereitgestelltem Modell für Meta Llama 2 Chat 13B	Jede unterstützte Region: 0	Ja	Die maximale Anzahl von Modelleinheiten, die einem bereitgestellten Modell für Meta Llama 2 Chat 13B zugewiesen werden können.
Modelleinheiten pro bereitgestelltem Modell für Meta Llama 2 Chat 70B	Jede unterstützte Region: 0	Ja	Die maximale Anzahl von Modelleinheiten, die einem bereitgestellten Modell für Meta Llama 2 Chat 70B zugewiesen werden können.
Modelleinheiten pro bereitgestelltem Modell für Meta Llama 3 70B Instruct	Jede unterstützte Region: 0	Ja	Die maximale Anzahl von Modelleinheiten, die einem bereitgestellten Modell für Meta Llama 3 70B Instruct zugewiesen werden können.
Modelleinheiten pro bereitgestelltem Modell für Meta Llama 3 8B Instruct	Jede unterstützte Region: 0	Ja	Die maximale Anzahl von Modelleinheiten, die einem bereitgestellten Modell für Meta Llama 3 8B Instruct zugewiesen werden können.
Modelleinheiten pro bereitgestelltem Modell für Meta Llama 3.1 70B Instruct	Jede unterstützte Region: 0	Ja	Die maximale Anzahl von Modelleinheiten, die einem bereitgestellten Modell für Meta Llama 3.1 70B Instruct zugewiesen werden können.
Modelleinheiten pro bereitgestelltem Modell für Meta Llama 3.1 8B Instruct	Jede unterstützte Region: 0	Ja	Die maximale Anzahl von Modelleinheiten, die einem bereitgestellten Modell für Meta Llama 3.1 8B Instruct zugewiesen werden können.
Modelleinheiten pro bereitgestelltem Modell für Meta Llama 3.2 11B Instruct	Jede unterstützte Region: 0	Ja	Die maximale Anzahl von Modelleinheiten, die einem bereitgestellten Modell für Meta Llama 3.2 11B Instruct zugewiesen werden können.
Modelleinheiten pro bereitgestelltem Modell für Meta Llama 3.2 1B Instruct	Jede unterstützte Region: 0	Ja	Die maximale Anzahl von Modelleinheiten, die einem bereitgestellten Modell für Meta Llama 3.2 1B Instruct zugewiesen werden können.
Modelleinheiten pro bereitgestelltem Modell für Meta Llama 3.2 3B Instruct	Jede unterstützte Region: 0	Ja	Die maximale Anzahl von Modelleinheiten, die einem bereitgestellten Modell für Meta Llama 3.2 3B Instruct zugewiesen werden können.
Modelleinheiten pro bereitgestelltem Modell für Meta Llama 3.2 90B Instruct	Jede unterstützte Region: 0	Ja	Die maximale Anzahl von Modelleinheiten, die einem bereitgestellten Modell für Meta Llama 3.2 90B Instruct zugewiesen werden können.
Modelleinheiten pro bereitgestelltem Modell für Mistral Large 2407	Jede unterstützte Region: 0	Ja	Die maximale Anzahl von Modelleinheiten, die einem bereitgestellten Modell für Mistral Large 2407 zugewiesen werden können.
Modelleinheiten pro bereitgestelltem Modell für Mistral Small	Jede unterstützte Region: 0	Ja	Die maximale Anzahl von Modelleinheiten, die einem bereitgestellten Modell für Mistral Small zugewiesen werden können.
Modelleinheiten pro bereitgestelltem Modell für Stable Diffusion XL 0.8 Stability.ai	Jede unterstützte Region: 0	Ja	Die maximale Anzahl von Modelleinheiten, die einem bereitgestellten Modell für Stability.ai Stable Diffusion XL 0.8 zugewiesen werden können
Modelleinheiten pro bereitgestelltem Modell für Stability.ai Stable Diffusion XL 1.0	Jede unterstützte Region: 0	Ja	Die maximale Anzahl von Modelleinheiten, die einem bereitgestellten Modell für Stability.ai Stable Diffusion XL 1.0 zugewiesen werden können.
Modelleinheiten pro bereitgestelltem Modell für die Variante mit einer Kontextlänge von 128 KB für Amazon Nova Micro	Jede unterstützte Region: 0	Ja	Die maximale Anzahl von Modelleinheiten, die einem bereitgestellten Modell für die Variante mit einer Kontextlänge von 128 KB für Amazon Nova Micro zugewiesen werden können
Modelleinheiten pro bereitgestelltem Modell für die Variante mit 24.000 Kontextlänge für Amazon Nova Lite	Jede unterstützte Region: 0	Ja	Die maximale Anzahl von Modelleinheiten, die einem bereitgestellten Modell für die 24.000 Kontextlängen-Variante für Amazon Nova Lite zugewiesen werden können
Modelleinheiten pro bereitgestelltem Modell für die Variante mit 24.000 Kontextlänge für Amazon Nova Micro	Jede unterstützte Region: 0	Ja	Die maximale Anzahl von Modelleinheiten, die einem bereitgestellten Modell für die 24.000 Kontextlängen-Variante für Amazon Nova Micro zugewiesen werden können
Modelleinheiten pro bereitgestelltem Modell für die Variante mit 24.000 Kontextlänge für Amazon Nova Pro	Jede unterstützte Region: 0	Ja	Die maximale Anzahl von Modelleinheiten, die einem bereitgestellten Modell für die 24.000 Kontextlängen-Variante für Amazon Nova Pro zugewiesen werden können
Modelleinheiten pro bereitgestelltem Modell für die 300.000 Kontextlängen-Variante für Amazon Nova Lite	Jede unterstützte Region: 0	Ja	Die maximale Anzahl von Modelleinheiten, die einem bereitgestellten Modell für die 300.000 Kontextlängen-Variante für Amazon Nova Lite zugewiesen werden können
Modelleinheiten pro bereitgestelltem Modell für die 300.000 Kontextlängen-Variante für Amazon Nova Pro	Jede unterstützte Region: 0	Ja	Die maximale Anzahl von Modelleinheiten, die einem bereitgestellten Modell für die 300.000 Kontextlängen-Variante für Amazon Nova Pro zugewiesen werden können.
Modelleinheiten, mit Verpflichtung, für Provisioned Throughout, erstellt für Meta Llama 4 Scout 17B Instruct 10M	Jede unterstützte Region: 0	Ja	Die maximale Anzahl von Modelleinheiten, die einem bereitgestellten Durchsatz zugewiesen werden können, der für Meta Llama 4 Scout 17B Instruct 10M mit Verpflichtung erstellt wurde.
Modelleinheiten für Provisioned Throughout, die für Meta Llama 4 Scout 17B Instruct 128K entworfen wurden	Jede unterstützte Region: 0	Ja	Die maximale Anzahl von Modelleinheiten, die einem bereitgestellten Durchsatz zugewiesen werden können, wurde für Meta Llama 4 Scout 17B Instruct 128K mit Verbindlichkeit erstellt.
Modelleinheiten mit Zusicherung für Provisioned Throughout, erstellt für Meta Maverick 4 Scout 17B Instruct 128K	Jede unterstützte Region: 0	Ja	Die maximale Anzahl von Modelleinheiten, die einem für Meta Llama 4 Maverick 17B Instruct 128K erstellten Provisioned Throughput zugewiesen werden können, mit Verbindlichkeit.
Modelleinheiten mit Verbindlichkeit für Provisioned Throughout, erstellt für Meta Maverick 4 Scout 17B Instruct 1M	Jede unterstützte Region: 0	Ja	Die maximale Anzahl von Modelleinheiten, die einem bereitgestellten Durchsatz zugewiesen werden können, der für Meta Llama 4 Maverick 17B Instruct 1M erstellt wurde, mit Verbindlichkeit.
No-commitment Modelleinheiten für Provisioned Throughput, erstellt für das Basismodell Amazon Nova 2 Lite 256K V1.0	Jede unterstützte Region: 0	Nein	Die maximale Anzahl von Modelleinheiten, die einem bereitgestellten Durchsatz zugewiesen werden können, der für das Basismodell Amazon Nova 2 Lite ( V1.0 256 KB) ohne Verpflichtung erstellt wurde
No-commitment Modelleinheiten für bereitgestellten Durchsatz, erstellt für das benutzerdefinierte Modell Amazon Nova 2 Lite 256K V1.0	Jede unterstützte Region: 0	Nein	Die maximale Anzahl von Modelleinheiten, die einem bereitgestellten Durchsatz zugewiesen werden können, der für das benutzerdefinierte Modell Amazon Nova 2 Lite V1.0 256K ohne Verpflichtung erstellt wurde.
Anzahl der Router mit benutzerdefinierten Eingabeaufforderungen pro Konto	Jede unterstützte Region: 500	Nein	Die maximale Anzahl von Routern für benutzerdefinierte Eingabeaufforderungen, die Sie pro Konto und Region erstellen können.
On-Demand, latenzoptimierte Modellinferenzanfragen pro Minute für Amazon Nova Pro V1	Jede unterstützte Region: 10	Nein	Die maximale Anzahl von latenzoptimierten On-Demand-Anfragen, die Sie für Amazon Nova Pro V1 innerhalb einer Minute zur Modellinferenz einreichen können. Das Kontingent berücksichtigt die kombinierte Summe aus Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream
On-Demand, latenzoptimierte Modellinferenzanfragen pro Minute für Meta Llama 3.1 405B Instruct	Jede unterstützte Region: 100	Nein	Die maximale Anzahl latenzoptimierter On-Demand-Anfragen, die Sie innerhalb einer Minute zur Modellinferenz für Meta Llama 3.1 405B Instruct einreichen können. Das Kontingent berücksichtigt die Summe aus Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream
On-Demand, latenzoptimierte Modellinferenzanfragen pro Minute für Meta Llama 3.1 70B Instruct	Jede unterstützte Region: 100	Nein	Die maximale Anzahl latenzoptimierter On-Demand-Anfragen, die Sie innerhalb einer Minute zur Modellinferenz für Meta Llama 3.1 70B Instruct einreichen können. Das Kontingent berücksichtigt die Summe aus Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream
On-Demand, latenzoptimierte Modellinferenz-Token pro Minute für Amazon Nova Pro V1	Jede unterstützte Region: 40 000	Nein	Die maximale Anzahl von latenzoptimierten On-Demand-Token, die Sie innerhalb einer Minute für Amazon Nova Pro V1 zur Modellinferenz einreichen können. Das Kontingent berücksichtigt die kombinierte Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream
On-Demand, latenzoptimierte Modell-Inferenz-Token pro Minute für Meta Llama 3.1 405B Instruct	Jede unterstützte Region: 40 000	Nein	Die maximale Anzahl latenzoptimierter On-Demand-Token, die Sie innerhalb einer Minute zur Modellinferenz für Meta Llama 3.1 405B Instruct einreichen können. Das Kontingent berücksichtigt die kombinierte Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream
On-Demand, latenzoptimierte Modell-Inferenz-Token pro Minute für Meta Llama 3.1 70B Instruct	Jede unterstützte Region: 40 000	Nein	Die maximale Anzahl latenzoptimierter On-Demand-Token, die Sie innerhalb einer Minute zur Modellinferenz für Meta Llama 3.1 70B Instruct einreichen können. Das Kontingent berücksichtigt die kombinierte Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream
On-demand InvokeModel asynchrone gleichzeitige Anfragen für Amazon Nova 2 Multimodal Embeddings V1	Jede unterstützte Region: 30	Nein	Die maximale Anzahl von asynchronen gleichzeitigen Model-Inferenzanfragen, die Sie für Amazon Nova 2 Multimodal Embeddings V1 einreichen können. Das Kontingent berücksichtigt die kombinierte Summe aus Converse,, und. ConverseStream InvokeModel InvokeModelWithResponseStream
On-demand InvokeModel asynchrone gleichzeitige Anfragen für TwelveLabs Marengo Embed 3.0	Jede unterstützte Region: 10	Yes (Ja)	Die maximale Anzahl gleichzeitiger asynchroner Model-Inferenzanfragen, die Sie für Marengo Embed 3.0 einreichen können. TwelveLabs Das Kontingent berücksichtigt die kombinierte Summe aus Converse,, und. ConverseStream InvokeModel InvokeModelWithResponseStream
On-demand InvokeModel gleichzeitige Anfragen für Amazon Nova 2 Sonic	Jede unterstützte Region: 20	Nein	Die maximale Anzahl gleichzeitiger Modellinferenzanfragen, die Sie für Amazon Nova 2 Sonic einreichen können. Das Kontingent berücksichtigt die kombinierte Summe aus Converse, ConverseStream, InvokeModel und. InvokeModelWithResponseStream
On-demand InvokeModel gleichzeitige Anfragen für Amazon Nova Reel1.0	Jede unterstützte Region: 10	Nein	Die maximale Anzahl gleichzeitiger Model-Inferenzanfragen, die Sie für Amazon Nova Reel 1.0 einreichen können. Das Kontingent berücksichtigt die kombinierte Summe aus Converse, und ConverseStream. InvokeModel InvokeModelWithResponseStream
On-demand InvokeModel gleichzeitige Anfragen für Amazon Nova Reel1.1	Jede unterstützte Region: 3	Nein	Die maximale Anzahl gleichzeitiger Modellinferenzanfragen, die Sie für Amazon Nova Reel 1.1 einreichen können. Das Kontingent berücksichtigt die kombinierte Summe aus Converse, und ConverseStream. InvokeModel InvokeModelWithResponseStream
On-demand InvokeModel gleichzeitige Anfragen für Amazon Nova Sonic	Jede unterstützte Region: 20	Nein	Die maximale Anzahl gleichzeitiger Anfragen, die Sie zur Modellinferenz für Amazon Nova Sonic einreichen können.
On-demand InvokeModel gleichzeitige Anfragen für Twelve Labs Marengo	Jede unterstützte Region: 30	Nein	Die maximale Anzahl gleichzeitiger InvokeModel Anfragen, die Sie zur Modellinferenz für Twelve Labs Marengo einreichen können.
On-demand InvokeModel gleichzeitige Anfragen für Twelve Labs Pegasus	Jede unterstützte Region: 30	Yes (Ja)	Die maximale Anzahl gleichzeitiger InvokeModel Anfragen, die Sie zur Modellinferenz für Twelve Labs Pegasus einreichen können.
On-demand latenzoptimierte Modellinferenzanfragen pro Minute für Anthropic Claude 3.5 Haiku	Jede unterstützte Region: 100	Nein	Die maximale Häufigkeit, mit der Sie Modellinferenz in einer Minute aufrufen können. Das Kontingent berücksichtigt die kombinierte Summe aus Converse ConverseStream, InvokeModel und InvokeModelWithResponseStream für Anthropic Claude 3.5 Haiku, sofern die Latenzoptimierung konfiguriert ist.
On-demand latenzoptimierte Modell-Inferenz-Token pro Minute für Anthropic Claude 3.5 Haiku	Jede unterstützte Region: 500 000	Nein	Die maximale Anzahl von On-Demand-Token, die Sie in einer Minute zur Modellinferenz einreichen können. Das Kontingent berücksichtigt die kombinierte Summe der Eingabe- und Ausgabetokens für alle Anfragen an Converse InvokeModel und InvokeModelWithResponseStream für Anthropic Claude 3.5 Haiku, sofern die Latenzoptimierung konfiguriert ist. ConverseStream
On-demand Modellieren Sie die Inferenz gleichzeitiger Anfragen für Luma Ray V2	Jede unterstützte Region: 1	Nein	Die maximale Anzahl gleichzeitiger Anfragen, die Sie zur Modellinferenz für Luma Ray V2 einreichen können. Das Kontingent berücksichtigt die kombinierte Summe aus Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream
On-demand Modellieren Sie Inferenzanfragen pro Minute für AI21 Labs Jamba 1.5 Large	Jede unterstützte Region: 100	Nein	Die maximale Häufigkeit, mit der Sie Modellinferenz in einer Minute für AI21 Labs Jamba 1.5 Large aufrufen können. Das Kontingent berücksichtigt die kombinierte Summe der Anfragen für Converse und InvokeModel
On-demand modellieren Sie Inferenzanfragen pro Minute für AI21 Labs Jamba 1.5 Mini	Jede unterstützte Region: 100	Nein	Die maximale Häufigkeit, mit der Sie Modellinferenz in einer Minute für AI21 Labs Jamba 1.5 Mini aufrufen können. Das Kontingent berücksichtigt die kombinierte Summe der Anfragen für Converse und InvokeModel
On-demand Modellieren Sie Inferenzanfragen pro Minute für Amazon Nova 2 Multimodal Embeddings V1	Jede unterstützte Region: 2.000	Nein	Die maximale Anzahl von On-Demand-Anfragen, die Sie für Amazon Nova 2 Multimodal Embeddings V1 innerhalb einer Minute zur Modellinferenz einreichen können. Dieses Kontingent entspricht der Gesamtzahl der Anfragen an die Converse,, und der Aktionen. ConverseStream InvokeModel InvokeModelWithResponseStream
On-demand Modellieren Sie Inferenzanfragen pro Minute für Amazon Nova Canvas	Jede unterstützte Region: 100	Nein	Die maximale Anzahl von Anfragen, die Sie in einer Minute für Amazon Nova Canvas zur Modellinferenz einreichen können. Das Kontingent berücksichtigt die kombinierte Summe aus Converse ConverseStream, InvokeModel und. InvokeModelWithResponseStream
On-demand Modellieren Sie Inferenzanfragen pro Minute für Amazon Nova Lite	us-east-1: 2 000 eu-west-2:2.000 Jede der anderen unterstützten Regionen: 200	Nein	Die maximale Anzahl von On-Demand-Anfragen, die Sie für Amazon Nova Lite innerhalb einer Minute zur Modellinferenz einreichen können. Dieses Kontingent entspricht der Gesamtzahl der Anfragen an Converse, ConverseStream, InvokeModel und InvokeModelWithResponseStream Aktionen.
On-demand Modellieren Sie Inferenzanfragen pro Minute für Amazon Nova Micro	us-east-1: 2 000 eu-west-2:2.000 Jede der anderen unterstützten Regionen: 200	Nein	Die maximale Anzahl von On-Demand-Anfragen, die Sie für Amazon Nova Micro innerhalb einer Minute zur Modellinferenz einreichen können. Dieses Kontingent entspricht der Gesamtzahl der Anfragen an die Converse, ConverseStream, InvokeModel und InvokeModelWithResponseStream der Aktionen.
On-demand Modellieren Sie Inferenzanfragen pro Minute für Amazon Nova Pro	Jede unterstützte Region: 250	Nein	Die maximale Anzahl von On-Demand-Anfragen, die Sie für Amazon Nova Pro innerhalb einer Minute zur Modellinferenz einreichen können. Dieses Kontingent entspricht der Gesamtzahl der Anfragen an Converse, ConverseStream, InvokeModel und InvokeModelWithResponseStream Aktionen.
On-demand Modellieren Sie Inferenzanfragen pro Minute für Amazon Rerank 1.0	Jede unterstützte Region: 200	Nein	Die maximale Anzahl von Anrufen InvokeModel in einer Minute für Amazon Rerank 1.0.
On-demand Modellinferenzanfragen pro Minute für Amazon Titan Image Generator G1	Jede unterstützte Region: 60	Nein	Die maximale Anzahl von Aufrufen InvokeModel in einer Minute für Amazon Titan Image Generator G1.
On-demand Modellinferenzanfragen pro Minute für Amazon Titan Image Generator G1 V2	Jede unterstützte Region: 60	Nein	Die maximale Anzahl von On-Demand-Anfragen, die Sie innerhalb einer Minute zur Modellinferenz für Amazon Titan Image Generator G1 V2 einreichen können. Dieses Kontingent entspricht der Gesamtzahl der Anfragen an die Converse, ConverseStream, InvokeModel und der Aktionen. InvokeModelWithResponseStream
On-demand Modellieren Sie Inferenzanfragen pro Minute für Amazon Titan Multimodal Embeddings G1	Jede unterstützte Region: 2.000	Nein	Die maximale Anzahl von Aufrufen InvokeModel in einer Minute für Amazon Titan Multimodal Embeddings G1.
On-demand Modellieren Sie Inferenzanfragen pro Minute für Amazon Titan Text Embeddings	Jede unterstützte Region: 2.000	Nein	Die maximale Anzahl von Anrufen InvokeModel in einer Minute für Amazon Titan Text Embeddings
On-demand Modellieren Sie Inferenzanfragen pro Minute für Amazon Titan Text Embeddings V2	Jede unterstützte Region: 6 000	Nein	Die maximale Anzahl von Anrufen InvokeModel in einer Minute für Amazon Titan Text Embeddings V2
On-demand Modellieren Sie Inferenzanfragen pro Minute für Amazon Titan Text Express	Jede unterstützte Region: 400	Nein	Die maximale Häufigkeit, mit der Sie Model-Inferenz in einer Minute aufrufen können. Das Kontingent berücksichtigt die kombinierte Summe von Converse ConverseStream, InvokeModel und InvokeModelWithResponseStream für Amazon Titan Text Express
On-demand Modellieren Sie Inferenzanfragen pro Minute für Amazon Titan Text Premier	Jede unterstützte Region: 100	Nein	Die maximale Häufigkeit, mit der Sie Model-Inferenz in einer Minute aufrufen können. Das Kontingent berücksichtigt die kombinierte Summe von Converse ConverseStream, InvokeModel und InvokeModelWithResponseStream für Amazon Titan Text Premier
On-demand Modellieren Sie Inferenzanfragen pro Minute für Anthropic Claude 3 Haiku	us-east-1: 1,000 us-west-2: 1,000 ap-northeast-1:200 ap-southeast-1:200 Jede der anderen unterstützten Regionen: 400	Nein	Die maximale Anzahl von Aufrufen von Model-Inferenz in einer Minute. Die Quote berücksichtigt die Summe aus Converse, ConverseStream, InvokeModel und InvokeModelWithResponseStream für Anthropic Claude 3 Haiku.
On-demand Modellieren Sie Inferenzanfragen pro Minute für Anthropic Claude 3 Opus	Jede unterstützte Region: 50	Nein	Die maximale Anzahl von On-Demand-Anfragen, die Sie für Anthropic Claude 3 Opus innerhalb einer Minute zur Modellinferenz einreichen können. Dieses Kontingent entspricht der Gesamtzahl der Anfragen an die Converse,, ConverseStream und der Aktionen. InvokeModel InvokeModelWithResponseStream
On-demand Modellieren Sie Inferenzanfragen pro Minute für Anthropic Claude 3 Sonnet	us-east-1: 500 us-west-2: 500 Jede der anderen unterstützten Regionen: 100	Nein	Die maximale Häufigkeit, mit der Sie Modellinferenz in einer Minute aufrufen können. Die Quote berücksichtigt die Summe aus Converse, ConverseStream, InvokeModel und InvokeModelWithResponseStream für Anthropic Claude 3 Sonnet.
On-demand Modellieren Sie Inferenzanfragen pro Minute für Anthropic Claude 3.5 Haiku	us-west-1:400 Jede der anderen unterstützten Regionen: 1 000	Nein	Die maximale Anzahl von On-Demand-Anfragen, die Sie für Anthropic Claude 3.5 Haiku innerhalb einer Minute zur Modellinferenz einreichen können. Dieses Kontingent entspricht der Gesamtzahl der Anfragen an die Converse,, und der Aktionen. ConverseStream InvokeModel InvokeModelWithResponseStream
On-demand Modellieren Sie Inferenzanfragen pro Minute für Anthropic Claude 3.5 Sonnet	US-West-2:250 ap-northeast-1:20 ap-southeast-1:20 eu-central-1:20 eu-west-1: 20 eu-west-3:20 Jede der anderen unterstützten Regionen: 50	Nein	Die maximale Häufigkeit, mit der Sie in einer Minute Modellinferenz für Anthropic Claude 3.5 Sonnet aufrufen können. Das Kontingent berücksichtigt die Summe aus Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream
On-demand Modellieren Sie Inferenzanfragen pro Minute für Anthropic Claude 3.5 Sonnet V2	US-West-2:250 Jede der anderen unterstützten Regionen: 50	Nein	Die maximale Häufigkeit, mit der Sie in einer Minute Modellinferenz für Anthropic Claude 3.5 Sonnet V2 aufrufen können. Das Kontingent berücksichtigt die Summe aus Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream
On-demand Modellieren Sie Inferenzanfragen pro Minute für Anthropic Claude 3.7 Sonnet V1	Jede unterstützte Region: 125	Nein	Die maximale Anzahl von On-Demand-Anfragen, die Sie für Anthropic Claude 3.7 Sonnet V1 innerhalb einer Minute zur Modellinferenz einreichen können. Dieses Kontingent entspricht der Gesamtzahl der Anfragen an die Converse, ConverseStream und der Aktionen. InvokeModel InvokeModelWithResponseStream
On-demand modellieren Sie Inferenzanfragen pro Minute für Anthropic Claude Opus 4.6 V1	Jede unterstützte Region: 5 000	Nein	Die maximale Anzahl von On-Demand-Anfragen, die Sie für Anthropic Claude Opus 4.6 V1 innerhalb einer Minute zur Modellinferenz einreichen können. Dieses Kontingent entspricht der Gesamtzahl der Anfragen an die Converse,, ConverseStream und der Aktionen. InvokeModel InvokeModelWithResponseStream
On-demand Modellieren Sie Inferenzanfragen pro Minute für Anthropic Claude Sonnet 4.6	Jede unterstützte Region: 5 000	Nein	Die maximale Anzahl von On-Demand-Anfragen, die Sie für Anthropic Claude Sonnet 4.6 innerhalb einer Minute zur Modellinferenz einreichen können. Dieses Kontingent entspricht der Gesamtzahl der Anfragen und Aktionen an die Converse. ConverseStream InvokeModel InvokeModelWithResponseStream
On-demand Modellieren Sie Inferenzanfragen pro Minute für Cohere Command R	Jede unterstützte Region: 400	Nein	Die maximale Häufigkeit, mit der Sie Modellinferenz in einer Minute aufrufen können. Die Quote berücksichtigt die kombinierte Summe von Converse ConverseStream, InvokeModel und InvokeModelWithResponseStream für Cohere Command R 128k.
On-demand Modellieren Sie Inferenzanfragen pro Minute für Cohere Command R Plus	Jede unterstützte Region: 400	Nein	Die maximale Häufigkeit, mit der Sie Model-Inferenz in einer Minute aufrufen können. Das Kontingent berücksichtigt die kombinierte Summe von Converse InvokeModel und InvokeModelWithResponseStream für Cohere Command R Plus 128k. ConverseStream
On-demand Modellieren Sie Inferenzanfragen pro Minute für Cohere Embed English	Jede unterstützte Region: 2.000	Nein	Die maximale Anzahl von Anrufen InvokeModel in einer Minute für Cohere Embed English.
On-demand Modellieren Sie Inferenzanfragen pro Minute für Cohere Embed Multilingual	Jede unterstützte Region: 2.000	Nein	Die maximale Anzahl von Anrufen InvokeModel in einer Minute für Cohere Embed Multilingual.
On-demand Modellieren Sie Inferenzanfragen pro Minute für Cohere Embed V4	Jede unterstützte Region: 1 000	Nein	Die maximale Anzahl von On-Demand-Anfragen, die Sie für Cohere Embed V4 innerhalb einer Minute zur Modellinferenz einreichen können. Dieses Kontingent entspricht der Gesamtzahl der Anfragen und Aktionen an die Converse. ConverseStream InvokeModel InvokeModelWithResponseStream
On-demand modellieren Sie Inferenzanfragen pro Minute für Cohere Rerank 3.5	Jede unterstützte Region: 250	Nein	Die maximale Anzahl von Anrufen InvokeModel in einer Minute für Cohere Rerank 3.5.
On-demand Modellieren Sie Inferenzanfragen pro Minute für V3 V1 DeepSeek	Jede unterstützte Region: 10 000	Nein	Die maximale Anzahl von On-Demand-Anfragen, die Sie für DeepSeek V3 V1 innerhalb einer Minute zur Modellinferenz einreichen können. Dieses Kontingent stellt die Gesamtzahl der Anfragen InvokeModel und InvokeModelWithResponseStream Aktionen an die Converse dar. ConverseStream
On-demand modellieren Sie Inferenzanfragen pro Minute für DeepSeek V3.2	Jede unterstützte Region: 10 000	Nein	Die maximale Anzahl von On-Demand-Anfragen, für die Sie innerhalb einer Minute zur Modellinferenz einreichen können. DeepSeek V3.2 Dieses Kontingent entspricht der Gesamtzahl der Anfragen an Converse, ConverseStream, InvokeModel und InvokeModelWithResponseStream Aktionen.
On-demand Modellieren Sie Inferenzanfragen pro Minute für GPT OSS Safeguard 120B	Jede unterstützte Region: 10 000	Nein	Die maximale Anzahl von On-Demand-Anfragen, die Sie innerhalb einer Minute zur Modellinferenz für GPT OSS Safeguard 120B einreichen können. Dieses Kontingent stellt die Gesamtzahl der Anfragen und Aktionen an die Converse dar. ConverseStream InvokeModel InvokeModelWithResponseStream
On-demand Modellieren Sie Inferenzanfragen pro Minute für GPT OSS Safeguard 20B	Jede unterstützte Region: 10 000	Nein	Die maximale Anzahl von On-Demand-Anfragen, die Sie innerhalb einer Minute zur Modellinferenz für GPT OSS Safeguard 20B einreichen können. Dieses Kontingent entspricht der Gesamtzahl der Anfragen an die Converse,, ConverseStream und der Aktionen. InvokeModel InvokeModelWithResponseStream
On-demand Modellieren Sie Inferenzanfragen pro Minute für Gemma 3 12B	Jede unterstützte Region: 10 000	Nein	Die maximale Anzahl von On-Demand-Anfragen, die Sie innerhalb einer Minute zur Modellinferenz für Gemma 3 12B einreichen können. Dieses Kontingent stellt die Gesamtzahl der Anfragen und Aktionen an die Converse dar. ConverseStream InvokeModel InvokeModelWithResponseStream
On-demand Modellieren Sie Inferenzanfragen pro Minute für Gemma 3 27B	Jede unterstützte Region: 10 000	Nein	Die maximale Anzahl von On-Demand-Anfragen, die Sie innerhalb einer Minute zur Modellinferenz für Gemma 3 27B einreichen können. Dieses Kontingent entspricht der Gesamtzahl der Anfragen und Aktionen an die Converse. ConverseStream InvokeModel InvokeModelWithResponseStream
On-demand Modellieren Sie Inferenzanfragen pro Minute für Gemma 3, 4B	Jede unterstützte Region: 10 000	Nein	Die maximale Anzahl von On-Demand-Anfragen, die Sie innerhalb einer Minute zur Modellinferenz für Gemma 3 4B einreichen können. Dieses Kontingent entspricht der Gesamtzahl der Anfragen und Aktionen an die Converse. ConverseStream InvokeModel InvokeModelWithResponseStream
On-demand Modellieren Sie Inferenzanfragen pro Minute für Kimi K2 Thinking	Jede unterstützte Region: 10 000	Nein	Die maximale Anzahl von On-Demand-Anfragen, die Sie in einer Minute für Kimi K2 Thinking zur Modellinferenz einreichen können. Dieses Kontingent entspricht der Gesamtzahl der Anfragen und Aktionen an Converse. ConverseStream InvokeModel InvokeModelWithResponseStream
On-demand Modellieren Sie Inferenzanfragen pro Minute für Magistral Small 1.2	Jede unterstützte Region: 10 000	Nein	Die maximale Anzahl von On-Demand-Anfragen, die Sie für Magistral Small 1.2 innerhalb einer Minute zur Modellinferenz einreichen können. Dieses Kontingent entspricht der Gesamtzahl der Anfragen und Aktionen an die Converse. ConverseStream InvokeModel InvokeModelWithResponseStream
On-demand Modellieren Sie Inferenzanfragen pro Minute für Meta Llama 3 70B Instruct	Jede unterstützte Region: 400	Nein	Die maximale Anzahl von On-Demand-Anfragen, die Sie innerhalb einer Minute zur Modellinferenz für Meta Llama 3 70B Instruct einreichen können. Dieses Kontingent entspricht der Gesamtzahl der Anfragen an die Converse,, und der Aktionen. ConverseStream InvokeModel InvokeModelWithResponseStream
On-demand Modellieren Sie Inferenzanfragen pro Minute für Meta Llama 3 8B Instruct	Jede unterstützte Region: 800	Nein	Die maximale Anzahl von On-Demand-Anfragen, die Sie innerhalb einer Minute zur Modellinferenz für Meta Llama 3 8B Instruct einreichen können. Dieses Kontingent entspricht der Gesamtzahl der Anfragen an die Converse,, und der Aktionen. ConverseStream InvokeModel InvokeModelWithResponseStream
On-demand Modellieren Sie Inferenzanfragen pro Minute für Meta Llama 3.1 405B Instruct	Jede unterstützte Region: 200	Nein	Die maximale Anzahl von On-Demand-Anfragen, die Sie innerhalb einer Minute zur Modellinferenz für Meta Llama 3.1 405B Instruct einreichen können. Dieses Kontingent entspricht der Gesamtzahl der Anfragen an die Converse,, und der Aktionen. ConverseStream InvokeModel InvokeModelWithResponseStream
On-demand Modellieren Sie Inferenzanfragen pro Minute für Meta Llama 3.1 70B Instruct	Jede unterstützte Region: 400	Nein	Die maximale Anzahl von On-Demand-Anfragen, die Sie innerhalb einer Minute zur Modellinferenz für Meta Llama 3.1 70B Instruct einreichen können. Dieses Kontingent entspricht der Gesamtzahl der Anfragen an die Converse,, und der Aktionen. ConverseStream InvokeModel InvokeModelWithResponseStream
On-demand Modellieren Sie Inferenzanfragen pro Minute für Meta Llama 3.1 8B Instruct	Jede unterstützte Region: 800	Nein	Die maximale Anzahl von On-Demand-Anfragen, die Sie innerhalb einer Minute zur Modellinferenz für Meta Llama 3.1 8B Instruct einreichen können. Dieses Kontingent entspricht der Gesamtzahl der Anfragen an die Converse,, und der Aktionen. ConverseStream InvokeModel InvokeModelWithResponseStream
On-demand Modellieren Sie Inferenzanfragen pro Minute für Meta Llama 3.2 11B Instruct	Jede unterstützte Region: 400	Nein	Die maximale Häufigkeit, mit der Sie Modellinferenz in einer Minute für Meta Llama 3.2 11B Instruct aufrufen können. Das Kontingent berücksichtigt die kombinierte Summe der Anfragen für InvokeModel, InvokeModelWithResponseStream, Converse und. ConverseStream
On-demand modellieren Sie Inferenzanfragen pro Minute für Meta Llama 3.2 1B Instruct	Jede unterstützte Region: 800	Nein	Die maximale Anzahl von On-Demand-Anfragen, die Sie innerhalb einer Minute zur Modellinferenz für Meta Llama 3.2 1B Instruct einreichen können. Dieses Kontingent entspricht der Gesamtzahl der Anfragen an die Converse, ConverseStream und der Aktionen. InvokeModel InvokeModelWithResponseStream
On-demand Modellieren Sie Inferenzanfragen pro Minute für Meta Llama 3.2 3B Instruct	Jede unterstützte Region: 800	Nein	Die maximale Häufigkeit, mit der Sie Modellinferenz in einer Minute für Meta Llama 3.2 3B Instruct aufrufen können. Das Kontingent berücksichtigt die kombinierte Summe der Anfragen für InvokeModel, InvokeModelWithResponseStream, Converse und. ConverseStream
On-demand modellieren Sie Inferenzanfragen pro Minute für Meta Llama 3.2 90B Instruct	Jede unterstützte Region: 400	Nein	Die maximale Häufigkeit, mit der Sie Modellinferenz in einer Minute für Meta Llama 3.2 90B Instruct aufrufen können. Das Kontingent berücksichtigt die kombinierte Summe der Anfragen für InvokeModel, InvokeModelWithResponseStream, Converse und. ConverseStream
On-demand modellieren Sie Inferenzanfragen pro Minute für Meta Llama 3.3 70B Instruct	Jede unterstützte Region: 400	Nein	Die maximale Anzahl von On-Demand-Anfragen, die Sie innerhalb einer Minute zur Modellinferenz für Meta Llama 3.3 70B Instruct einreichen können. Dieses Kontingent entspricht der Gesamtzahl der Anfragen an die Converse, und der Aktionen. ConverseStream InvokeModel InvokeModelWithResponseStream
On-demand modellieren Sie Inferenzanfragen pro Minute für MiniMax M2.5	Jede unterstützte Region: 10 000	Nein	Die maximale Anzahl von On-Demand-Anfragen, für die Sie innerhalb einer Minute zur Modellinferenz einreichen können. MiniMax M2.5 Dieses Kontingent entspricht der Gesamtzahl der Anfragen an Converse, ConverseStream, InvokeModel und InvokeModelWithResponseStream Aktionen.
On-demand modellieren Sie Inferenzanfragen pro Minute für Minimax M2	Jede unterstützte Region: 10 000	Nein	Die maximale Anzahl von On-Demand-Anfragen, die Sie innerhalb einer Minute zur Modellinferenz für Minimax M2 einreichen können. Dieses Kontingent entspricht der Gesamtzahl der Anfragen an Converse, ConverseStream, InvokeModel und Aktionen. InvokeModelWithResponseStream
On-demand Modellieren Sie Inferenzanfragen pro Minute für Minimax M2.1	Jede unterstützte Region: 10 000	Nein	Die maximale Anzahl von On-Demand-Anfragen, die Sie für Minimax innerhalb einer Minute zur Modellinferenz einreichen können. M2.1 Dieses Kontingent entspricht der Gesamtzahl der Anfragen an die Converse, ConverseStream, InvokeModel und der Aktionen. InvokeModelWithResponseStream
On-demand Modellieren Sie Inferenzanfragen pro Minute für Ministral 14B 3.0	Jede unterstützte Region: 10 000	Nein	Die maximale Anzahl von On-Demand-Anfragen, die Sie für Ministry 14B 3.0 innerhalb einer Minute zur Modellinferenz einreichen können. Dieses Kontingent entspricht der Gesamtzahl der Anfragen und Aktionen an die Converse. ConverseStream InvokeModel InvokeModelWithResponseStream
On-demand Modellieren Sie Inferenzanfragen pro Minute für Ministral 3B 3.0	Jede unterstützte Region: 10 000	Nein	Die maximale Anzahl von On-Demand-Anfragen, die Sie für Ministry 3B 3.0 innerhalb einer Minute zur Modellinferenz einreichen können. Dieses Kontingent entspricht der Gesamtzahl der Anfragen und Aktionen an Converse. ConverseStream InvokeModel InvokeModelWithResponseStream
On-demand Modellieren Sie Inferenzanfragen pro Minute für Ministral 8B 3.0	Jede unterstützte Region: 10 000	Nein	Die maximale Anzahl von On-Demand-Anfragen, die Sie für Ministry 8B 3.0 innerhalb einer Minute zur Modellinferenz einreichen können. Dieses Kontingent entspricht der Gesamtzahl der Anfragen und Aktionen an Converse. ConverseStream InvokeModel InvokeModelWithResponseStream
On-demand Modellieren Sie Inferenzanfragen pro Minute für Mistral 7B Instruct	Jede unterstützte Region: 800	Nein	Die maximale Anzahl von Aufrufen in einer Minute für Mistral InvokeModel Mistral-7b-instruct-v0
On-demand Modellieren Sie Inferenzanfragen pro Minute für Mistral AI Mistral Small	Jede unterstützte Region: 400	Nein	Die maximale Anzahl von Anrufen InvokeModelWithResponseStream in einer Minute für Mistral InvokeModel AI Mistral Small
On-demand Modellieren Sie Inferenzanfragen pro Minute für Mistral Devstral 2 123b	Jede unterstützte Region: 10 000	Nein	Die maximale Anzahl von On-Demand-Anfragen, die Sie innerhalb einer Minute zur Modellinferenz für Mistral Devstral 2 123b einreichen können. Dieses Kontingent entspricht der Gesamtzahl der Anfragen an die Converse,, und der Aktionen. ConverseStream InvokeModel InvokeModelWithResponseStream
On-demand Modellieren Sie Inferenzanfragen pro Minute für Mistral Large	Jede unterstützte Region: 400	Nein	Die maximale Anzahl von Anrufen InvokeModelWithResponseStream in einer Minute für Mistral InvokeModel Mistral-Large-2402-v1
On-demand Modellieren Sie Inferenzanfragen pro Minute für Mistral Large 2407	Jede unterstützte Region: 400	Nein	Die maximale Häufigkeit, mit der Sie Modellinferenz in einer Minute für Mistral Large 2407 aufrufen können. Das Kontingent berücksichtigt die kombinierte Summe der Anfragen für InvokeModel,, Converse und InvokeModelWithResponseStream ConverseStream
On-demand modellieren Sie Inferenzanfragen pro Minute für Mistral Large 3	Jede unterstützte Region: 10 000	Nein	Die maximale Anzahl von On-Demand-Anfragen, die Sie für Mistral Large 3 innerhalb einer Minute zur Modellinferenz einreichen können. Dieses Kontingent entspricht der Gesamtzahl der Anfragen und Aktionen an Converse. ConverseStream InvokeModel InvokeModelWithResponseStream
On-demand Modellieren Sie Inferenzanfragen pro Minute für Mistral Mixtral 8x7b Instruct	Jede unterstützte Region: 400	Nein	Die maximale Anzahl von Aufrufen in einer Minute für Mistral Mixtral-8x7b-v0 InvokeModel
On-demand Modellieren Sie Inferenzanfragen pro Minute für Moonshot AI Kimi K2.5	Jede unterstützte Region: 10 000	Nein	Die maximale Anzahl von On-Demand-Anfragen, die Sie innerhalb einer Minute zur Modellinferenz für Moonshot AI Kimi einreichen können. K2.5 Dieses Kontingent entspricht der Gesamtzahl der Anfragen an die Converse,, ConverseStream und der Aktionen. InvokeModel InvokeModelWithResponseStream
On-demand modellieren Sie Inferenzanfragen pro Minute für NVIDIA Nemotron 3 Super 120B A12B	Jede unterstützte Region: 10 000	Nein	Die maximale Anzahl von On-Demand-Anfragen, die Sie für NVIDIA Nemotron 3 Super 120B A12B innerhalb einer Minute zur Modellinferenz einreichen können. Dieses Kontingent entspricht der Gesamtzahl der Anfragen an die Converse,, und der Aktionen. ConverseStream InvokeModel InvokeModelWithResponseStream
On-demand modellieren Sie Inferenzanfragen pro Minute für NVIDIA Nemotron Nano 2	Jede unterstützte Region: 10 000	Nein	Die maximale Anzahl von On-Demand-Anfragen, die Sie für NVIDIA Nemotron Nano 2 innerhalb einer Minute zur Modellinferenz einreichen können. Dieses Kontingent entspricht der Gesamtzahl der Anfragen und Aktionen an die Converse. ConverseStream InvokeModel InvokeModelWithResponseStream
On-demand modellieren Sie Inferenzanfragen pro Minute für NVIDIA Nemotron Nano 2 VL	Jede unterstützte Region: 10 000	Nein	Die maximale Anzahl von On-Demand-Anfragen, die Sie für NVIDIA Nemotron Nano 2 VL innerhalb einer Minute zur Modellinferenz einreichen können. Dieses Kontingent entspricht der Gesamtzahl der Anfragen an die Converse,, ConverseStream und der Aktionen. InvokeModel InvokeModelWithResponseStream
On-demand modellieren Sie Inferenzanfragen pro Minute für Nemotron Nano 3 30B	Jede unterstützte Region: 10 000	Nein	Die maximale Anzahl von On-Demand-Anfragen, die Sie innerhalb einer Minute zur Modellinferenz für Nemotron Nano 3 30B einreichen können. Dieses Kontingent entspricht der Gesamtzahl der Anfragen an die Converse,, und der Aktionen. ConverseStream InvokeModel InvokeModelWithResponseStream
On-demand Modellieren Sie Inferenzanfragen pro Minute für OpenAI GPT OSS 120B	Jede unterstützte Region: 10 000	Nein	Die maximale Anzahl von On-Demand-Anfragen, die Sie in einer Minute zur Modellinferenz für OpenAI GPT OSS 120B einreichen können. Dieses Kontingent entspricht der Gesamtzahl der Anfragen an die Converse, und der Aktionen. ConverseStream InvokeModel InvokeModelWithResponseStream
On-demand Modellieren Sie Inferenzanfragen pro Minute für OpenAI GPT OSS 20B	Jede unterstützte Region: 10 000	Nein	Die maximale Anzahl von On-Demand-Anfragen, die Sie in einer Minute zur Modellinferenz für OpenAI GPT OSS 20B einreichen können. Dieses Kontingent entspricht der Gesamtzahl der Anfragen an die Converse,, und der Aktionen. ConverseStream InvokeModel InvokeModelWithResponseStream
On-demand Modellieren Sie Inferenzanfragen pro Minute für Qwen3 235B a22b 2507 V1	Jede unterstützte Region: 10 000	Nein	Die maximale Anzahl von On-Demand-Anfragen, die Sie innerhalb einer Minute zur Modellinferenz für Qwen3 235B a22b 2507 V1 einreichen können. Dieses Kontingent entspricht der Gesamtzahl der Anfragen an die Converse,, und der Aktionen. ConverseStream InvokeModel InvokeModelWithResponseStream
On-demand Modellieren Sie Inferenzanfragen pro Minute für Qwen3 32B V1	Jede unterstützte Region: 10 000	Nein	Die maximale Anzahl von On-Demand-Anfragen, die Sie für Qwen3 32B V1 innerhalb einer Minute zur Modellinferenz einreichen können. Dieses Kontingent entspricht der Gesamtzahl der Anfragen und Aktionen an die Converse. ConverseStream InvokeModel InvokeModelWithResponseStream
On-demand Modellieren Sie Inferenzanfragen pro Minute für Qwen3 Coder 30B a3b V1	Jede unterstützte Region: 10 000	Nein	Die maximale Anzahl von On-Demand-Anfragen, die Sie innerhalb einer Minute zur Modellinferenz für Qwen3 Coder 30B a3b V1 einreichen können. Dieses Kontingent entspricht der Gesamtzahl der Anfragen an Converse,, und Aktionen. ConverseStream InvokeModel InvokeModelWithResponseStream
On-demand Modellieren Sie Inferenzanfragen pro Minute für Qwen3 Coder 480B a35b V1	Jede unterstützte Region: 10 000	Nein	Die maximale Anzahl von On-Demand-Anfragen, die Sie innerhalb einer Minute zur Modellinferenz für Qwen3 Coder 480B a35b V1 einreichen können. Dieses Kontingent entspricht der Gesamtzahl der Anfragen an die Converse,, und der Aktionen. ConverseStream InvokeModel InvokeModelWithResponseStream
On-demand Modellieren Sie Inferenzanfragen pro Minute für Qwen3 Coder Next	Jede unterstützte Region: 10 000	Nein	Die maximale Anzahl von On-Demand-Anfragen, die Sie in einer Minute zur Modellinferenz für Qwen3 Coder Next einreichen können. Dieses Kontingent entspricht der Gesamtzahl der Anfragen und Aktionen an Converse. ConverseStream InvokeModel InvokeModelWithResponseStream
On-demand modellieren Sie Inferenzanfragen pro Minute für Qwen3 Next 80B A3B	Jede unterstützte Region: 10 000	Nein	Die maximale Anzahl von On-Demand-Anfragen, die Sie innerhalb einer Minute zur Modellinferenz für Qwen3 Next 80B A3B einreichen können. Dieses Kontingent entspricht der Gesamtzahl der Anfragen an die Converse,, und der Aktionen. ConverseStream InvokeModel InvokeModelWithResponseStream
On-demand modellieren Sie Inferenzanfragen pro Minute für Qwen3 VL 235B A22B	Jede unterstützte Region: 10 000	Nein	Die maximale Anzahl von On-Demand-Anfragen, die Sie für Qwen3 VL 235B A22B innerhalb einer Minute zur Modellinferenz einreichen können. Dieses Kontingent entspricht der Gesamtzahl der Anfragen an die Converse,, und der Aktionen. ConverseStream InvokeModel InvokeModelWithResponseStream
On-demand Modellieren Sie Inferenzanfragen pro Minute für Stability.ai Stable Diffusion 3 Large	Jede unterstützte Region: 15	Nein	Die maximale Anzahl von Aufrufen InvokeModel in einer Minute für Stability.ai Stable Diffusion 3 Large.
On-demand Modellieren Sie Inferenzanfragen pro Minute für Stability.ai Stable Diffusion 3 Medium	Jede unterstützte Region: 60	Nein	Die maximale Anzahl von Aufrufen InvokeModel in einer Minute für Stability.ai Stable Diffusion 3 Medium
On-demand Modellieren Sie Inferenzanfragen pro Minute für Stability.ai Stable Diffusion 3.5 Large	Jede unterstützte Region: 15	Nein	Die maximale Anzahl von Aufrufen InvokeModel in einer Minute für Stability.ai Stable Diffusion 3.5 Large.
On-demand Modellieren Sie Inferenzanfragen pro Minute für Stability.ai Stable Image Core	Jede unterstützte Region: 90	Nein	Die maximale Anzahl von Aufrufen InvokeModel in einer Minute für Stability.ai Stable Image Core.
On-demand Modellieren Sie Inferenzanfragen pro Minute für Stability.ai Stable Image Ultra	Jede unterstützte Region: 10	Nein	Die maximale Anzahl von Aufrufen InvokeModel in einer Minute für Stability.ai Stable Image Ultra.
On-demand Modellieren Sie Inferenzanfragen pro Minute für Stable Image Conservative Upscale	Jede unterstützte Region: 2	Nein	Die maximale Anzahl von On-Demand-Anfragen, die Sie innerhalb einer Minute zur Modellinferenz für Stable Image Conservative Upscale einreichen können. Dieses Kontingent entspricht der Gesamtzahl der Anfragen und Aktionen an Converse. ConverseStream InvokeModel InvokeModelWithResponseStream
On-demand Modellieren Sie Inferenzanfragen pro Minute für Stable Image Control Sketch	Jede unterstützte Region: 10	Nein	Die maximale Anzahl von On-Demand-Anfragen, die Sie innerhalb einer Minute zur Modellinferenz für Stable Image Control Sketch einreichen können. Dieses Kontingent entspricht der Gesamtzahl der Anfragen an die Converse, ConverseStream, InvokeModel und InvokeModelWithResponseStream der Aktionen.
On-demand Modellieren Sie Inferenzanfragen pro Minute für eine stabile Bildkontrollstruktur	Jede unterstützte Region: 10	Nein	Die maximale Anzahl von On-Demand-Anfragen, die Sie für Stable Image Control Structure innerhalb einer Minute zur Modellinferenz einreichen können. Dieses Kontingent stellt die Gesamtzahl der Anfragen InvokeModel und InvokeModelWithResponseStream Aktionen an die Converse dar. ConverseStream
On-demand Modellieren Sie Inferenzanfragen pro Minute für Stable Image Creative Upscale	Jede unterstützte Region: 2	Nein	Die maximale Anzahl von On-Demand-Anfragen, die Sie innerhalb einer Minute zur Modellinferenz für Stable Image Creative Upscale einreichen können. Dieses Kontingent entspricht der Gesamtzahl der Anfragen an die Converse, ConverseStream, InvokeModel und der Aktionen. InvokeModelWithResponseStream
On-demand Modellieren Sie Inferenzanfragen pro Minute für das Objekt Stable Image Erase	Jede unterstützte Region: 10	Nein	Die maximale Anzahl von On-Demand-Anfragen, die Sie innerhalb einer Minute zur Modellinferenz für Stable Image Erase Object einreichen können. Dieses Kontingent entspricht der Gesamtzahl der Anfragen an Converse, ConverseStream, InvokeModel und InvokeModelWithResponseStream Aktionen.
On-demand Modellieren Sie Inferenzanfragen pro Minute für Stable Image Fast Upscale	Jede unterstützte Region: 10	Nein	Die maximale Anzahl von On-Demand-Anfragen, die Sie für Stable Image Fast Upscale innerhalb einer Minute zur Modellinferenz einreichen können. Dieses Kontingent stellt die Gesamtzahl der Anfragen und Aktionen an die Converse dar. ConverseStream InvokeModel InvokeModelWithResponseStream
On-demand Modellieren Sie Inferenzanfragen pro Minute für Stable Image Inpaint	Jede unterstützte Region: 10	Nein	Die maximale Anzahl von On-Demand-Anfragen, die Sie innerhalb einer Minute zur Modellinferenz für Stable Image Inpaint einreichen können. Dieses Kontingent stellt die Gesamtzahl der Anfragen und Aktionen an die Converse dar. ConverseStream InvokeModel InvokeModelWithResponseStream
On-demand Modellieren Sie Inferenzanfragen pro Minute für Stable Image Outpaint	Jede unterstützte Region: 2	Nein	Die maximale Anzahl von On-Demand-Anfragen, die Sie innerhalb einer Minute zur Modellinferenz für Stable Image Outpaint einreichen können. Dieses Kontingent stellt die Gesamtzahl der Anfragen und Aktionen an die Converse dar. ConverseStream InvokeModel InvokeModelWithResponseStream
On-demand Modellieren Sie Inferenzanfragen pro Minute für Stable Image Remove Background	Jede unterstützte Region: 10	Nein	Die maximale Anzahl von On-Demand-Anfragen, die Sie innerhalb einer Minute zur Modellinferenz für die Option Stable Image Remove Background einreichen können. Dieses Kontingent stellt die Gesamtzahl der Anfragen InvokeModel und InvokeModelWithResponseStream Aktionen an die Converse dar. ConverseStream
On-demand Modellieren Sie Inferenzanfragen pro Minute für Stable Image Search und Recolor	Jede unterstützte Region: 10	Nein	Die maximale Anzahl von On-Demand-Anfragen, die Sie für Stable Image Search und Recolor innerhalb einer Minute zur Modellinferenz einreichen können. Dieses Kontingent entspricht der Gesamtzahl der Anfragen an die Converse, ConverseStream, InvokeModel und der Aktionen. InvokeModelWithResponseStream
On-demand Modellieren Sie Inferenzanfragen pro Minute für Stable Image Search and Replace	Jede unterstützte Region: 10	Nein	Die maximale Anzahl von On-Demand-Anfragen, die Sie für Stable Image Search and Replace innerhalb einer Minute zur Modellinferenz einreichen können. Dieses Kontingent stellt die Gesamtzahl der Anfragen InvokeModel und InvokeModelWithResponseStream Aktionen an Converse dar. ConverseStream
On-demand Modellieren Sie Inferenzanfragen pro Minute für den Stable Image Style Guide	Jede unterstützte Region: 10	Nein	Die maximale Anzahl von On-Demand-Anfragen, die Sie innerhalb einer Minute zur Modellinferenz für den Stable Image Style Guide einreichen können. Dieses Kontingent entspricht der Gesamtzahl der Anfragen an Converse, ConverseStream, InvokeModel und InvokeModelWithResponseStream Aktionen.
On-demand Modellieren Sie Inferenzanfragen pro Minute für Stable Image Style Transfer	Jede unterstützte Region: 10	Nein	Die maximale Anzahl von On-Demand-Anfragen, die Sie innerhalb einer Minute zur Modellinferenz für Stable Image Style Transfer einreichen können. Dieses Kontingent stellt die Gesamtzahl der Anfragen InvokeModel und InvokeModelWithResponseStream Aktionen an die Converse dar. ConverseStream
On-demand modellieren Sie Inferenzanfragen pro Minute für Twelve Labs Marengo	Jede unterstützte Region: 100	Nein	Die maximale Anzahl von On-Demand-Anfragen, die Sie für Twelve Labs Marengo innerhalb einer Minute zur Modellinferenz einreichen können. Dieses Kontingent entspricht der Gesamtzahl der Anfragen an die Converse,, ConverseStream und der Aktionen. InvokeModel InvokeModelWithResponseStream
On-demand modellieren Sie Inferenzanfragen pro Minute für Twelve Labs Pegasus	Jede unterstützte Region: 60	Ja	Die maximale Anzahl von On-Demand-Anfragen, die Sie für Twelve Labs Pegasus innerhalb einer Minute zur Modellinferenz einreichen können. Das Kontingent berücksichtigt die Summe aus Converse, und ConverseStream. InvokeModel InvokeModelWithResponseStream
On-demand Modellieren Sie Inferenzanfragen pro Minute für TwelveLabs Marengo Embed 3.0	Jede unterstützte Region: 500	Ja	Die maximale Anzahl von On-Demand-Anfragen, die Sie für Marengo Embed 3.0 innerhalb einer Minute zur TwelveLabs Modellinferenz einreichen können. Dieses Kontingent entspricht der Gesamtzahl der Anfragen an die Converse, ConverseStream und der Aktionen. InvokeModel InvokeModelWithResponseStream
On-demand modellieren Sie Inferenzanfragen pro Minute für Voxtral Mini 1.0	Jede unterstützte Region: 10 000	Nein	Die maximale Anzahl von On-Demand-Anfragen, die Sie für Voxtral Mini 1.0 innerhalb einer Minute zur Modellinferenz einreichen können. Dieses Kontingent stellt die Gesamtzahl der Anfragen und Aktionen an die Converse dar. ConverseStream InvokeModel InvokeModelWithResponseStream
On-demand modellieren Sie Inferenzanfragen pro Minute für Voxtral Small 1.0	Jede unterstützte Region: 10 000	Nein	Die maximale Anzahl von On-Demand-Anfragen, die Sie für Voxtral Small 1.0 innerhalb einer Minute zur Modellinferenz einreichen können. Dieses Kontingent entspricht der Gesamtzahl der Anfragen an die Converse, ConverseStream und der Aktionen. InvokeModel InvokeModelWithResponseStream
On-demand Modellieren Sie Inferenzanfragen pro Minute für Writer Palmyra Vision 7B	Jede unterstützte Region: 10 000	Nein	Die maximale Anzahl von On-Demand-Anfragen, die Sie für Writer Palmyra Vision 7B innerhalb einer Minute zur Modellinferenz einreichen können. Dieses Kontingent entspricht der Gesamtzahl der Anfragen an die Converse,, und der Aktionen. ConverseStream InvokeModel InvokeModelWithResponseStream
On-demand Modellieren Sie Inferenzanfragen pro Minute für GLM 5 Z.ai	Jede unterstützte Region: 10 000	Nein	Die maximale Anzahl von On-Demand-Anfragen, die Sie für GLM 5 innerhalb einer Minute zur Z.ai Modellinferenz einreichen können. Dieses Kontingent entspricht der Gesamtzahl der Anfragen an Converse, ConverseStream, InvokeModel und Aktionen. InvokeModelWithResponseStream
On-demand modellieren Sie Inferenzanfragen pro Minute für Z.ai GLM-4.7	Jede unterstützte Region: 10 000	Nein	Die maximale Anzahl von On-Demand-Anfragen, für die Sie innerhalb einer Minute zur Modellinferenz einreichen können. Z.ai GLM-4.7 Dieses Kontingent entspricht der Gesamtzahl der Anfragen an Converse, ConverseStream, InvokeModel und InvokeModelWithResponseStream Aktionen.
On-demand Modellieren Sie Inferenzanfragen pro Minute für Flash Z.ai GLM-4.7	Jede unterstützte Region: 10 000	Nein	Die maximale Anzahl von On-Demand-Anfragen, die Sie für Flash innerhalb einer Minute zur Z.ai GLM-4.7 Modellinferenz einreichen können. Dieses Kontingent entspricht der Gesamtzahl der Anfragen an Converse, ConverseStream, InvokeModel und InvokeModelWithResponseStream Aktionen.
On-demand Modellieren Sie Inferenz-Token pro Minute für AI21 Labs Jamba 1.5 Large	Jede unterstützte Region: 300 000	Nein	Die maximale Anzahl von Token, die Sie in einer Minute für AI21 Labs Jamba 1.5 Large zur Modellinferenz einreichen können. Das Kontingent berücksichtigt die kombinierte Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse und. InvokeModel
On-demand modellieren Sie Inferenz-Token pro Minute für AI21 Labs Jamba 1.5 Mini	Jede unterstützte Region: 300 000	Nein	Die maximale Anzahl von Token, die Sie in einer Minute für AI21 Labs Jamba 1.5 Mini zur Modellinferenz einreichen können. Das Kontingent berücksichtigt die kombinierte Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse und. InvokeModel
On-demand Modellieren Sie Inferenz-Token pro Minute für Amazon Nova Lite	us-east-1:4.000.000 eu-west-2:4.000.000 Jede der anderen unterstützten Regionen: 200.000	Nein	Die maximale Anzahl von On-Demand-Token, die Sie innerhalb einer Minute für Amazon Nova Lite zur Modellinferenz einreichen können. Das Kontingent berücksichtigt die kombinierte Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse ConverseStream, InvokeModel und. InvokeModelWithResponseStream
On-demand Modellieren Sie Inferenz-Token pro Minute für Amazon Nova Micro	us-east-1:4.000.000 eu-west-2:4.000.000 Jede der anderen unterstützten Regionen: 200.000	Nein	Die maximale Anzahl von On-Demand-Token, die Sie innerhalb einer Minute für Amazon Nova Micro zur Modellinferenz einreichen können. Das Kontingent berücksichtigt die kombinierte Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse ConverseStream, InvokeModel und. InvokeModelWithResponseStream
On-demand Modellieren Sie Inferenz-Token pro Minute für Amazon Nova Pro	Jede unterstützte Region: 1 000 000	Nein	Die maximale Anzahl von On-Demand-Token, die Sie innerhalb einer Minute für Amazon Nova Pro zur Modellinferenz einreichen können. Das Kontingent berücksichtigt die kombinierte Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse ConverseStream, InvokeModel und. InvokeModelWithResponseStream
On-demand Modellieren Sie Inferenz-Token pro Minute für Amazon Titan Image Generator G1 V2	Jede unterstützte Region: 2.000	Nein	Die maximale Anzahl von On-Demand-Token, die Sie innerhalb einer Minute zur Modellinferenz für Amazon Titan Image Generator G1 V2 einreichen können. Das Kontingent berücksichtigt die kombinierte Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, ConverseStream und. InvokeModel InvokeModelWithResponseStream
On-demand Modellieren Sie Inferenz-Token pro Minute für Amazon Titan Multimodal Embeddings G1	Jede unterstützte Region: 300 000	Nein	Die maximale Anzahl von Token, die Sie InvokeModel in einer Minute für Amazon Titan Multimodal Embeddings G1 bereitstellen können.
On-demand Modellieren Sie Inferenz-Token pro Minute für Amazon Titan Text Embeddings	Jede unterstützte Region: 300 000	Nein	Die maximale Anzahl von Token, die Sie InvokeModel in einer Minute für Amazon Titan Text Embeddings bereitstellen können.
On-demand Modellieren Sie Inferenz-Token pro Minute für Amazon Titan Text Embeddings V2	Jede unterstützte Region: 300 000	Nein	Die maximale Anzahl von Token, die Sie InvokeModel in einer Minute für Amazon Titan Text Embeddings V2 bereitstellen können.
On-demand Modellieren Sie Inferenz-Token pro Minute für Amazon Titan Text Express	Jede unterstützte Region: 300 000	Nein	Die maximale Anzahl von On-Demand-Token, die Sie in einer Minute zur Modellinferenz einreichen können. Das Kontingent berücksichtigt die kombinierte Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse InvokeModel und InvokeModelWithResponseStream für Amazon Titan Text Express. ConverseStream
On-demand Modellieren Sie Inferenz-Token pro Minute für Amazon Titan Text Premier	Jede unterstützte Region: 300 000	Nein	Die maximale Anzahl von On-Demand-Token, die Sie in einer Minute zur Modellinferenz einreichen können. Das Kontingent berücksichtigt die kombinierte Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse InvokeModel und InvokeModelWithResponseStream für Amazon Titan Text Premier. ConverseStream
On-demand modellieren Sie Inferenz-Token pro Minute für Anthropic Claude 3 Haiku	us-east-1:2.000.000 us-west-2:2.000.000 ap-northeast-1:200.000 ap-southeast-1:200.000 Jede der anderen unterstützten Regionen: 300.000	Nein	Die maximale Anzahl von On-Demand-Token, die Sie innerhalb einer Minute zur Modellinferenz einreichen können. Die Quote berücksichtigt die Summe der Eingabe- und Ausgabetoken aller Anfragen an Converse InvokeModel und InvokeModelWithResponseStream für Anthropic Claude 3 Haiku. ConverseStream
On-demand modellieren Sie Inferenz-Token pro Minute für Anthropic Claude 3 Opus	Jede unterstützte Region: 400 000	Nein	Die maximale Anzahl von On-Demand-Token, die Sie innerhalb einer Minute zur Modellinferenz für Anthropic Claude 3 Opus einreichen können. Das Kontingent berücksichtigt die kombinierte Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream
On-demand modellieren Sie Inferenz-Token pro Minute für Anthropic Claude 3 Sonnet	us-east-1:1.000.000 us-west-2:1.000.000 Jede der anderen unterstützten Regionen: 200.000	Nein	Die maximale Anzahl von On-Demand-Token, die Sie innerhalb einer Minute zur Modellinferenz einreichen können. Das Kontingent berücksichtigt die Summe der Eingabe- und Ausgabetoken aller Anfragen an Converse InvokeModel und InvokeModelWithResponseStream für Anthropic Claude 3 Sonnet. ConverseStream
On-demand modellieren Sie Inferenz-Token pro Minute für Anthropic Claude 3.5 Haiku	us-west-1:300.000 Jede der anderen unterstützten Regionen: 2.000.000	Nein	Die maximale Anzahl von On-Demand-Token, die Sie innerhalb einer Minute zur Modellinferenz für Anthropic Claude 3.5 Haiku einreichen können. Das Kontingent berücksichtigt die kombinierte Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream
On-demand modellieren Sie Inferenz-Token pro Minute für Anthropic Claude 3.5 Sonnet	us-west-2:2.000.000 ap-northeast-1:200.000 ap-southeast-1:200.000 eu-central-1:200.000 eu-west-1:200.000 eu-west-3:200.000 Jede der anderen unterstützten Regionen: 400.000	Nein	Die maximale Anzahl von Tokens, die Sie in einer Minute für Anthropic Claude 3.5 Sonnet zur Modellinferenz einreichen können. Das Kontingent berücksichtigt die Summe aus Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream
On-demand Modellieren Sie Inferenz-Token pro Minute für Anthropic Claude 3.5 Sonnet V2	us-west-2:2.000.000 Jede der anderen unterstützten Regionen: 400.000	Nein	Die maximale Anzahl von Tokens, die Sie in einer Minute für Anthropic Claude 3.5 Sonnet V2 zur Modellinferenz einreichen können. Das Kontingent berücksichtigt die Summe aus Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream
On-demand Modellieren Sie Inferenz-Token pro Minute für Anthropic Claude 3.7 Sonnet V1	Jede unterstützte Region: 500 000	Nein	Die maximale Anzahl von On-Demand-Token, die Sie für Anthropic Claude 3.7 Sonnet V1 innerhalb einer Minute zur Modellinferenz einreichen können. Das Kontingent berücksichtigt die kombinierte Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream
On-demand modellieren Sie Inferenz-Token pro Minute für Anthropic Claude Opus 4.6 V1	Jede unterstützte Region: 1 500 000	Nein	Die maximale Anzahl von On-Demand-Token, die Sie für Anthropic Claude Opus 4.6 V1 innerhalb einer Minute zur Modellinferenz einreichen können. Das Kontingent berücksichtigt die kombinierte Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream
On-demand modellieren Sie Inferenz-Token pro Minute für Anthropic Claude Sonnet 4.6	Jede unterstützte Region: 3.000.000	Nein	Die maximale Anzahl von On-Demand-Token, die Sie für Anthropic Claude Sonnet 4.6 innerhalb einer Minute zur Modellinferenz einreichen können. Das Kontingent berücksichtigt die kombinierte Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream
On-demand Modellieren Sie Inferenz-Token pro Minute für Cohere Command R	Jede unterstützte Region: 300 000	Nein	Die maximale Anzahl von On-Demand-Token, die Sie in einer Minute zur Modellinferenz einreichen können. Das Kontingent berücksichtigt die kombinierte Summe der Eingabe- und Ausgabetokens für alle Anfragen an Converse InvokeModel und InvokeModelWithResponseStream für Cohere Command R 128k. ConverseStream
On-demand Modellieren Sie Inferenz-Token pro Minute für Cohere Command R Plus	Jede unterstützte Region: 300 000	Nein	Die maximale Anzahl von On-Demand-Token, die Sie in einer Minute zur Modellinferenz einreichen können. Das Kontingent berücksichtigt die kombinierte Summe der Eingabe- und Ausgabetokens für alle Anfragen an Converse InvokeModel und InvokeModelWithResponseStream für Cohere Command R Plus 128k. ConverseStream
On-demand Modellieren Sie Inferenz-Token pro Minute für Cohere Embed English	Jede unterstützte Region: 300 000	Nein	Die maximale Anzahl von Tokens, die Sie InvokeModel in einer Minute für Cohere Embed English bereitstellen können.
On-demand Modellieren Sie Inferenz-Token pro Minute für Cohere Embed Multilingual	Jede unterstützte Region: 300 000	Nein	Die maximale Anzahl von Tokens, die Sie InvokeModel in einer Minute für Cohere Embed Multilingual bereitstellen können.
On-demand Modellieren Sie Inferenz-Token pro Minute für Cohere Embed V4	Jede unterstützte Region: 150 000	Nein	Die maximale Anzahl von On-Demand-Token, die Sie in einer Minute zur Modellinferenz für Cohere Embed V4 einreichen können. Das Kontingent berücksichtigt die kombinierte Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, ConverseStream und. InvokeModel InvokeModelWithResponseStream
On-demand modellieren Sie Inferenz-Token pro Minute für DeepSeek V3 V1	Jede unterstützte Region: 100 000 000	Nein	Die maximale Anzahl von On-Demand-Token, die Sie innerhalb einer Minute zur Modellinferenz für DeepSeek V3 V1 einreichen können. Das Kontingent berücksichtigt die kombinierte Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse ConverseStream, InvokeModel und. InvokeModelWithResponseStream
On-demand modellieren Sie Inferenz-Token pro Minute für DeepSeek V3.2	Jede unterstützte Region: 100 000 000	Nein	Die maximale Anzahl von On-Demand-Token, für die Sie innerhalb einer Minute zur Modellinferenz einreichen können. DeepSeek V3.2 Das Kontingent berücksichtigt die kombinierte Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse ConverseStream, InvokeModel und. InvokeModelWithResponseStream
On-demand Modellieren Sie Inferenz-Token pro Minute für GPT OSS Safeguard 120B	Jede unterstützte Region: 100 000 000	Nein	Die maximale Anzahl von On-Demand-Token, die Sie innerhalb einer Minute zur Modellinferenz für GPT OSS Safeguard 120B einreichen können. Das Kontingent berücksichtigt die kombinierte Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream
On-demand Modellieren Sie Inferenz-Token pro Minute für GPT OSS Safeguard 20B	Jede unterstützte Region: 100 000 000	Nein	Die maximale Anzahl von On-Demand-Token, die Sie innerhalb einer Minute zur Modellinferenz für GPT OSS Safeguard 20B einreichen können. Das Kontingent berücksichtigt die kombinierte Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream
On-demand Modellieren Sie Inferenz-Token pro Minute für Gemma 3 12B	Jede unterstützte Region: 100 000 000	Nein	Die maximale Anzahl von On-Demand-Token, die Sie innerhalb einer Minute zur Modellinferenz für Gemma 3 12B einreichen können. Das Kontingent berücksichtigt die kombinierte Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream
On-demand Modellieren Sie Inferenz-Token pro Minute für Gemma 3 27B	Jede unterstützte Region: 100 000 000	Nein	Die maximale Anzahl von On-Demand-Token, die Sie innerhalb einer Minute zur Modellinferenz für Gemma 3 27B einreichen können. Das Kontingent berücksichtigt die kombinierte Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream
On-demand Modellieren Sie Inferenz-Token pro Minute für Gemma 3, 4B	Jede unterstützte Region: 100 000 000	Nein	Die maximale Anzahl von On-Demand-Token, die Sie innerhalb einer Minute zur Modellinferenz für Gemma 3 4B einreichen können. Das Kontingent berücksichtigt die kombinierte Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, ConverseStream und. InvokeModel InvokeModelWithResponseStream
On-demand modellieren Sie Inferenz-Token pro Minute für Kimi K2 Thinking	Jede unterstützte Region: 100 000 000	Nein	Die maximale Anzahl von On-Demand-Token, die Sie in einer Minute für Kimi K2 Thinking zur Modellinferenz einreichen können. Das Kontingent berücksichtigt die kombinierte Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream
On-demand Modellieren Sie Inferenz-Token pro Minute für Magistral Small 1.2	Jede unterstützte Region: 100 000 000	Nein	Die maximale Anzahl von On-Demand-Token, die Sie für Magistral Small 1.2 innerhalb einer Minute zur Modellinferenz einreichen können. Das Kontingent berücksichtigt die kombinierte Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream
On-demand modellieren Sie Inferenz-Token pro Minute für Meta Llama 3 70B Instruct	Jede unterstützte Region: 300 000	Nein	Die maximale Anzahl von On-Demand-Token, die Sie innerhalb einer Minute zur Modellinferenz für Meta Llama 3 70B Instruct einreichen können. Das Kontingent berücksichtigt die kombinierte Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream
On-demand Modellieren Sie Inferenz-Token pro Minute für Meta Llama 3 8B Instruct	Jede unterstützte Region: 300 000	Nein	Die maximale Anzahl von On-Demand-Token, die Sie innerhalb einer Minute zur Modellinferenz für Meta Llama 3 8B Instruct einreichen können. Das Kontingent berücksichtigt die kombinierte Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream
On-demand modellieren Sie Inferenz-Token pro Minute für Meta Llama 3.1 405B Instruct	Jede unterstützte Region: 400 000	Nein	Die maximale Anzahl von On-Demand-Token, die Sie innerhalb einer Minute zur Modellinferenz für Meta Llama 3.1 405B Instruct einreichen können. Das Kontingent berücksichtigt die kombinierte Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream
On-demand modellieren Sie Inferenz-Token pro Minute für Meta Llama 3.1 70B Instruct	Jede unterstützte Region: 300 000	Nein	Die maximale Anzahl von On-Demand-Token, die Sie innerhalb einer Minute zur Modellinferenz für Meta Llama 3.1 70B Instruct einreichen können. Das Kontingent berücksichtigt die kombinierte Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream
On-demand modellieren Sie Inferenz-Token pro Minute für Meta Llama 3.1 8B Instruct	Jede unterstützte Region: 300 000	Nein	Die maximale Anzahl von On-Demand-Token, die Sie innerhalb einer Minute zur Modellinferenz für Meta Llama 3.1 8B Instruct einreichen können. Das Kontingent berücksichtigt die kombinierte Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream
On-demand modellieren Sie Inferenz-Token pro Minute für Meta Llama 3.2 11B Instruct	Jede unterstützte Region: 300 000	Nein	Die maximale Anzahl von Tokens, die Sie in einer Minute zur Modellinferenz für Meta Llama 3.2 11B Instruct einreichen können. Das Kontingent berücksichtigt die kombinierte Summe der Tokens für InvokeModel, InvokeModelWithResponseStream, Converse und. ConverseStream
On-demand modellieren Sie Inferenz-Token pro Minute für Meta Llama 3.2 1B Instruct	Jede unterstützte Region: 300 000	Nein	Die maximale Anzahl von On-Demand-Token, die Sie innerhalb einer Minute zur Modellinferenz für Meta Llama 3.2 1B Instruct einreichen können. Das Kontingent berücksichtigt die kombinierte Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream
On-demand modellieren Sie Inferenz-Token pro Minute für Meta Llama 3.2 3B Instruct	Jede unterstützte Region: 300 000	Nein	Die maximale Anzahl von Tokens, die Sie in einer Minute zur Modellinferenz für Meta Llama 3.2 3B Instruct einreichen können. Die Quote berücksichtigt die kombinierte Summe der Tokens für InvokeModel, InvokeModelWithResponseStream, Converse und. ConverseStream
On-demand modellieren Sie Inferenz-Token pro Minute für Meta Llama 3.2 90B Instruct	Jede unterstützte Region: 300 000	Nein	Die maximale Anzahl von Tokens, die Sie in einer Minute zur Modellinferenz für Meta Llama 3.2 90B Instruct einreichen können. Das Kontingent berücksichtigt die kombinierte Summe der Tokens für InvokeModel, InvokeModelWithResponseStream, Converse und. ConverseStream
On-demand modellieren Sie Inferenz-Token pro Minute für Meta Llama 3.3 70B Instruct	Jede unterstützte Region: 300 000	Nein	Die maximale Anzahl von On-Demand-Token, die Sie innerhalb einer Minute zur Modellinferenz für Meta Llama 3.3 70B Instruct einreichen können. Das Kontingent berücksichtigt die kombinierte Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream
On-demand modellieren Sie Inferenz-Token pro Minute für MiniMax M2.5	Jede unterstützte Region: 100 000 000	Nein	Die maximale Anzahl von On-Demand-Token, für die Sie innerhalb einer Minute zur Modellinferenz einreichen können. MiniMax M2.5 Das Kontingent berücksichtigt die kombinierte Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse ConverseStream, InvokeModel und. InvokeModelWithResponseStream
On-demand modellieren Sie Inferenz-Token pro Minute für Minimax M2	Jede unterstützte Region: 100 000 000	Nein	Die maximale Anzahl von On-Demand-Token, die Sie innerhalb einer Minute zur Modellinferenz für Minimax M2 einreichen können. Das Kontingent berücksichtigt die kombinierte Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, ConverseStream und. InvokeModel InvokeModelWithResponseStream
On-demand modellieren Sie Inferenz-Token pro Minute für Minimax M2.1	Jede unterstützte Region: 100 000 000	Nein	Die maximale Anzahl von On-Demand-Token, die Sie für Minimax innerhalb einer Minute zur Modellinferenz einreichen können. M2.1 Das Kontingent berücksichtigt die kombinierte Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, ConverseStream und. InvokeModel InvokeModelWithResponseStream
On-demand modellieren Sie Inferenz-Tokens pro Minute für Ministral 14B 3.0	Jede unterstützte Region: 100 000 000	Nein	Die maximale Anzahl von On-Demand-Token, die Sie innerhalb einer Minute für Ministral 14B 3.0 zur Modellinferenz einreichen können. Das Kontingent berücksichtigt die kombinierte Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream
On-demand modellieren Sie Inferenz-Token pro Minute für Ministral 3B 3.0	Jede unterstützte Region: 100 000 000	Nein	Die maximale Anzahl von On-Demand-Token, die Sie innerhalb einer Minute zur Modellinferenz für Ministral 3B 3.0 einreichen können. Das Kontingent berücksichtigt die Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, ConverseStream und. InvokeModel InvokeModelWithResponseStream
On-demand modellieren Sie Inferenz-Token pro Minute für Ministral 8B 3.0	Jede unterstützte Region: 100 000 000	Nein	Die maximale Anzahl von On-Demand-Token, die Sie innerhalb einer Minute für Ministral 8B 3.0 zur Modellinferenz einreichen können. Das Kontingent berücksichtigt die kombinierte Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream
On-demand modellieren Sie Inferenz-Token pro Minute für Mistral AI Mistral 7B Instruct	Jede unterstützte Region: 300 000	Nein	Die maximale Anzahl von On-Demand-Token, die Sie in einer Minute zur Modellinferenz einreichen können. Das Kontingent berücksichtigt die kombinierte Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse InvokeModel und InvokeModelWithResponseStream für Mistral AI Mistral 7B Instruct. ConverseStream
On-demand modellieren Sie Inferenz-Token pro Minute für Mistral AI Mistral Large	Jede unterstützte Region: 300 000	Nein	Die maximale Anzahl von On-Demand-Token, die Sie innerhalb einer Minute zur Modellinferenz einreichen können. Das Kontingent berücksichtigt die kombinierte Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse InvokeModel und InvokeModelWithResponseStream für Mistral AI Mistral Large. ConverseStream
On-demand Modellieren Sie Inferenz-Token pro Minute für Mistral AI Mistral Small	Jede unterstützte Region: 300 000	Nein	Die maximale Anzahl von On-Demand-Token, die Sie in einer Minute zur Modellinferenz einreichen können. Das Kontingent berücksichtigt die kombinierte Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse InvokeModel und InvokeModelWithResponseStream für Mistral AI Mistral Small. ConverseStream
On-demand modellieren Sie Inferenz-Token pro Minute für Mistral AI Mixtral 8X7BB Instruct	Jede unterstützte Region: 300 000	Nein	Die maximale Anzahl von On-Demand-Token, die Sie in einer Minute zur Modellinferenz einreichen können. Das Kontingent berücksichtigt die kombinierte Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse InvokeModel und InvokeModelWithResponseStream für Mistral AI Mixtral 8X7B Instruct. ConverseStream
On-demand modellieren Sie Inferenz-Token pro Minute für Mistral Devstral 2 123b	Jede unterstützte Region: 100 000 000	Nein	Die maximale Anzahl von On-Demand-Token, die Sie innerhalb einer Minute zur Modellinferenz für Mistral Devstral 2 123b einreichen können. Das Kontingent berücksichtigt die kombinierte Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream
On-demand Modellieren Sie Inferenz-Token pro Minute für Mistral Large 2407	Jede unterstützte Region: 300 000	Nein	Die maximale Anzahl von Tokens, die Sie innerhalb einer Minute zur Modellinferenz für Mistral Large 2407 einreichen können. Die Quote berücksichtigt die kombinierte Summe der Token für InvokeModel,, Converse und InvokeModelWithResponseStream ConverseStream
On-demand Modellieren Sie Inferenz-Token pro Minute für Mistral Large 3	Jede unterstützte Region: 100 000 000	Nein	Die maximale Anzahl von On-Demand-Token, die Sie innerhalb einer Minute zur Modellinferenz für Mistral Large 3 einreichen können. Das Kontingent berücksichtigt die kombinierte Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream
On-demand Modellieren Sie Inferenz-Token pro Minute für Moonshot AI Kimi K2.5	Jede unterstützte Region: 100 000 000	Nein	Die maximale Anzahl von On-Demand-Token, die Sie innerhalb einer Minute zur Modellinferenz für Moonshot AI Kimi einreichen können. K2.5 Das Kontingent berücksichtigt die kombinierte Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream
On-demand modellieren Sie Inferenz-Token pro Minute für NVIDIA Nemotron 3 Super 120B A12B	Jede unterstützte Region: 100 000 000	Nein	Die maximale Anzahl von On-Demand-Token, die Sie für NVIDIA Nemotron 3 Super 120B A12B innerhalb einer Minute zur Modellinferenz einreichen können. Das Kontingent berücksichtigt die kombinierte Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream
On-demand modellieren Sie Inferenz-Token pro Minute für NVIDIA Nemotron Nano 2	Jede unterstützte Region: 100 000 000	Nein	Die maximale Anzahl von On-Demand-Token, die Sie für NVIDIA Nemotron Nano 2 innerhalb einer Minute zur Modellinferenz einreichen können. Das Kontingent berücksichtigt die kombinierte Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream
On-demand modellieren Sie Inferenz-Token pro Minute für NVIDIA Nemotron Nano 2 VL	Jede unterstützte Region: 100 000 000	Nein	Die maximale Anzahl von On-Demand-Token, die Sie für NVIDIA Nemotron Nano 2 VL innerhalb einer Minute zur Modellinferenz einreichen können. Das Kontingent berücksichtigt die kombinierte Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream
On-demand modellieren Sie Inferenz-Token pro Minute für Nemotron Nano 3 30B	Jede unterstützte Region: 100 000 000	Nein	Die maximale Anzahl von On-Demand-Token, die Sie innerhalb einer Minute zur Modellinferenz für Nemotron Nano 3 30B einreichen können. Das Kontingent berücksichtigt die kombinierte Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream
On-demand Modellieren Sie Inferenz-Token pro Minute für OpenAI GPT OSS 120B	Jede unterstützte Region: 100 000 000	Nein	Die maximale Anzahl von On-Demand-Token, die Sie in einer Minute zur Modellinferenz für OpenAI GPT OSS 120B einreichen können. Das Kontingent berücksichtigt die kombinierte Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream
On-demand Modellieren Sie Inferenz-Token pro Minute für OpenAI GPT OSS 20B	Jede unterstützte Region: 100 000 000	Nein	Die maximale Anzahl von On-Demand-Token, die Sie in einer Minute zur Modellinferenz für OpenAI GPT OSS 20B einreichen können. Das Kontingent berücksichtigt die kombinierte Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream
On-demand Modellieren Sie Inferenz-Token pro Minute für Qwen3 235B a22b 2507 V1	Jede unterstützte Region: 100 000 000	Nein	Die maximale Anzahl von On-Demand-Token, die Sie für Qwen3 235B a22b 2507 V1 innerhalb einer Minute zur Modellinferenz einreichen können. Das Kontingent berücksichtigt die kombinierte Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream
On-demand Modellieren Sie Inferenz-Token pro Minute für Qwen3 32B V1	Jede unterstützte Region: 100 000 000	Nein	Die maximale Anzahl von On-Demand-Token, die Sie innerhalb einer Minute zur Modellinferenz für Qwen3 32B V1 einreichen können. Das Kontingent berücksichtigt die kombinierte Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream
On-demand Modellieren Sie Inferenz-Token pro Minute für Qwen3 Coder 30B a3b V1	Jede unterstützte Region: 100 000 000	Nein	Die maximale Anzahl von On-Demand-Token, die Sie innerhalb einer Minute zur Modellinferenz für Qwen3 Coder 30B a3b V1 einreichen können. Das Kontingent berücksichtigt die kombinierte Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream
On-demand Modellieren Sie Inferenz-Token pro Minute für Qwen3 Coder 480B a35b V1	Jede unterstützte Region: 100 000 000	Nein	Die maximale Anzahl von On-Demand-Token, die Sie für Qwen3 Coder 480B a35b V1 innerhalb einer Minute zur Modellinferenz einreichen können. Das Kontingent berücksichtigt die kombinierte Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream
On-demand Modellieren Sie Inferenz-Token pro Minute für Qwen3 Coder Next	Jede unterstützte Region: 100 000 000	Nein	Die maximale Anzahl von On-Demand-Token, die Sie innerhalb einer Minute zur Modellinferenz für Qwen3 Coder Next einreichen können. Das Kontingent berücksichtigt die kombinierte Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream
On-demand modellieren Sie Inferenz-Token pro Minute für Qwen3 Next 80B A3B	Jede unterstützte Region: 100 000 000	Nein	Die maximale Anzahl von On-Demand-Token, die Sie innerhalb einer Minute zur Modellinferenz für Qwen3 Next 80B A3B einreichen können. Das Kontingent berücksichtigt die kombinierte Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream
On-demand modellieren Sie Inferenz-Token pro Minute für Qwen3 VL 235B A22B	Jede unterstützte Region: 100 000 000	Nein	Die maximale Anzahl von On-Demand-Token, die Sie für Qwen3 VL 235B A22B innerhalb einer Minute zur Modellinferenz einreichen können. Das Kontingent berücksichtigt die kombinierte Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream
On-demand modellieren Sie Inferenz-Token pro Minute für Voxtral Mini 1.0	Jede unterstützte Region: 100 000 000	Nein	Die maximale Anzahl von On-Demand-Token, die Sie für Voxtral Mini 1.0 innerhalb einer Minute zur Modellinferenz einreichen können. Das Kontingent berücksichtigt die kombinierte Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream
On-demand modellieren Sie Inferenz-Token pro Minute für Voxtral Small 1.0	Jede unterstützte Region: 100 000 000	Nein	Die maximale Anzahl von On-Demand-Token, die Sie für Voxtral Small 1.0 innerhalb einer Minute zur Modellinferenz einreichen können. Das Kontingent berücksichtigt die kombinierte Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream
On-demand Modellieren Sie Inferenz-Token pro Minute für Writer Palmyra Vision 7B	Jede unterstützte Region: 100 000 000	Nein	Die maximale Anzahl von On-Demand-Token, die Sie innerhalb einer Minute zur Modellinferenz für Writer Palmyra Vision 7B einreichen können. Das Kontingent berücksichtigt die kombinierte Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, und. ConverseStream InvokeModel InvokeModelWithResponseStream
On-demand Modellieren Sie Inferenz-Token pro Minute für GLM 5 Z.ai	Jede unterstützte Region: 100 000 000	Nein	Die maximale Anzahl von On-Demand-Token, die Sie innerhalb einer Minute zur Modellinferenz für GLM 5 einreichen können. Z.ai Das Kontingent berücksichtigt die kombinierte Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse, ConverseStream und. InvokeModel InvokeModelWithResponseStream
On-demand modellieren Sie Inferenz-Token pro Minute für Z.ai GLM-4.7	Jede unterstützte Region: 100 000 000	Nein	Die maximale Anzahl von On-Demand-Token, für die Sie innerhalb einer Minute zur Modellinferenz einreichen können. Z.ai GLM-4.7 Das Kontingent berücksichtigt die kombinierte Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse ConverseStream, InvokeModel und. InvokeModelWithResponseStream
On-demand modellieren Sie Inferenz-Token pro Minute für Flash Z.ai GLM-4.7	Jede unterstützte Region: 100 000 000	Nein	Die maximale Anzahl von On-Demand-Token, die Sie innerhalb einer Minute zur Modellinferenz für Z.ai GLM-4.7 Flash einreichen können. Das Kontingent berücksichtigt die kombinierte Summe der Eingabe- und Ausgabetokens aller Anfragen an Converse ConverseStream, InvokeModel und. InvokeModelWithResponseStream
Parameter pro Funktion	Jede unterstützte Region: 5	Yes (Ja)	Die maximale Anzahl von Parametern, die Sie in einer Aktionsgruppenfunktion haben können.
PrepareAgent Anfragen pro Sekunde	Jede unterstützte Region: 2	Nein	Die maximale Anzahl von PrepareAgent API-Anfragen pro Sekunde.
Datensätze pro Batch-Inferenzjob für Amazon Nova 2 Multimodal Embeddings V1	Jede unterstützte Region: 100 000	Ja	Die maximale Anzahl von Datensätzen in allen Eingabedateien in einem Batch-Inferenzjob für Amazon Nova 2 Multimodal Embeddings V1.
Datensätze pro Batch-Inferenzauftrag für Amazon Nova Premier	Jede unterstützte Region: 100 000	Ja	Die maximale Anzahl von Datensätzen in allen Eingabedateien in einem Batch-Inferenzjob für Amazon Nova Premier.
Datensätze pro Batch-Inferenzauftrag für Claude 3 Haiku	Jede unterstützte Region: 100 000	Ja	Die maximale Anzahl von Datensätzen in allen Eingabedateien in einem Batch-Inferenzjob für Claude-3-Haiku.
Datensätze pro Batch-Inferenzauftrag für Claude 3 Opus	Jede unterstützte Region: 100 000	Ja	Die maximale Anzahl von Datensätzen in allen Eingabedateien in einem Batch-Inferenzjob für Claude 3 Opus.
Datensätze pro Batch-Inferenzauftrag für Claude 3 Sonnet	Jede unterstützte Region: 100 000	Ja	Die maximale Anzahl von Datensätzen in allen Eingabedateien in einem Batch-Inferenzjob für Claude 3 Sonnet.
Datensätze pro Batch-Inferenzauftrag für Claude 3.5 Haiku	Jede unterstützte Region: 100 000	Ja	Die maximale Anzahl von Datensätzen in allen Eingabedateien in einem Batch-Inferenzjob für Claude 3.5 Haiku.
Datensätze pro Batch-Inferenzauftrag für Claude 3.5 Sonnet	Jede unterstützte Region: 100 000	Ja	Die maximale Anzahl von Datensätzen in allen Eingabedateien in einem Batch-Inferenzjob für Claude 3.5 Sonnet.
Datensätze pro Batch-Inferenzauftrag für Claude 3.5 Sonnet v2	Jede unterstützte Region: 100 000	Ja	Die maximale Anzahl von Datensätzen in allen Eingabedateien in einem Batch-Inferenzjob für Claude 3.5 Sonnet v2.
Datensätze pro Batch-Inferenzauftrag für Claude 3.7 Sonnet	Jede unterstützte Region: 100 000	Ja	Die maximale Anzahl von Datensätzen in allen Eingabedateien in einem Batch-Inferenzjob für Claude 3.7 Sonnet.
Datensätze pro Batch-Inferenzauftrag für Claude Haiku 4.5	Jede unterstützte Region: 100 000	Ja	Die maximale Anzahl von Datensätzen in allen Eingabedateien in einem Batch-Inferenzjob für Claude Haiku 4.5.
Datensätze pro Batch-Inferenzauftrag für Claude Opus 4.5	Jede unterstützte Region: 100 000	Ja	Die maximale Anzahl von Datensätzen in allen Eingabedateien in einem Batch-Inferenzjob für Claude Opus 4.5.
Datensätze pro Batch-Inferenzjob für Claude Opus 4.6	Jede unterstützte Region: 100 000	Ja	Die maximale Anzahl von Datensätzen in allen Eingabedateien in einem Batch-Inferenzjob für Claude Opus 4.6.
Datensätze pro Batch-Inferenzauftrag für Claude Sonnet 4	Jede unterstützte Region: 100 000	Ja	Die maximale Anzahl von Datensätzen in allen Eingabedateien in einem Batch-Inferenzjob für Claude Sonnet 4.
Datensätze pro Batch-Inferenzauftrag für Claude Sonnet 4.5	Jede unterstützte Region: 100 000	Ja	Die maximale Anzahl von Datensätzen in allen Eingabedateien in einem Batch-Inferenzjob für Claude Sonnet 4.5.
Datensätze pro Batch-Inferenzauftrag für Claude Sonnet 4.6	Jede unterstützte Region: 100 000	Ja	Die maximale Anzahl von Datensätzen in allen Eingabedateien in einem Batch-Inferenzjob für Claude Sonnet 4.6.
Datensätze pro Batch-Inferenzjob für DeepSeek V3.2	Jede unterstützte Region: 100 000	Ja	Die maximale Anzahl von Datensätzen in allen Eingabedateien in einem Batch-Inferenzjob für. DeepSeek V3.2
Datensätze pro Batch-Inferenzjob für v3 DeepSeek	Jede unterstützte Region: 100 000	Ja	Die maximale Anzahl von Datensätzen in allen Eingabedateien in einem Batch-Inferenzjob für DeepSeek v3.
Datensätze pro Batch-Inferenzjob für Devstral 2 123B	Jede unterstützte Region: 100 000	Ja	Die maximale Anzahl von Datensätzen in allen Eingabedateien in einem Batch-Inferenzjob für Devstral 2 123B.
Datensätze pro Batch-Inferenzjob für GLM 4.7	Jede unterstützte Region: 100 000	Ja	Die maximale Anzahl von Datensätzen in allen Eingabedateien in einem Batch-Inferenzjob für GLM 4.7.
Datensätze pro Batch-Inferenzjob für GLM 4.7 Flash	Jede unterstützte Region: 100 000	Ja	Die maximale Anzahl von Datensätzen in allen Eingabedateien in einem Batch-Inferenzjob für GLM 4.7 Flash.
Datensätze pro Batch-Inferenzjob für GLM 5	Jede unterstützte Region: 100 000	Ja	Die maximale Anzahl von Datensätzen in allen Eingabedateien in einem Batch-Inferenzjob für GLM 5.
Datensätze pro Batch-Inferenzjob für Gemma 3 12B	Jede unterstützte Region: 100 000	Ja	Die maximale Anzahl von Datensätzen in allen Eingabedateien in einem Batch-Inferenzjob für Gemma 3 12B.
Datensätze pro Batch-Inferenzauftrag für Gemma 3 27B	Jede unterstützte Region: 100 000	Ja	Die maximale Anzahl von Datensätzen in allen Eingabedateien in einem Batch-Inferenzjob für Gemma 3 27B.
Datensätze pro Batch-Inferenzjob für Gemma 3 4B	Jede unterstützte Region: 100 000	Ja	Die maximale Anzahl von Datensätzen in allen Eingabedateien in einem Batch-Inferenzjob für Gemma 3 4B.
Datensätze pro Batch-Inferenzjob für Kimi K2 Thinking	Jede unterstützte Region: 100 000	Ja	Die maximale Anzahl von Datensätzen in allen Eingabedateien in einem Batch-Inferenzjob für Kimi K2 Thinking.
Datensätze pro Batch-Inferenzjob für Kimi K2.5	Jede unterstützte Region: 100 000	Ja	Die maximale Anzahl von Datensätzen in allen Eingabedateien in einem Batch-Inferenzjob für Kimi. K2.5
Datensätze pro Batch-Inferenzjob für Llama 3.1 405B Instruct	Jede unterstützte Region: 100 000	Ja	Die maximale Anzahl von Datensätzen in allen Eingabedateien in einem Batch-Inferenzjob für Llama 3.1 405B Instruct.
Datensätze pro Batch-Inferenzjob für Llama 3.1 70B Instruct	Jede unterstützte Region: 100 000	Ja	Die maximale Anzahl von Datensätzen in allen Eingabedateien in einem Batch-Inferenzjob für Llama 3.1 70B Instruct.
Datensätze pro Batch-Inferenzjob für Llama 3.1 8B Instruct	Jede unterstützte Region: 100 000	Ja	Die maximale Anzahl von Datensätzen in allen Eingabedateien in einem Batch-Inferenzjob für Llama 3.1 8B Instruct.
Datensätze pro Batch-Inferenzjob für Llama 3.2 11B Instruct	Jede unterstützte Region: 100 000	Ja	Die maximale Anzahl von Datensätzen in allen Eingabedateien in einem Batch-Inferenzjob für Llama 3.2 11B Instruct.
Datensätze pro Batch-Inferenzjob für Llama 3.2 1B Instruct	Jede unterstützte Region: 100 000	Ja	Die maximale Anzahl von Datensätzen in allen Eingabedateien in einem Batch-Inferenzjob Llama 3.2 1B Instruct.
Datensätze pro Batch-Inferenzjob für Llama 3.2 3B Instruct	Jede unterstützte Region: 100 000	Ja	Die maximale Anzahl von Datensätzen in allen Eingabedateien in einem Batch-Inferenzjob für Llama 3.2 3B Instruct.
Datensätze pro Batch-Inferenzjob für Llama 3.2 90B Instruct	Jede unterstützte Region: 100 000	Ja	Die maximale Anzahl von Datensätzen in allen Eingabedateien in einem Batch-Inferenzjob für Llama 3.2 90B Instruct.
Datensätze pro Batch-Inferenzjob für Llama 3.3 70B Instruct	Jede unterstützte Region: 100 000	Ja	Die maximale Anzahl von Datensätzen in allen Eingabedateien in einem Batch-Inferenzjob für Llama 3.3 70B Instruct.
Datensätze pro Batch-Inferenzjob für Llama 4 Maverick	Jede unterstützte Region: 100 000	Ja	Die maximale Anzahl von Datensätzen in allen Eingabedateien in einem Batch-Inferenzjob für Llama 4 Maverick.
Datensätze pro Batch-Inferenzjob für Llama 4 Scout	Jede unterstützte Region: 100 000	Ja	Die maximale Anzahl von Datensätzen in allen Eingabedateien in einem Batch-Inferenzjob für Llama 4 Scout.
Datensätze pro Batch-Inferenzauftrag für Magistral Small 2509	Jede unterstützte Region: 100 000	Ja	Die maximale Anzahl von Datensätzen in allen Eingabedateien in einem Batch-Inferenzjob für Magistral Small 2509.
Datensätze pro Batch-Inferenzjob für M2 MiniMax	Jede unterstützte Region: 100 000	Ja	Die maximale Anzahl von Datensätzen in allen Eingabedateien in einem Batch-Inferenzjob für MiniMax M2.
Datensätze pro Batch-Inferenzjob für MiniMax M2.1	Jede unterstützte Region: 100 000	Ja	Die maximale Anzahl von Datensätzen in allen Eingabedateien in einem Batch-Inferenzjob für. MiniMax M2.1
Datensätze pro Batch-Inferenzjob für MiniMax M2.5	Jede unterstützte Region: 100 000	Ja	Die maximale Anzahl von Datensätzen in allen Eingabedateien in einem Batch-Inferenzjob für. MiniMax M2.5
Datensätze pro Batch-Inferenzauftrag für Ministral 3 14B	Jede unterstützte Region: 100 000	Ja	Die maximale Anzahl von Datensätzen in allen Eingabedateien in einem Batch-Inferenzjob für Ministral 3 14B.
Datensätze pro Batch-Inferenzauftrag für Ministral 3 8B	Jede unterstützte Region: 100 000	Ja	Die maximale Anzahl von Datensätzen in allen Eingabedateien in einem Batch-Inferenzjob für Ministral 3 8B.
Datensätze pro Batch-Inferenzauftrag für Ministral 3B	Jede unterstützte Region: 100 000	Ja	Die maximale Anzahl von Datensätzen in allen Eingabedateien in einem Batch-Inferenzjob für Ministry 3B.
Datensätze pro Batch-Inferenzauftrag für Mistral Large 2 (24.07)	Jede unterstützte Region: 100 000	Ja	Die maximale Anzahl von Datensätzen in allen Eingabedateien in einem Batch-Inferenzjob für Mistral Large 2 (24.07).
Datensätze pro Batch-Inferenzauftrag für Mistral Large 3	Jede unterstützte Region: 100 000	Ja	Die maximale Anzahl von Datensätzen in allen Eingabedateien in einem Batch-Inferenzjob für Mistral Large 3.
Datensätze pro Batch-Inferenzauftrag für Mistral Small	Jede unterstützte Region: 100 000	Ja	Die maximale Anzahl von Datensätzen in allen Eingabedateien in einem Batch-Inferenzjob für Mistral Small.
Datensätze pro Batch-Inferenzauftrag für NVIDIA Nemotron 3 Super 120B A12B	Jede unterstützte Region: 100 000	Ja	Die maximale Anzahl von Datensätzen in allen Eingabedateien in einem Batch-Inferenzjob für NVIDIA Nemotron 3 Super 120B A12B.
Datensätze pro Batch-Inferenzauftrag für NVIDIA Nemotron Nano 12B	Jede unterstützte Region: 100 000	Ja	Die maximale Anzahl von Datensätzen in allen Eingabedateien in einem Batch-Inferenzjob für NVIDIA Nemotron Nano 12B.
Datensätze pro Batch-Inferenzauftrag für NVIDIA Nemotron Nano 3 30B	Jede unterstützte Region: 100 000	Ja	Die maximale Anzahl von Datensätzen in allen Eingabedateien in einem Batch-Inferenzjob für NVIDIA Nemotron Nano 3 30B.
Datensätze pro Batch-Inferenzauftrag für NVIDIA Nemotron Nano 9B	Jede unterstützte Region: 100 000	Ja	Die maximale Anzahl von Datensätzen in allen Eingabedateien in einem Batch-Inferenzjob für NVIDIA Nemotron Nano 9B.
Datensätze pro Batch-Inferenzjob für Nova 2 Lite	Jede unterstützte Region: 100 000	Ja	Die maximale Anzahl von Datensätzen in allen Eingabedateien in einem Batch-Inferenzjob für Nova 2 Lite.
Datensätze pro Batch-Inferenzjob für Nova Lite V1	Jede unterstützte Region: 100 000	Ja	Die maximale Anzahl von Datensätzen in allen Eingabedateien in einem Batch-Inferenzjob für Nova Lite V1.
Datensätze pro Batch-Inferenzjob für Nova Micro V1	Jede unterstützte Region: 100 000	Ja	Die maximale Anzahl von Datensätzen in allen Eingabedateien in einem Batch-Inferenzjob für Nova Micro V1.
Datensätze pro Batch-Inferenzjob für Nova Pro V1	Jede unterstützte Region: 100 000	Ja	Die maximale Anzahl von Datensätzen in allen Eingabedateien in einem Batch-Inferenzjob für Nova Pro V1.
Aufzeichnungen pro Batch-Inferenzjob für OpenAI GPT OSS 120b	Jede unterstützte Region: 100 000	Ja	Die maximale Anzahl von Datensätzen in allen Eingabedateien in einem Batch-Inferenzjob für OpenAI GPT OSS 120b.
Aufzeichnungen pro Batch-Inferenzjob für OpenAI GPT OSS 20b	Jede unterstützte Region: 100 000	Ja	Die maximale Anzahl von Datensätzen in allen Eingabedateien in einem Batch-Inferenzjob für OpenAI GPT OSS 20b.
Aufzeichnungen pro Batch-Inferenzjob für OpenAI GPT OSS Safeguard 120b	Jede unterstützte Region: 100 000	Ja	Die maximale Anzahl von Datensätzen in allen Eingabedateien in einem Batch-Inferenzjob für OpenAI GPT OSS Safeguard 120b.
Aufzeichnungen pro Batch-Inferenzjob für OpenAI GPT OSS Safeguard 20b	Jede unterstützte Region: 100 000	Ja	Die maximale Anzahl von Datensätzen in allen Eingabedateien in einem Batch-Inferenzjob für OpenAI GPT OSS Safeguard 20b.
Datensätze pro Batch-Inferenzjob für Qwen3 235B	Jede unterstützte Region: 100 000	Ja	Die maximale Anzahl von Datensätzen in allen Eingabedateien in einem Batch-Inferenzjob für Qwen3 235B.
Datensätze pro Batch-Inferenzjob für Qwen3 32B	Jede unterstützte Region: 100 000	Ja	Die maximale Anzahl von Datensätzen in allen Eingabedateien in einem Batch-Inferenzjob für Qwen3 32B.
Datensätze pro Batch-Inferenzjob für Qwen3 Coder 30B	Jede unterstützte Region: 100 000	Ja	Die maximale Anzahl von Datensätzen in allen Eingabedateien in einem Batch-Inferenzjob für Qwen3 Coder 30B.
Datensätze pro Batch-Inferenzjob für Qwen3 Coder 480B	Jede unterstützte Region: 100 000	Ja	Die maximale Anzahl von Datensätzen in allen Eingabedateien in einem Batch-Inferenzjob für Qwen3 Coder 480B.
Datensätze pro Batch-Inferenzjob für Qwen3 Coder Next	Jede unterstützte Region: 100 000	Ja	Die maximale Anzahl von Datensätzen in allen Eingabedateien in einem Batch-Inferenzjob für Qwen3 Coder Next.
Datensätze pro Batch-Inferenzjob für Qwen3 Next 80B	Jede unterstützte Region: 100 000	Ja	Die maximale Anzahl von Datensätzen in allen Eingabedateien in einem Batch-Inferenzjob für Qwen3 Next 80B.
Datensätze pro Batch-Inferenzjob für Qwen3 VL 235B	Jede unterstützte Region: 100 000	Ja	Die maximale Anzahl von Datensätzen in allen Eingabedateien in einem Batch-Inferenzjob für Qwen3 VL 235B.
Datensätze pro Batch-Inferenzjob für Titan Multimodal Embeddings G1	Jede unterstützte Region: 100 000	Ja	Die maximale Anzahl von Datensätzen in allen Eingabedateien in einem Batch-Inferenzjob für Titan Multimodal Embeddings G1.
Datensätze pro Batch-Inferenzjob für Titan Text Embeddings V2	Jede unterstützte Region: 100 000	Ja	Die maximale Anzahl von Datensätzen in allen Eingabedateien in einem Batch-Inferenzjob für Titan Text Embeddings V2.
Datensätze pro Batch-Inferenzjob für Voxtral Mini 3B 2507	Jede unterstützte Region: 100 000	Ja	Die maximale Anzahl von Datensätzen in allen Eingabedateien in einem Batch-Inferenzjob für Voxtral Mini 3B 2507.
Datensätze pro Batch-Inferenzauftrag für Voxtral Small 24B 2507	Jede unterstützte Region: 100 000	Ja	Die maximale Anzahl von Datensätzen in allen Eingabedateien in einem Batch-Inferenzjob für Voxtral Small 24B 2507.
Datensätze pro Batch-Inferenzauftrag für Writer Palmyra Vision 7B	Jede unterstützte Region: 100 000	Ja	Die maximale Anzahl von Datensätzen in allen Eingabedateien in einem Batch-Inferenzjob für Writer Palmyra Vision 7B.
Datensätze pro Eingabedatei pro Batch-Inferenzjob für Amazon Nova 2 Multimodal Embeddings V1	Jede unterstützte Region: 100 000	Ja	Die maximale Anzahl von Datensätzen in einer Eingabedatei in einem Batch-Inferenzjob für Amazon Nova 2 Multimodal Embeddings V1.
Datensätze pro Eingabedatei pro Batch-Inferenzauftrag für Amazon Nova Premier	Jede unterstützte Region: 100 000	Ja	Die maximale Anzahl von Datensätzen in einer Eingabedatei in einem Batch-Inferenzjob für Amazon Nova Premier.
Datensätze pro Eingabedatei pro Batch-Inferenzjob für Claude 3 Haiku	Jede unterstützte Region: 100 000	Ja	Die maximale Anzahl von Datensätzen in einer Eingabedatei in einem Batch-Inferenzjob für Claude-3-Haiku.
Datensätze pro Eingabedatei pro Batch-Inferenzjob für Claude 3 Opus	Jede unterstützte Region: 100 000	Ja	Die maximale Anzahl von Datensätzen in einer Eingabedatei in einem Batch-Inferenzjob für Claude 3 Opus.
Datensätze pro Eingabedatei pro Batch-Inferenzjob für Claude 3 Sonnet	Jede unterstützte Region: 100 000	Ja	Die maximale Anzahl von Datensätzen in einer Eingabedatei in einem Batch-Inferenzjob für Claude 3 Sonnet.
Datensätze pro Eingabedatei pro Batch-Inferenzjob für Claude 3.5 Haiku	Jede unterstützte Region: 100 000	Ja	Die maximale Anzahl von Datensätzen in einer Eingabedatei in einem Batch-Inferenzjob für Claude 3.5 Haiku.
Datensätze pro Eingabedatei pro Batch-Inferenzauftrag für Claude 3.5 Sonnet	Jede unterstützte Region: 100 000	Ja	Die maximale Anzahl von Datensätzen in einer Eingabedatei in einem Batch-Inferenzjob für Claude 3.5 Sonnet.
Datensätze pro Eingabedatei pro Batch-Inferenzjob für Claude 3.5 Sonnet v2	Jede unterstützte Region: 100 000	Ja	Die maximale Anzahl von Datensätzen in einer Eingabedatei in einem Batch-Inferenzjob für Claude 3.5 Sonnet v2.
Datensätze pro Eingabedatei pro Batch-Inferenzjob für Claude 3.7 Sonnet	Jede unterstützte Region: 100 000	Ja	Die maximale Anzahl von Datensätzen in einer Eingabedatei in einem Batch-Inferenzjob für Claude 3.7 Sonnet.
Datensätze pro Eingabedatei pro Batch-Inferenzjob für Claude Haiku 4.5	Jede unterstützte Region: 100 000	Ja	Die maximale Anzahl von Datensätzen in einer Eingabedatei in einem Batch-Inferenzjob für Claude Haiku 4.5.
Datensätze pro Eingabedatei pro Batch-Inferenzjob für Claude Opus 4.5	Jede unterstützte Region: 100 000	Ja	Die maximale Anzahl von Datensätzen in einer Eingabedatei in einem Batch-Inferenzjob für Claude Opus 4.5.
Datensätze pro Eingabedatei pro Batch-Inferenzjob für Claude Opus 4.6	Jede unterstützte Region: 100 000	Ja	Die maximale Anzahl von Datensätzen in einer Eingabedatei in einem Batch-Inferenzjob für Claude Opus 4.6.
Datensätze pro Eingabedatei pro Batch-Inferenzjob für Claude Sonnet 4	Jede unterstützte Region: 100 000	Ja	Die maximale Anzahl von Datensätzen in einer Eingabedatei in einem Batch-Inferenzjob für Claude Sonnet 4.
Datensätze pro Eingabedatei pro Batch-Inferenzauftrag für Claude Sonnet 4.5	Jede unterstützte Region: 100 000	Ja	Die maximale Anzahl von Datensätzen in einer Eingabedatei in einem Batch-Inferenzjob für Claude Sonnet 4.5.
Datensätze pro Eingabedatei pro Batch-Inferenzauftrag für Claude Sonnet 4.6	Jede unterstützte Region: 100 000	Ja	Die maximale Anzahl von Datensätzen in einer Eingabedatei in einem Batch-Inferenzjob für Claude Sonnet 4.6.
Datensätze pro Eingabedatei pro Batch-Inferenzjob für DeepSeek V3.2	Jede unterstützte Region: 100 000	Ja	Die maximale Anzahl von Datensätzen in einer Eingabedatei in einem Batch-Inferenzjob für. DeepSeek V3.2
Datensätze pro Eingabedatei pro Batch-Inferenzjob für v3 DeepSeek	Jede unterstützte Region: 100 000	Ja	Die maximale Anzahl von Datensätzen in einer Eingabedatei in einem Batch-Inferenzjob für DeepSeek v3.
Datensätze pro Eingabedatei pro Batch-Inferenzjob für Devstral 2 123B	Jede unterstützte Region: 100 000	Ja	Die maximale Anzahl von Datensätzen in einer Eingabedatei in einem Batch-Inferenzjob für Devstral 2 123B.
Datensätze pro Eingabedatei pro Batch-Inferenzjob für GLM 4.7	Jede unterstützte Region: 100 000	Ja	Die maximale Anzahl von Datensätzen in einer Eingabedatei in einem Batch-Inferenzjob für GLM 4.7.
Datensätze pro Eingabedatei pro Batch-Inferenzjob für GLM 4.7 Flash	Jede unterstützte Region: 100 000	Ja	Die maximale Anzahl von Datensätzen in einer Eingabedatei in einem Batch-Inferenzjob für GLM 4.7 Flash.
Datensätze pro Eingabedatei pro Batch-Inferenzjob für GLM 5	Jede unterstützte Region: 100 000	Ja	Die maximale Anzahl von Datensätzen in einer Eingabedatei in einem Batch-Inferenzjob für GLM 5.
Datensätze pro Eingabedatei pro Batch-Inferenzjob für Gemma 3 12B	Jede unterstützte Region: 100 000	Ja	Die maximale Anzahl von Datensätzen in einer Eingabedatei in einem Batch-Inferenzjob für Gemma 3 12B.
Datensätze pro Eingabedatei pro Batch-Inferenzjob für Gemma 3 27B	Jede unterstützte Region: 100 000	Ja	Die maximale Anzahl von Datensätzen in einer Eingabedatei in einem Batch-Inferenzjob für Gemma 3 27B.
Datensätze pro Eingabedatei pro Batch-Inferenzjob für Gemma 3 4B	Jede unterstützte Region: 100 000	Ja	Die maximale Anzahl von Datensätzen in einer Eingabedatei in einem Batch-Inferenzjob für Gemma 3 4B.
Datensätze pro Eingabedatei pro Batch-Inferenzjob für Kimi K2 Thinking	Jede unterstützte Region: 100 000	Ja	Die maximale Anzahl von Datensätzen in einer Eingabedatei in einem Batch-Inferenzjob für Kimi K2 Thinking.
Datensätze pro Eingabedatei pro Batch-Inferenzjob für Kimi K2.5	Jede unterstützte Region: 100 000	Ja	Die maximale Anzahl von Datensätzen in einer Eingabedatei in einem Batch-Inferenzjob für Kimi. K2.5
Datensätze pro Eingabedatei pro Batch-Inferenzjob für Llama 3.1 405B Instruct	Jede unterstützte Region: 100 000	Ja	Die maximale Anzahl von Datensätzen in einer Eingabedatei in einem Batch-Inferenzjob für Llama 3.1 405B Instruct.
Datensätze pro Eingabedatei pro Batch-Inferenzjob für Llama 3.1 70B Instruct	Jede unterstützte Region: 100 000	Ja	Die maximale Anzahl von Datensätzen in einer Eingabedatei in einem Batch-Inferenzjob für Llama 3.1 70B Instruct.
Datensätze pro Eingabedatei pro Batch-Inferenzjob für Llama 3.1 8B Instruct	Jede unterstützte Region: 100 000	Ja	Die maximale Anzahl von Datensätzen in einer Eingabedatei in einem Batch-Inferenzjob für Llama 3.1 8B Instruct.
Datensätze pro Eingabedatei pro Batch-Inferenzjob für Llama 3.2 11B Instruct	Jede unterstützte Region: 100 000	Ja	Die maximale Anzahl von Datensätzen in einer Eingabedatei in einem Batch-Inferenzjob für Llama 3.2 11B Instruct.
Datensätze pro Eingabedatei pro Batch-Inferenzjob für Llama 3.2 1B Instruct	Jede unterstützte Region: 100 000	Ja	Die maximale Anzahl von Datensätzen in einer Eingabedatei in einem Batch-Inferenzjob Llama 3.2 1B Instruct.
Datensätze pro Eingabedatei pro Batch-Inferenzjob für Llama 3.2 3B Instruct	Jede unterstützte Region: 100 000	Ja	Die maximale Anzahl von Datensätzen in einer Eingabedatei in einem Batch-Inferenzjob für Llama 3.2 3B Instruct.
Datensätze pro Eingabedatei pro Batch-Inferenzjob für Llama 3.2 90B Instruct	Jede unterstützte Region: 100 000	Ja	Die maximale Anzahl von Datensätzen in einer Eingabedatei in einem Batch-Inferenzjob für Llama 3.2 90B Instruct.
Datensätze pro Eingabedatei pro Batch-Inferenzjob für Llama 3.3 70B Instruct	Jede unterstützte Region: 100 000	Ja	Die maximale Anzahl von Datensätzen in einer Eingabedatei in einem Batch-Inferenzjob für Llama 3.3 70B Instruct.
Datensätze pro Eingabedatei pro Batch-Inferenzjob für Llama 4 Maverick	Jede unterstützte Region: 100 000	Ja	Die maximale Anzahl von Datensätzen in einer Eingabedatei in einem Batch-Inferenzjob für Llama 4 Maverick.
Datensätze pro Eingabedatei pro Batch-Inferenzjob für Llama 4 Scout	Jede unterstützte Region: 100 000	Ja	Die maximale Anzahl von Datensätzen in einer Eingabedatei in einem Batch-Inferenzjob für Llama 4 Scout.
Datensätze pro Eingabedatei pro Batch-Inferenzjob für Magistral Small 2509	Jede unterstützte Region: 100 000	Ja	Die maximale Anzahl von Datensätzen in einer Eingabedatei in einem Batch-Inferenzjob für Magistral Small 2509.
Datensätze pro Eingabedatei pro Batch-Inferenzjob für M2 MiniMax	Jede unterstützte Region: 100 000	Ja	Die maximale Anzahl von Datensätzen in einer Eingabedatei in einem Batch-Inferenzjob für MiniMax M2.
Datensätze pro Eingabedatei pro Batch-Inferenzjob für MiniMax M2.1	Jede unterstützte Region: 100 000	Ja	Die maximale Anzahl von Datensätzen in einer Eingabedatei in einem Batch-Inferenzjob für. MiniMax M2.1
Datensätze pro Eingabedatei pro Batch-Inferenzjob für MiniMax M2.5	Jede unterstützte Region: 100 000	Ja	Die maximale Anzahl von Datensätzen in einer Eingabedatei in einem Batch-Inferenzjob für. MiniMax M2.5
Datensätze pro Eingabedatei pro Batch-Inferenzauftrag für Ministral 3 14B	Jede unterstützte Region: 100 000	Ja	Die maximale Anzahl von Datensätzen in einer Eingabedatei in einem Batch-Inferenzjob für Ministral 3 14B.
Datensätze pro Eingabedatei pro Batch-Inferenzauftrag für Ministral 3 8B	Jede unterstützte Region: 100 000	Ja	Die maximale Anzahl von Datensätzen in einer Eingabedatei in einem Batch-Inferenzjob für Ministral 3 8B.
Datensätze pro Eingabedatei pro Batch-Inferenzauftrag für Ministral 3B	Jede unterstützte Region: 100 000	Ja	Die maximale Anzahl von Datensätzen in einer Eingabedatei in einem Batch-Inferenzjob für Ministral 3B.
Datensätze pro Eingabedatei pro Batch-Inferenzjob für Mistral Large 2 (24.07)	Jede unterstützte Region: 100 000	Ja	Die maximale Anzahl von Datensätzen in einer Eingabedatei in einem Batch-Inferenzjob für Mistral Large 2 (24.07).
Datensätze pro Eingabedatei pro Batch-Inferenzjob für Mistral Large 3	Jede unterstützte Region: 100 000	Ja	Die maximale Anzahl von Datensätzen in einer Eingabedatei in einem Batch-Inferenzjob für Mistral Large 3.
Datensätze pro Eingabedatei pro Batch-Inferenzjob für Mistral Small	Jede unterstützte Region: 100 000	Ja	Die maximale Anzahl von Datensätzen in einer Eingabedatei in einem Batch-Inferenzjob für Mistral Small.
Datensätze pro Eingabedatei pro Batch-Inferenzjob für NVIDIA Nemotron 3 Super 120B A12B	Jede unterstützte Region: 100 000	Ja	Die maximale Anzahl von Datensätzen in einer Eingabedatei in einem Batch-Inferenzjob für NVIDIA Nemotron 3 Super 120B A12B.
Datensätze pro Eingabedatei pro Batch-Inferenzjob für NVIDIA Nemotron Nano 12B	Jede unterstützte Region: 100 000	Ja	Die maximale Anzahl von Datensätzen in einer Eingabedatei in einem Batch-Inferenzjob für NVIDIA Nemotron Nano 12B.
Datensätze pro Eingabedatei pro Batch-Inferenzjob für NVIDIA Nemotron Nano 3 30B	Jede unterstützte Region: 100 000	Ja	Die maximale Anzahl von Datensätzen in einer Eingabedatei in einem Batch-Inferenzjob für NVIDIA Nemotron Nano 3 30B.
Datensätze pro Eingabedatei pro Batch-Inferenzjob für NVIDIA Nemotron Nano 9B	Jede unterstützte Region: 100 000	Ja	Die maximale Anzahl von Datensätzen in einer Eingabedatei in einem Batch-Inferenzjob für NVIDIA Nemotron Nano 9B.
Datensätze pro Eingabedatei pro Batch-Inferenzjob für Nova 2 Lite	Jede unterstützte Region: 100 000	Ja	Die maximale Anzahl von Datensätzen in einer Eingabedatei in einem Batch-Inferenzjob für Nova 2 Lite.
Datensätze pro Eingabedatei pro Batch-Inferenzjob für Nova Lite V1	Jede unterstützte Region: 100 000	Ja	Die maximale Anzahl von Datensätzen in einer Eingabedatei in einem Batch-Inferenzjob für Nova Lite V1.
Datensätze pro Eingabedatei pro Batch-Inferenzjob für Nova Micro V1	Jede unterstützte Region: 100 000	Ja	Die maximale Anzahl von Datensätzen in einer Eingabedatei in einem Batch-Inferenzjob für Nova Micro V1.
Datensätze pro Eingabedatei pro Batch-Inferenzjob für Nova Pro V1	Jede unterstützte Region: 100 000	Ja	Die maximale Anzahl von Datensätzen in einer Eingabedatei in einem Batch-Inferenzjob für Nova Pro V1.
Datensätze pro Eingabedatei pro Batch-Inferenzjob für OpenAI GPT OSS 120b	Jede unterstützte Region: 100 000	Ja	Die maximale Anzahl von Datensätzen in einer Eingabedatei in einem Batch-Inferenzjob für OpenAI GPT OSS 120b.
Datensätze pro Eingabedatei pro Batch-Inferenzjob für OpenAI GPT OSS 20b	Jede unterstützte Region: 100 000	Ja	Die maximale Anzahl von Datensätzen in einer Eingabedatei in einem Batch-Inferenzjob für OpenAI GPT OSS 20b.
Datensätze pro Eingabedatei pro Batch-Inferenzjob für OpenAI GPT OSS Safeguard 120b	Jede unterstützte Region: 100 000	Ja	Die maximale Anzahl von Datensätzen in einer Eingabedatei in einem Batch-Inferenzjob für OpenAI GPT OSS Safeguard 120b.
Datensätze pro Eingabedatei pro Batch-Inferenzjob für OpenAI GPT OSS Safeguard 20b	Jede unterstützte Region: 100 000	Ja	Die maximale Anzahl von Datensätzen in einer Eingabedatei in einem Batch-Inferenzjob für OpenAI GPT OSS Safeguard 20b.
Datensätze pro Eingabedatei pro Batch-Inferenzjob für Qwen3 235B	Jede unterstützte Region: 100 000	Ja	Die maximale Anzahl von Datensätzen in einer Eingabedatei in einem Batch-Inferenzjob für Qwen3 235B.
Datensätze pro Eingabedatei pro Batch-Inferenzjob für Qwen3 32B	Jede unterstützte Region: 100 000	Ja	Die maximale Anzahl von Datensätzen in einer Eingabedatei in einem Batch-Inferenzjob für Qwen3 32B.
Datensätze pro Eingabedatei pro Batch-Inferenzjob für Qwen3 Coder 30B	Jede unterstützte Region: 100 000	Ja	Die maximale Anzahl von Datensätzen in einer Eingabedatei in einem Batch-Inferenzjob für Qwen3 Coder 30B.
Datensätze pro Eingabedatei pro Batch-Inferenzjob für Qwen3 Coder 480B	Jede unterstützte Region: 100 000	Ja	Die maximale Anzahl von Datensätzen in einer Eingabedatei in einem Batch-Inferenzjob für Qwen3 Coder 480B.
Datensätze pro Eingabedatei pro Batch-Inferenzjob für Qwen3 Coder Next	Jede unterstützte Region: 100 000	Ja	Die maximale Anzahl von Datensätzen in einer Eingabedatei in einem Batch-Inferenzjob für Qwen3 Coder Next.
Datensätze pro Eingabedatei pro Batch-Inferenzjob für Qwen3 Next 80B	Jede unterstützte Region: 100 000	Ja	Die maximale Anzahl von Datensätzen in einer Eingabedatei in einem Batch-Inferenzjob für Qwen3 Next 80B.
Datensätze pro Eingabedatei pro Batch-Inferenzjob für Qwen3 VL 235B	Jede unterstützte Region: 100 000	Ja	Die maximale Anzahl von Datensätzen in einer Eingabedatei in einem Batch-Inferenzjob für Qwen3 VL 235B.
Datensätze pro Eingabedatei pro Batch-Inferenzjob für Titan Multimodal Embeddings G1	Jede unterstützte Region: 100 000	Ja	Die maximale Anzahl von Datensätzen in einer Eingabedatei in einem Batch-Inferenzjob für Titan Multimodal Embeddings G1.
Datensätze pro Eingabedatei pro Batch-Inferenzjob für Titan Text Embeddings V2	Jede unterstützte Region: 100 000	Ja	Die maximale Anzahl von Datensätzen in einer Eingabedatei in einem Batch-Inferenzjob für Titan Text Embeddings V2.
Datensätze pro Eingabedatei pro Batch-Inferenzjob für Voxtral Mini 3B 2507	Jede unterstützte Region: 100 000	Ja	Die maximale Anzahl von Datensätzen in einer Eingabedatei in einem Batch-Inferenzjob für Voxtral Mini 3B 2507.
Datensätze pro Eingabedatei pro Batch-Inferenzjob für Voxtral Small 24B 2507	Jede unterstützte Region: 100 000	Ja	Die maximale Anzahl von Datensätzen in einer Eingabedatei in einem Batch-Inferenzjob für Voxtral Small 24B 2507.
Datensätze pro Eingabedatei pro Batch-Inferenzjob für Writer Palmyra Vision 7B	Jede unterstützte Region: 100 000	Ja	Die maximale Anzahl von Datensätzen in einer Eingabedatei in einem Batch-Inferenzjob für Writer Palmyra Vision 7B.
Summe der laufenden und eingereichten Batch-Inferenzaufträge unter Verwendung eines Basismodells für Amazon Nova 2 Multimodal Embeddings V1	Jede unterstützte Region: 100	Yes (Ja)	Die maximale Anzahl von laufenden und eingereichten Batch-Inferenzjobs unter Verwendung eines Basismodells für Amazon Nova 2 Multimodal Embeddings V1.
Summe der laufenden und eingereichten Batch-Inferenzaufträge unter Verwendung eines Basismodells für Amazon Nova Premier	Jede unterstützte Region: 100	Yes (Ja)	Die maximale Anzahl von laufenden und eingereichten Batch-Inferenzjobs unter Verwendung eines Basismodells für Amazon Nova Premier.
Summe der laufenden und eingereichten Batch-Inferenzaufträge unter Verwendung eines Basismodells für Claude 3 Haiku	Jede unterstützte Region: 100	Yes (Ja)	Die maximale Anzahl von laufenden und eingereichten Batch-Inferenzjobs unter Verwendung eines Basismodells für Claude-3-Haiku.
Summe der laufenden und eingereichten Batch-Inferenzjobs unter Verwendung eines Basismodells für Claude 3 Opus	Jede unterstützte Region: 100	Yes (Ja)	Die maximale Anzahl von laufenden und eingereichten Batch-Inferenzjobs unter Verwendung eines Basismodells für Claude 3 Opus.
Summe der laufenden und eingereichten Batch-Inferenzjobs unter Verwendung eines Basismodells für Claude 3 Sonnet	Jede unterstützte Region: 100	Yes (Ja)	Die maximale Anzahl von laufenden und eingereichten Batch-Inferenzjobs unter Verwendung eines Basismodells für Claude 3 Sonnet.
Summe der laufenden und eingereichten Batch-Inferenzjobs unter Verwendung eines Basismodells für Claude 3.5 Haiku	Jede unterstützte Region: 100	Yes (Ja)	Die maximale Anzahl von laufenden und eingereichten Batch-Inferenzjobs unter Verwendung eines Basismodells für Claude 3.5 Haiku.
Summe der laufenden und eingereichten Batch-Inferenzjobs unter Verwendung eines Basismodells für Claude 3.5 Sonnet	Jede unterstützte Region: 100	Yes (Ja)	Die maximale Anzahl von laufenden und eingereichten Batch-Inferenzjobs unter Verwendung eines Basismodells für Claude 3.5 Sonnet.
Summe der laufenden und eingereichten Batch-Inferenzjobs unter Verwendung eines Basismodells für Claude 3.5 Sonnet v2	Jede unterstützte Region: 100	Yes (Ja)	Die maximale Anzahl von laufenden und eingereichten Batch-Inferenzjobs unter Verwendung eines Basismodells für Claude 3.5 Sonnet v2.
Summe der laufenden und eingereichten Batch-Inferenzjobs unter Verwendung eines Basismodells für Claude 3.7 Sonnet	Jede unterstützte Region: 100	Yes (Ja)	Die maximale Anzahl von laufenden und eingereichten Batch-Inferenzjobs unter Verwendung eines Basismodells für Claude 3.7 Sonnet.
Summe der laufenden und eingereichten Batch-Inferenzjobs unter Verwendung eines Basismodells für Claude Haiku 4.5	Jede unterstützte Region: 100	Yes (Ja)	Die maximale Anzahl von laufenden und eingereichten Batch-Inferenzjobs unter Verwendung eines Basismodells für Claude Haiku 4.5.
Summe der laufenden und eingereichten Batch-Inferenzjobs unter Verwendung eines Basismodells für Claude Opus 4.5	Jede unterstützte Region: 100	Yes (Ja)	Die maximale Anzahl von laufenden und eingereichten Batch-Inferenzjobs unter Verwendung eines Basismodells für Claude Opus 4.5.
Summe der laufenden und eingereichten Batch-Inferenzjobs unter Verwendung eines Basismodells für Claude Opus 4.6	Jede unterstützte Region: 100	Yes (Ja)	Die maximale Anzahl von laufenden und eingereichten Batch-Inferenzjobs unter Verwendung eines Basismodells für Claude Opus 4.6.
Summe der laufenden und eingereichten Batch-Inferenzjobs unter Verwendung eines Basismodells für Claude Sonnet 4	Jede unterstützte Region: 100	Yes (Ja)	Die maximale Anzahl von laufenden und eingereichten Batch-Inferenzjobs unter Verwendung eines Basismodells für Claude Sonnet 4.
Summe der laufenden und eingereichten Batch-Inferenzjobs unter Verwendung eines Basismodells für Claude Sonnet 4.5.	Jede unterstützte Region: 100	Yes (Ja)	Die maximale Anzahl von laufenden und eingereichten Batch-Inferenzjobs unter Verwendung eines Basismodells für Claude Sonnet 4.5.
Summe der laufenden und eingereichten Batch-Inferenzjobs unter Verwendung eines Basismodells für Claude Sonnet 4.6	Jede unterstützte Region: 100	Yes (Ja)	Die maximale Anzahl von laufenden und eingereichten Batch-Inferenzjobs unter Verwendung eines Basismodells für Claude Sonnet 4.6.
Summe der laufenden und eingereichten Batch-Inferenzjobs unter Verwendung eines Basismodells für DeepSeek V3.2	Jede unterstützte Region: 100	Yes (Ja)	Die maximale Anzahl von laufenden und gesendeten Batch-Inferenzjobs unter Verwendung eines Basismodells für. DeepSeek V3.2
Summe der laufenden und gesendeten Batch-Inferenzjobs unter Verwendung eines Basismodells für v3 DeepSeek	Jede unterstützte Region: 100	Yes (Ja)	Die maximale Anzahl laufender und gesendeter Batch-Inferenzjobs unter Verwendung eines Basismodells für Version 3. DeepSeek
Summe der laufenden und eingereichten Batch-Inferenzjobs unter Verwendung eines Basismodells für Devstral 2 123B	Jede unterstützte Region: 100	Yes (Ja)	Die maximale Anzahl laufender und gesendeter Batch-Inferenzjobs unter Verwendung eines Basismodells für Devstral 2 123B.
Summe der laufenden und eingereichten Batch-Inferenzjobs unter Verwendung eines Basismodells für GLM 4.7	Jede unterstützte Region: 100	Yes (Ja)	Die maximale Anzahl von laufenden und eingereichten Batch-Inferenzjobs unter Verwendung eines Basismodells für GLM 4.7.
Summe der laufenden und eingereichten Batch-Inferenzjobs unter Verwendung eines Basismodells für GLM 4.7 Flash	Jede unterstützte Region: 100	Yes (Ja)	Die maximale Anzahl von laufenden und eingereichten Batch-Inferenzjobs unter Verwendung eines Basismodells für GLM 4.7 Flash.
Summe der laufenden und eingereichten Batch-Inferenzjobs unter Verwendung eines Basismodells für GLM 5	Jede unterstützte Region: 100	Yes (Ja)	Die maximale Anzahl von laufenden und eingereichten Batch-Inferenzjobs unter Verwendung eines Basismodells für GLM 5.
Summe der laufenden und eingereichten Batch-Inferenzjobs unter Verwendung eines Basismodells für Gemma 3 12B	Jede unterstützte Region: 100	Yes (Ja)	Die maximale Anzahl von laufenden und eingereichten Batch-Inferenzjobs unter Verwendung eines Basismodells für Gemma 3 12B.
Summe der laufenden und eingereichten Batch-Inferenzjobs unter Verwendung eines Basismodells für Gemma 3 27B	Jede unterstützte Region: 100	Yes (Ja)	Die maximale Anzahl von laufenden und eingereichten Batch-Inferenzjobs unter Verwendung eines Basismodells für Gemma 3 27B.
Summe der laufenden und eingereichten Batch-Inferenzjobs unter Verwendung eines Basismodells für Gemma 3 4B	Jede unterstützte Region: 100	Yes (Ja)	Die maximale Anzahl von laufenden und eingereichten Batch-Inferenzjobs unter Verwendung eines Basismodells für Gemma 3 4B.
Summe der laufenden und eingereichten Batch-Inferenzjobs unter Verwendung eines Basismodells für Kimi K2 Thinking	Jede unterstützte Region: 100	Yes (Ja)	Die maximale Anzahl von laufenden und eingereichten Batch-Inferenzjobs unter Verwendung eines Basismodells für Kimi K2 Thinking.
Summe der laufenden und eingereichten Batch-Inferenzjobs unter Verwendung eines Basismodells für Kimi K2.5	Jede unterstützte Region: 100	Yes (Ja)	Die maximale Anzahl von laufenden und eingereichten Batch-Inferenzjobs unter Verwendung eines Basismodells für Kimi. K2.5
Summe der laufenden und eingereichten Batch-Inferenzjobs unter Verwendung eines Basismodells für Llama 3.1 405B Instruct	Jede unterstützte Region: 100	Yes (Ja)	Die maximale Anzahl von laufenden und eingereichten Batch-Inferenzjobs unter Verwendung eines Basismodells für Llama 3.1 405B Instruct.
Summe der laufenden und eingereichten Batch-Inferenzjobs unter Verwendung eines Basismodells für Llama 3.1 70B Instruct	Jede unterstützte Region: 100	Yes (Ja)	Die maximale Anzahl laufender und gesendeter Batch-Inferenzjobs unter Verwendung eines Basismodells für Llama 3.1 70B Instruct.
Summe der laufenden und eingereichten Batch-Inferenzjobs unter Verwendung eines Basismodells für Llama 3.1 8B Instruct	Jede unterstützte Region: 100	Yes (Ja)	Die maximale Anzahl laufender und gesendeter Batch-Inferenzjobs unter Verwendung eines Basismodells für Llama 3.1 8B Instruct.
Summe der laufenden und eingereichten Batch-Inferenzjobs unter Verwendung eines Basismodells für Llama 3.2 11B Instruct	Jede unterstützte Region: 100	Yes (Ja)	Die maximale Anzahl laufender und gesendeter Batch-Inferenzjobs unter Verwendung eines Basismodells für Llama 3.2 11B Instruct.
Summe der laufenden und eingereichten Batch-Inferenzjobs unter Verwendung eines Basismodells für Llama 3.2 1B Instruct	Jede unterstützte Region: 100	Yes (Ja)	Die maximale Anzahl laufender und gesendeter Batch-Inferenzjobs unter Verwendung eines Basismodells für Llama 3.2 1B Instruct.
Summe der laufenden und eingereichten Batch-Inferenzjobs unter Verwendung eines Basismodells für Llama 3.2 3B Instruct	Jede unterstützte Region: 100	Yes (Ja)	Die maximale Anzahl von laufenden und eingereichten Batch-Inferenzjobs unter Verwendung eines Basismodells für Llama 3.2 3B Instruct.
Summe der laufenden und eingereichten Batch-Inferenzjobs unter Verwendung eines Basismodells für Llama 3.2 90B Instruct	Jede unterstützte Region: 100	Yes (Ja)	Die maximale Anzahl laufender und gesendeter Batch-Inferenzjobs unter Verwendung eines Basismodells für Llama 3.2 90B Instruct.
Summe der laufenden und eingereichten Batch-Inferenzjobs unter Verwendung eines Basismodells für Llama 3.3 70B Instruct	Jede unterstützte Region: 100	Yes (Ja)	Die maximale Anzahl laufender und gesendeter Batch-Inferenzjobs unter Verwendung eines Basismodells für Llama 3.3 70B Instruct.
Summe der laufenden und eingereichten Batch-Inferenzjobs unter Verwendung eines Basismodells für Llama 4 Maverick	Jede unterstützte Region: 100	Yes (Ja)	Die maximale Anzahl laufender und gesendeter Batch-Inferenzjobs unter Verwendung eines Basismodells für Llama 4 Maverick.
Summe der laufenden und eingereichten Batch-Inferenzjobs unter Verwendung eines Basismodells für Llama 4 Scout	Jede unterstützte Region: 100	Yes (Ja)	Die maximale Anzahl von laufenden und eingereichten Batch-Inferenzjobs unter Verwendung eines Basismodells für Llama 4 Scout.
Summe der laufenden und eingereichten Batch-Inferenzjobs unter Verwendung eines Basismodells für Magistral Small 2509	Jede unterstützte Region: 100	Yes (Ja)	Die maximale Anzahl von laufenden und eingereichten Batch-Inferenzjobs unter Verwendung eines Basismodells für Magistral Small 2509.
Summe der laufenden und eingereichten Batch-Inferenzjobs unter Verwendung eines Basismodells für M2 MiniMax	Jede unterstützte Region: 100	Yes (Ja)	Die maximale Anzahl von laufenden und eingereichten Batch-Inferenzjobs unter Verwendung eines Basismodells für M2. MiniMax
Summe der laufenden und eingereichten Batch-Inferenzjobs unter Verwendung eines Basismodells für MiniMax M2.1	Jede unterstützte Region: 100	Yes (Ja)	Die maximale Anzahl von laufenden und gesendeten Batch-Inferenzjobs unter Verwendung eines Basismodells für. MiniMax M2.1
Summe der laufenden und gesendeten Batch-Inferenzjobs unter Verwendung eines Basismodells für MiniMax M2.5	Jede unterstützte Region: 100	Yes (Ja)	Die maximale Anzahl von laufenden und gesendeten Batch-Inferenzjobs unter Verwendung eines Basismodells für. MiniMax M2.5
Summe der laufenden und eingereichten Batch-Inferenzjobs unter Verwendung eines Basismodells für Ministral 3 14B	Jede unterstützte Region: 100	Yes (Ja)	Die maximale Anzahl von laufenden und eingereichten Batch-Inferenzjobs unter Verwendung eines Basismodells für Ministral 3 14B.
Summe der laufenden und eingereichten Batch-Inferenzjobs unter Verwendung eines Basismodells für Ministral 3 8B	Jede unterstützte Region: 100	Yes (Ja)	Die maximale Anzahl von laufenden und eingereichten Batch-Inferenzjobs unter Verwendung eines Basismodells für Ministral 3 8B.
Summe der laufenden und eingereichten Batch-Inferenzjobs unter Verwendung eines Basismodells für Ministral 3B	Jede unterstützte Region: 100	Yes (Ja)	Die maximale Anzahl von laufenden und eingereichten Batch-Inferenzjobs unter Verwendung eines Basismodells für Ministry 3B.
Summe der laufenden und eingereichten Batch-Inferenzjobs unter Verwendung eines Basismodells für Mistral Large 2 (24.07)	Jede unterstützte Region: 100	Yes (Ja)	Die maximale Anzahl laufender und gesendeter Batch-Inferenzjobs unter Verwendung eines Basismodells für Mistral Large 2 (24.07).
Summe der laufenden und eingereichten Batch-Inferenzjobs unter Verwendung eines Basismodells für Mistral Large 3	Jede unterstützte Region: 100	Yes (Ja)	Die maximale Anzahl laufender und gesendeter Batch-Inferenzjobs unter Verwendung eines Basismodells für Mistral Large 3.
Summe der laufenden und eingereichten Batch-Inferenzjobs unter Verwendung eines Basismodells für Mistral Small	Jede unterstützte Region: 100	Yes (Ja)	Die maximale Anzahl von laufenden und eingereichten Batch-Inferenzjobs unter Verwendung eines Basismodells für Mistral Small.
Summe der laufenden und eingereichten Batch-Inferenzjobs unter Verwendung eines Basismodells für NVIDIA Nemotron 3 Super 120B A12B	Jede unterstützte Region: 100	Yes (Ja)	Die maximale Anzahl von laufenden und eingereichten Batch-Inferenzjobs unter Verwendung eines Basismodells für NVIDIA Nemotron 3 Super 120B A12B.
Summe der laufenden und eingereichten Batch-Inferenzjobs unter Verwendung eines Basismodells für NVIDIA Nemotron Nano 12B	Jede unterstützte Region: 100	Yes (Ja)	Die maximale Anzahl von laufenden und eingereichten Batch-Inferenzjobs unter Verwendung eines Basismodells für NVIDIA Nemotron Nano 12B.
Summe der laufenden und eingereichten Batch-Inferenzjobs unter Verwendung eines Basismodells für NVIDIA Nemotron Nano 3 30B	Jede unterstützte Region: 100	Yes (Ja)	Die maximale Anzahl von laufenden und eingereichten Batch-Inferenzjobs unter Verwendung eines Basismodells für NVIDIA Nemotron Nano 3 30B.
Summe der laufenden und eingereichten Batch-Inferenzjobs unter Verwendung eines Basismodells für NVIDIA Nemotron Nano 9B	Jede unterstützte Region: 100	Yes (Ja)	Die maximale Anzahl von laufenden und eingereichten Batch-Inferenzjobs unter Verwendung eines Basismodells für NVIDIA Nemotron Nano 9B.
Summe der laufenden und eingereichten Batch-Inferenzjobs unter Verwendung eines Basismodells für Nova 2 Lite	Jede unterstützte Region: 100	Yes (Ja)	Die maximale Anzahl von laufenden und eingereichten Batch-Inferenzjobs unter Verwendung eines Basismodells für Nova 2 Lite.
Summe der laufenden und eingereichten Batch-Inferenzjobs unter Verwendung eines Basismodells für Nova Lite V1	Jede unterstützte Region: 100	Yes (Ja)	Die maximale Anzahl von laufenden und eingereichten Batch-Inferenzjobs unter Verwendung eines Basismodells für Nova Lite V1.
Summe der laufenden und eingereichten Batch-Inferenzjobs unter Verwendung eines Basismodells für Nova Micro V1	Jede unterstützte Region: 100	Yes (Ja)	Die maximale Anzahl von laufenden und eingereichten Batch-Inferenzjobs unter Verwendung eines Basismodells für Nova Micro V1.
Summe der laufenden und eingereichten Batch-Inferenzjobs unter Verwendung eines Basismodells für Nova Pro V1	Jede unterstützte Region: 100	Yes (Ja)	Die maximale Anzahl von laufenden und eingereichten Batch-Inferenzjobs unter Verwendung eines Basismodells für Nova Pro V1.
Summe der laufenden und eingereichten Batch-Inferenzjobs unter Verwendung eines Basismodells für OpenAI GPT OSS 120b	Jede unterstützte Region: 100	Yes (Ja)	Die maximale Anzahl laufender und gesendeter Batch-Inferenzjobs unter Verwendung eines Basismodells für OpenAI GPT OSS 120b.
Summe der laufenden und eingereichten Batch-Inferenzjobs unter Verwendung eines Basismodells für OpenAI GPT OSS 20b	Jede unterstützte Region: 100	Yes (Ja)	Die maximale Anzahl laufender und gesendeter Batch-Inferenzjobs unter Verwendung eines Basismodells für OpenAI GPT OSS 20b.
Summe der laufenden und eingereichten Batch-Inferenzjobs unter Verwendung eines Basismodells für OpenAI GPT OSS Safeguard 120b	Jede unterstützte Region: 100	Yes (Ja)	Die maximale Anzahl laufender und gesendeter Batch-Inferenzjobs unter Verwendung eines Basismodells für OpenAI GPT OSS Safeguard 120b.
Summe der laufenden und eingereichten Batch-Inferenzjobs unter Verwendung eines Basismodells für OpenAI GPT OSS Safeguard 20b	Jede unterstützte Region: 100	Yes (Ja)	Die maximale Anzahl laufender und gesendeter Batch-Inferenzjobs unter Verwendung eines Basismodells für OpenAI GPT OSS Safeguard 20b.
Summe der laufenden und eingereichten Batch-Inferenzjobs unter Verwendung eines Basismodells für Qwen3 235B	Jede unterstützte Region: 100	Yes (Ja)	Die maximale Anzahl laufender und gesendeter Batch-Inferenzjobs unter Verwendung eines Basismodells für Qwen3 235B.
Summe der laufenden und eingereichten Batch-Inferenzjobs unter Verwendung eines Basismodells für Qwen3 32B	Jede unterstützte Region: 100	Yes (Ja)	Die maximale Anzahl laufender und gesendeter Batch-Inferenzjobs unter Verwendung eines Basismodells für Qwen3 32B.
Summe der laufenden und eingereichten Batch-Inferenzjobs unter Verwendung eines Basismodells für Qwen3 Coder 30B	Jede unterstützte Region: 100	Yes (Ja)	Die maximale Anzahl laufender und gesendeter Batch-Inferenzjobs unter Verwendung eines Basismodells für Qwen3 Coder 30B.
Summe der laufenden und eingereichten Batch-Inferenzjobs unter Verwendung eines Basismodells für Qwen3 Coder 480B	Jede unterstützte Region: 100	Yes (Ja)	Die maximale Anzahl laufender und gesendeter Batch-Inferenzjobs unter Verwendung eines Basismodells für Qwen3 Coder 480B.
Summe der laufenden und eingereichten Batch-Inferenzjobs unter Verwendung eines Basismodells für Qwen3 Coder Next	Jede unterstützte Region: 100	Yes (Ja)	Die maximale Anzahl laufender und gesendeter Batch-Inferenzjobs unter Verwendung eines Basismodells für Qwen3 Coder Next.
Summe der laufenden und eingereichten Batch-Inferenzjobs unter Verwendung eines Basismodells für Qwen3 Next 80B	Jede unterstützte Region: 100	Yes (Ja)	Die maximale Anzahl laufender und gesendeter Batch-Inferenzjobs unter Verwendung eines Basismodells für Qwen3 Next 80B.
Summe der laufenden und eingereichten Batch-Inferenzjobs unter Verwendung eines Basismodells für Qwen3 VL 235B	Jede unterstützte Region: 100	Yes (Ja)	Die maximale Anzahl laufender und gesendeter Batch-Inferenzjobs unter Verwendung eines Basismodells für Qwen3 VL 235B.
Summe der laufenden und eingereichten Batch-Inferenzjobs unter Verwendung eines Basismodells für Titan Multimodal Embeddings G1	Jede unterstützte Region: 100	Yes (Ja)	Die maximale Anzahl von laufenden und eingereichten Batch-Inferenzjobs unter Verwendung eines Basismodells für Titan Multimodal Embeddings G1.
Summe der laufenden und eingereichten Batch-Inferenzjobs unter Verwendung eines Basismodells für Titan Text Embeddings V2	Jede unterstützte Region: 100	Yes (Ja)	Die maximale Anzahl von laufenden und eingereichten Batch-Inferenzjobs unter Verwendung eines Basismodells für Titan Text Embeddings V2.
Summe der laufenden und eingereichten Batch-Inferenzjobs unter Verwendung eines Basismodells für Voxtral Mini 3B 2507	Jede unterstützte Region: 100	Yes (Ja)	Die maximale Anzahl von laufenden und eingereichten Batch-Inferenzjobs unter Verwendung eines Basismodells für Voxtral Mini 3B 2507.
Summe der laufenden und eingereichten Batch-Inferenzjobs unter Verwendung eines Basismodells für Voxtral Small 24B 2507	Jede unterstützte Region: 100	Yes (Ja)	Die maximale Anzahl von laufenden und eingereichten Batch-Inferenzjobs unter Verwendung eines Basismodells für Voxtral Small 24B 2507.
Summe der laufenden und eingereichten Batch-Inferenzjobs unter Verwendung eines Basismodells für Writer Palmyra Vision 7B	Jede unterstützte Region: 100	Yes (Ja)	Die maximale Anzahl von laufenden und eingereichten Batch-Inferenzjobs unter Verwendung eines Basismodells für Writer Palmyra Vision 7B.
Summe der laufenden und eingereichten Batch-Inferenzjobs unter Verwendung eines benutzerdefinierten Modells für Titan Multimodal Embeddings G1	Jede unterstützte Region: 3	Nein	Die maximale Anzahl von laufenden und eingereichten Batch-Inferenzjobs unter Verwendung eines benutzerdefinierten Modells für Titan Multimodal Embeddings G1.
Summe der laufenden und eingereichten Batch-Inferenzjobs unter Verwendung eines benutzerdefinierten Modells für Titan Text Embeddings V2	Jede unterstützte Region: 3	Nein	Die maximale Anzahl von laufenden und eingereichten Batch-Inferenzjobs unter Verwendung eines benutzerdefinierten Modells für Titan Text Embeddings V2
Begrenzung der Drosselrate für Bedrock Data Automation Runtime: ListTagsForResource	Jede unterstützte Region: 25 pro Sekunde	Nein	Die maximale Anzahl von Bedrock Data Automation Runtime: ListTagsForResource Anfragen, die Sie pro Sekunde und Konto in der aktuellen Region stellen können
Begrenzung der Drosselrate für Bedrock Data Automation Runtime: TagResource	Jede unterstützte Region: 25 pro Sekunde	Nein	Die maximale Anzahl von Bedrock Data Automation Runtime: TagResource Anfragen, die Sie pro Sekunde und Konto in der aktuellen Region stellen können
Begrenzung der Drosselrate für Bedrock Data Automation Runtime: UntagResource	Jede unterstützte Region: 25 pro Sekunde	Nein	Die maximale Anzahl von Bedrock Data Automation Runtime: UntagResource Anfragen, die Sie pro Sekunde und Konto in der aktuellen Region stellen können
Begrenzung der Drosselrate für Bedrock Data Automation: ListTagsForResource	Jede unterstützte Region: 25 pro Sekunde	Nein	Die maximale Anzahl von Bedrock Data Automation: ListTagsForResource Anfragen, die Sie pro Sekunde und Konto in der aktuellen Region stellen können
Begrenzung der Drosselrate für Bedrock Data Automation: TagResource	Jede unterstützte Region: 25 pro Sekunde	Nein	Die maximale Anzahl von Bedrock Data Automation: TagResource Anfragen, die Sie pro Sekunde und Konto in der aktuellen Region stellen können
Begrenzung der Drosselrate für Bedrock Data Automation: UntagResource	Jede unterstützte Region: 25 pro Sekunde	Nein	Die maximale Anzahl von Bedrock Data Automation: UntagResource Anfragen, die Sie pro Sekunde und Konto in der aktuellen Region stellen können
Begrenzung der Drosselrate für CreateBlueprint	Jede unterstützte Region: 5 pro Sekunde	Nein	Die maximale Anzahl von CreateBlueprint Anfragen, die Sie pro Sekunde und Konto in der aktuellen Region stellen können
Begrenzung der Drosselrate für CreateBlueprintVersion	Jede unterstützte Region: 5 pro Sekunde	Nein	Die maximale Anzahl von CreateBlueprintVersion Anfragen, die Sie pro Sekunde und Konto in der aktuellen Region stellen können
Begrenzung der Drosselrate für CreateDataAutomationLibrary	Jede unterstützte Region: 3 pro Sekunde	Nein	Die maximale Anzahl von CreateDataAutomationLibrary Anfragen, die Sie pro Sekunde und Konto in der aktuellen Region stellen können
Begrenzung der Drosselrate für CreateDataAutomationProject	Jede unterstützte Region: 5 pro Sekunde	Nein	Die maximale Anzahl von CreateDataAutomationProject Anfragen, die Sie pro Sekunde und Konto in der aktuellen Region stellen können
Begrenzung der Drosselrate für DeleteBlueprint	Jede unterstützte Region: 5 pro Sekunde	Nein	Die maximale Anzahl von DeleteBlueprint Anfragen, die Sie pro Sekunde und Konto in der aktuellen Region stellen können
Begrenzung der Drosselrate für DeleteDataAutomationLibrary	Jede unterstützte Region: 3 pro Sekunde	Nein	Die maximale Anzahl von DeleteDataAutomationLibrary Anfragen, die Sie pro Sekunde und Konto in der aktuellen Region stellen können
Begrenzung der Drosselrate für DeleteDataAutomationProject	Jede unterstützte Region: 5 pro Sekunde	Nein	Die maximale Anzahl von DeleteDataAutomationProject Anfragen, die Sie pro Sekunde und Konto in der aktuellen Region stellen können
Begrenzung der Drosselrate für GetBlueprint	Jede unterstützte Region: 5 pro Sekunde	Nein	Die maximale Anzahl von GetBlueprint Anfragen, die Sie pro Sekunde und Konto in der aktuellen Region stellen können
Begrenzung der Drosselrate für GetDataAutomationLibrary	Jede unterstützte Region: 5 pro Sekunde	Nein	Die maximale Anzahl von GetDataAutomationLibrary Anfragen, die Sie pro Sekunde und Konto in der aktuellen Region stellen können
Begrenzung der Drosselrate für GetDataAutomationLibraryEntity	Jede unterstützte Region: 5 pro Sekunde	Nein	Die maximale Anzahl von GetDataAutomationLibraryEntity Anfragen, die Sie pro Sekunde und Konto in der aktuellen Region stellen können
Begrenzung der Drosselrate für GetDataAutomationLibraryIngestionJob	Jede unterstützte Region: 5 pro Sekunde	Nein	Die maximale Anzahl von GetDataAutomationLibraryIngestionJob Anfragen, die Sie pro Sekunde und Konto in der aktuellen Region stellen können
Begrenzung der Drosselrate für GetDataAutomationProject	Jede unterstützte Region: 5 pro Sekunde	Nein	Die maximale Anzahl von GetDataAutomationProject Anfragen, die Sie pro Sekunde und Konto in der aktuellen Region stellen können
Begrenzung der Drosselrate für GetDataAutomationStatus	Jede unterstützte Region: 10 pro Sekunde	Nein	Die maximale Anzahl von GetDataAutomationStatus Anfragen, die Sie pro Sekunde und Konto in der aktuellen Region stellen können
Begrenzung der Drosselrate für InvokeDataAutomationAsync	Jede unterstützte Region: 10 pro Sekunde	Nein	Die maximale Anzahl von InvokeDataAutomationAsync Anfragen, die Sie pro Sekunde und Konto in der aktuellen Region stellen können
Begrenzung der Drosselrate für InvokeDataAutomationLibraryIngestionJob	Jede unterstützte Region: 5 pro Sekunde	Nein	Die maximale Anzahl von InvokeDataAutomationLibraryIngestionJob Anfragen, die Sie pro Sekunde und Konto in der aktuellen Region stellen können
Begrenzung der Drosselrate für ListBlueprints	Jede unterstützte Region: 5 pro Sekunde	Nein	Die maximale Anzahl von ListBlueprints Anfragen, die Sie pro Sekunde und Konto in der aktuellen Region stellen können
Begrenzung der Drosselrate für ListDataAutomationLibraries	Jede unterstützte Region: 5 pro Sekunde	Nein	Die maximale Anzahl von ListDataAutomationLibraries Anfragen, die Sie pro Sekunde und Konto in der aktuellen Region stellen können
Begrenzung der Drosselrate für ListDataAutomationLibraryEntities	Jede unterstützte Region: 5 pro Sekunde	Nein	Die maximale Anzahl von ListDataAutomationLibraryEntities Anfragen, die Sie pro Sekunde und Konto in der aktuellen Region stellen können
Begrenzung der Drosselrate für ListDataAutomationLibraryIngestionJobs	Jede unterstützte Region: 5 pro Sekunde	Nein	Die maximale Anzahl von ListDataAutomationLibraryIngestionJobs Anfragen, die Sie pro Sekunde und Konto in der aktuellen Region stellen können
Grenzwert für die Drosselungsrate ListDataAutomationProjects	Jede unterstützte Region: 5 pro Sekunde	Nein	Die maximale Anzahl von ListDataAutomationProjects Anfragen, die Sie pro Sekunde und Konto in der aktuellen Region stellen können
Grenzwert für die Drosselungsrate UpdateBlueprint	Jede unterstützte Region: 5 pro Sekunde	Nein	Die maximale Anzahl von UpdateBlueprint Anfragen, die Sie pro Sekunde und Konto in der aktuellen Region stellen können
Grenzwert für die Drosselungsrate UpdateDataAutomationLibrary	Jede unterstützte Region: 5 pro Sekunde	Nein	Die maximale Anzahl von UpdateDataAutomationLibrary Anfragen, die Sie pro Sekunde und Konto in der aktuellen Region stellen können
Grenzwert für die Drosselungsrate UpdateDataAutomationProject	Jede unterstützte Region: 5 pro Sekunde	Nein	Die maximale Anzahl von UpdateDataAutomationProject Anfragen, die Sie pro Sekunde und Konto in der aktuellen Region stellen können
UpdateAgent Anfragen pro Sekunde	Jede unterstützte Region: 4	Nein	Die maximale Anzahl von UpdateAgent API-Anfragen pro Sekunde.
UpdateAgentActionGroup Anfragen pro Sekunde	Jede unterstützte Region: 6	Nein	Die maximale Anzahl von UpdateAgentActionGroup API-Anfragen pro Sekunde.
UpdateAgentAlias Anfragen pro Sekunde	Jede unterstützte Region: 2	Nein	Die maximale Anzahl von UpdateAgentAlias API-Anfragen pro Sekunde.
UpdateAgentKnowledgeBase Anfragen pro Sekunde	Jede unterstützte Region: 4	Nein	Die maximale Anzahl von UpdateAgentKnowledgeBase API-Anfragen pro Sekunde.
[bedrock-mantle endpoint] Eingabe-Token pro Minute für Claude Opus 4.7	Jede unterstützte Region: 20 000 000	Ja	[bedrock-mantle endpoint] Die maximale Anzahl von Eingabe-Token pro Minute, die Ihr Konto in dieser Region an Claude Opus 4.7 senden kann. Wird von allen APIs für dieses Modell gemeinsam genutzt.
[Bedrock-Mantle-Endpunkt] Eingabetoken pro Minute für Claude Opus 4.8	Jede unterstützte Region: 20 000 000	Ja	[bedrock-mantle endpoint] Die maximale Anzahl von Eingabe-Token pro Minute, die Ihr Konto in dieser Region an Claude Opus 4.8 senden kann. Wird von allen APIs für dieses Modell gemeinsam genutzt.
[Bedrock-Mantle-Endpunkt] Eingabe-Token pro Minute für GPT-5.4	Jede unterstützte Region: 20 000 000	Ja	[bedrock-mantle endpoint] Die maximale Anzahl von Eingabe-Token pro Minute, an die Ihr Konto in dieser Region Daten senden kann. GPT-5.4 Wird von allen APIs für dieses Modell gemeinsam genutzt.
[Bedrock-Mantle-Endpunkt] Eingabe-Token pro Minute für GPT-5.5	Jede unterstützte Region: 10 000 000	Ja	[bedrock-mantle endpoint] Die maximale Anzahl von Eingabe-Token pro Minute, an die Ihr Konto in dieser Region Daten senden kann. GPT-5.5 Wird von allen APIs für dieses Modell gemeinsam genutzt.
[Bedrock-Mantle-Endpunkt] Ausgabetoken pro Minute für Claude Opus 4.7	Jede unterstützte Region: 2.000.000	Ja	[bedrock-mantle endpoint] Die maximale Anzahl von Ausgabetokens pro Minute, die Claude Opus 4.7 für Ihr Konto in dieser Region generieren kann. Wird von allen APIs für dieses Modell gemeinsam genutzt.
[Bedrock-Mantle-Endpunkt] Ausgabetoken pro Minute für Claude Opus 4.8	Jede unterstützte Region: 2.000.000	Ja	[bedrock-mantle endpoint] Die maximale Anzahl von Ausgabetokens pro Minute, die Claude Opus 4.8 für Ihr Konto in dieser Region generieren kann. Wird von allen APIs für dieses Modell gemeinsam genutzt.
[Bedrock-Mantle-Endpunkt] Ausgabe-Token pro Minute für GPT-5.4	Jede unterstützte Region: 2.000.000	Ja	[bedrock-mantle endpoint] Die maximale Anzahl von Ausgabetokens, die pro Minute für Ihr Konto in dieser GPT-5.4 Region generiert werden können. Wird von allen APIs für dieses Modell gemeinsam genutzt.
[Bedrock-Mantle-Endpunkt] Ausgabe-Token pro Minute für GPT-5.5	Jede unterstützte Region: 1 000 000	Ja	[bedrock-mantle endpoint] Die maximale Anzahl von Ausgabetokens, die pro Minute für Ihr Konto in dieser GPT-5.5 Region generiert werden können. Wird von allen APIs für dieses Modell gemeinsam genutzt.

Anmerkung

Sie können eine Kontingenterhöhung für Ihr Konto anfordern, indem Sie die folgenden Schritte ausführen:

Wenn ein Kontingent mit Ja markiert ist, können Sie es anpassen, indem Sie die Schritte unter Anfordern einer Kontingenterhöhung im Benutzerhandbuch zu Service Quotas befolgen.
Wenn ein Kontingent mit Nein gekennzeichnet ist, können Sie über das Formular zur Erhöhung des Limits eine Anfrage einreichen, um für eine Erhöhung in Betracht gezogen zu werden.
Für jedes Modell können Sie eine Erhöhung für die folgenden Kontingente gemeinsam anfordern:
- Cross-Region InvokeModel Tokens pro Minute für ${model}
- Cross-Region InvokeModel Anfragen pro Minute für ${model}
- On-demand InvokeModel Tokens pro Minute für ${model}
- On-demand InvokeModel Anfragen pro Minute für ${model}
Um eine Erhöhung für eine beliebige Kombination dieser Kontingente zu beantragen, fordern Sie eine Erhöhung der Cross-Region InvokeModel Tokens pro Minute für das ${model} Kontingent an, indem Sie die Schritte unter Anfrage einer Kontingenterhöhung im Servicekontingents-Benutzerhandbuch befolgen. Sobald Sie dies getan haben, wird sich das Support-Team mit Ihnen in Verbindung setzen und Ihnen die Möglichkeit anbieten, auch die anderen drei Kontingente zu erhöhen. Aufgrund der hohen Nachfrage werden Kunden bevorzugt behandelt, deren Datenverkehr das ihnen zugewiesene Kontingent überschreitet. Ihre Anfrage wird möglicherweise abgelehnt, wenn Sie diese Bedingung nicht erfüllen.

Warnung JavaScript ist in Ihrem Browser nicht verfügbar oder deaktiviert.

Zur Nutzung der AWS-Dokumentation muss JavaScript aktiviert sein. Weitere Informationen finden auf den Hilfe-Seiten Ihres Browsers.

Dokumentkonventionen

AWS Batch

Amazon Grundgestein AgentCore