Kontingente für Amazon Bedrock

Ihr AWS-Konto hat Standardkontingente, früher als Limits bezeichnet, für Amazon Bedrock. Führen Sie einen der folgenden Schritte aus, um Service Quotas für Amazon Bedrock anzuzeigen:

Folgen Sie den Schritten unter Service Quotas anzeigen und wählen Sie Amazon Bedrock als Service aus.
Weitere Informationen zu den Amazon-Bedrock-Servicekontingenten finden Sie in der Allgemeine AWS-Referenz.

Die Modellinferenz in Amazon Bedrock wird durch Kontingente für die Token-Nutzung gesteuert. Einige Modelle verwenden Tokens mit einer höheren Rate. Weitere Informationen zu diesen Raten und dazu, wie Sie Ihre Token-Nutzung optimieren können, finden Sie unter So werden Token in Amazon Bedrock gezählt.

Amazon Bedrock bietet zwei Inferenzendpunkte — bedrock-runtime und bedrock-mantle — jeweils mit eigenen Kontingentzuweisungen pro Modell. Der Datenverkehr zu den beiden Endpunkten wird anhand separater Kontingente nachverfolgt, auch wenn dasselbe zugrunde liegende Modell aufgerufen wird. Details dazu finden Sie unter Kontingente für den Bedrock-Runtime-Endpunkt und Kontingente für den Endpunkt „Bedrock-Mantle“.

Um die Leistung des Service aufrechtzuerhalten und eine angemessene Nutzung von Amazon Bedrock sicherzustellen, können die einem Konto zugewiesenen Standardkontingente je nach regionalen Faktoren, Zahlungsverlauf, betrügerischer Nutzung und and/or Genehmigung einer Anfrage zur Erhöhung des Kontingents aktualisiert werden.

Themen

Warnung JavaScript ist in Ihrem Browser nicht verfügbar oder deaktiviert.

Zur Nutzung der AWS-Dokumentation muss JavaScript aktiviert sein. Weitere Informationen finden auf den Hilfe-Seiten Ihres Browsers.

Dokumentkonventionen

Codebeispiele

Token-Zählung