Kontingente für Amazon Bedrock - Amazon Bedrock

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Kontingente für Amazon Bedrock

Ihr AWS-Konto hat Standardkontingente, früher als Limits bezeichnet, für Amazon Bedrock. Um Servicekontingente für Amazon Bedrock anzuzeigen, folgen Sie den Schritten unter Servicekontingente anzeigen und wählen Sie Amazon Bedrock als Service aus. Einige Kontingente unterscheiden sich je nach Modell. Sofern nicht anders angegeben, gilt ein Kontingent für alle Versionen eines Modells.

Um die Leistung des Service aufrechtzuerhalten und eine angemessene Nutzung von Amazon Bedrock sicherzustellen, können die einem Konto zugewiesenen Standardkontingente je nach regionalen Faktoren, Zahlungsverlauf, betrügerischer Nutzung und/oder Genehmigung einer Anfrage zur Erhöhung des Kontingents aktualisiert werden.

Sie können eine Erhöhung des Kontingents für Ihr Konto beantragen, indem Sie die folgenden Schritte ausführen:

  • Wenn ein Kontingent in den folgenden Tabellen in der Spalte Anpassbar durch Servicekontingente als Ja markiert ist, können Sie es anpassen, indem Sie die Schritte unter Eine Kontingenterhöhung beantragen im Benutzerhandbuch für Servicekontingente im Servicekontingenta-Benutzerhandbuch befolgen.

  • Wenn ein Kontingent in den folgenden Tabellen in der Spalte „Durch Servicekontingente anpassbar“ als Nein markiert ist, können Sie eine Erhöhung des Kontingents möglicherweise auf eine der folgenden Arten beantragen:

    • Wenn Sie eine Erhöhung des Kontingents für ein Runtime-Kontingent beantragen möchten, wenden Sie sich an Ihren AWS-Konto Manager. Wenn Sie keinen AWS-Konto Manager haben, können Sie Ihr Kontingent derzeit nicht erhöhen.

    • Wenn Sie weitere Kontingenterhöhungen beantragen möchten, reichen Sie über das Formular zur Erhöhung des Limits einen Antrag ein, um für eine Erhöhung in Betracht gezogen zu werden.

    Anmerkung

    Aufgrund der überwältigenden Nachfrage wird Kunden Vorrang eingeräumt, die Traffic generieren, der ihr vorhandenes Kontingent verbraucht. Ihre Anfrage wird möglicherweise abgelehnt, wenn Sie diese Bedingung nicht erfüllen.

Wählen Sie ein Thema aus, um mehr über die dafür vorgesehenen globalen Standardkontingente zu erfahren. Sofern nicht anders angegeben, sind alle globalen und regionalen Kontingente identisch.

Bei der Durchführung einer Modellinferenz gelten die folgenden Kontingente. Diese Kontingente berücksichtigen die kombinierte Summe für Converse, ConverseStreamInvokeModel, und InvokeModelWithResponseStreamAnfragen. Die Inferenzlatenz unterscheidet sich je nach Modell und ist direkt proportional zur Anzahl der Eingabe- und Ausgabetokens und der Gesamtzahl der laufenden On-Demand-Anfragen aller Kunden zu diesem Zeitpunkt. Für einen garantierten Durchsatz empfehlen wir Ihnen, Provisioned Throughput auszuprobieren.

Modell Anzahl der pro Minute verarbeiteten Anfragen Anzahl der pro Minute verarbeiteten Token Regionen Einstellbar durch Service Quotas
AI21 Labs Jurassic-2 Mid 400 300,000 us-east-1 Nein
AI21 Labs Jurassic-2 Ultra 100 300,000 Alle Nein
AI21 Jamba-Instruct 100 300,000 Alle Nein
Amazon Titan Embeddings G1 - Text 2.000 300,000 Alle Nein
Amazon Titan Text Embeddings V2 2.000 300,000 Alle Nein
Amazon Titan Image Generator G1 V1 60 N/A Alle Nein
Amazon Titan Image Generator G1 V2 60 N/A Alle Nein
Amazon Titan Multimodal Embeddings G1 2.000 300,000 Alle Nein
Amazon Titan Text G1 - Express 400 300,000 Alle Nein
Amazon Titan Text G1 - Lite 800 300,000 Alle Nein
Amazon Titan Text Premier 100 300,000 Alle Nein
Anthropic Claude Instant 1.000 1 000 000

us-east-1

us-west-2

Nein
400 300,000 Andere Regionen
AnthropicClaude2.x 500 500 000

us-east-1

us-west-2

Nein
100 200 000 Andere Regionen
Anthropic Claude 3 Sonnet 500 1 000 000

us-east-1

us-west-2

Nein
100 200 000 Andere Regionen
Anthropic Claude 3 Haiku 1.000 2.000.000

us-east-1

us-west-2

Nein
200 200 000

ap-northeast-1

ap-southeast-1

400 300,000 Andere Regionen
Anthropic Claude 3.5 Sonnet 250 2.000.000 us-west-2 Nein
20 200 000

ap-northeast-1

ap-southeast-1

eu-central-1

Nein
50 400 000 Andere Regionen Nein
Anthropic Claude 3 Opus 50 400 000 Alle Nein
Cohere Command R 400 300,000 Alle Nein
Cohere Command R+ 400 300,000 Alle Nein
Cohere Command 400 300,000 Alle Nein
Cohere Command Light 800 300,000 Alle Nein
CohereEmbed(Englisch) 2.000 300,000 Alle Nein
CohereEmbed(Mehrsprachig) 2.000 300,000 Alle Nein
MetaLlama 213B 800 300,000 Alle Nein
MetaLlama 270 B 400 300,000 Alle Nein
Meta Llama 3 8B Instruct 800 300,000 Alle Nein
Meta Llama 3 70B Instruct 400 300,000 Alle Nein
Meta Llama 3.1 8B Instruct 800 300,000 us-west-2 Nein
Meta Llama 3.1 70B Instruct 400 300,000 us-west-2 Nein
Meta Llama 3.1 405B Instruct 50 400 000 us-west-2 Nein
Mistral AI Mistral 7B Instruct 800 300,000 Alle Nein
Mistral AI Mixtral 8X7B Instruct 400 300,000 Alle Nein
Mistral AI Mistral Large 400 300,000 Alle Nein
Mistral AI Mistral Large 2 (24.07) 400 300,000 us-west-2 Nein
Mistral AI Mistral Small 400 300,000 Alle Nein
Stable Diffusion XL 60 N/A Alle Nein

Die folgende Tabelle zeigt die maximale Anzahl von API Anfragen, die pro Sekunde für verschiedene API Operationen in Amazon Bedrock zulässig sind:

Funktion APIBetrieb Maximale Anzahl Anfragen pro Sekunde
N/A Converse 200
ConverseStream 200
DeleteModelInvocationLoggingConfiguration 1
GetFoundationModel 10
GetModelInvocationLoggingConfiguration 10
InvokeModel 200
InvokeModelWithResponseStream 200
ListFoundationModels 10
ListTagsForResource 20
PutModelInvocationLoggingConfiguration 1
TagResource 20
UntagResource 20
Kundendienstmitarbeiters (Kundendienstmitarbeiter) AssociateAgentKnowledgeBase 6
CreateAgent 6
CreateAgentActionGroup 12
CreateAgentAlias 2
DeleteAgent 2
DeleteAgentActionGroup 2
DeleteAgentAlias 2
DeleteAgentVersion 2
DisassociateAgentKnowledgeBase 4
GetAgent 15
GetAgentActionGroup 20
GetAgentAlias 10
GetAgentKnowledgeBase 15
GetAgentVersion 10
ListAgents 10
ListAgentActionGroups 10
ListAgentAliases 10
ListAgentKnowledgeBases 10
ListAgentVersions 10
PrepareAgent 2
UpdateAgent 4
UpdateAgentActionGroup 6
UpdateAgentAlias 2
UpdateAgentKnowledgeBase 4
Benutzerdefinierte Modelle CreateModelCustomizationJob 1
DeleteCustomModel 10
GetCustomModel 10
GetModelCustomizationJob 10
ListModelCustomizationJobs 10
StopModelCustomizationJob 10
Leitlinien CreateGuardrail 1
CreateGuardrailVersion 1
DeleteGuardrail 1
GetGuardrail 10
ListGuardrails 10
UpdateGuardrail 1
Wissensdatenbanken CreateDataSource 2
CreateKnowledgeBase 2
DeleteDataSource 2
DeleteKnowledgeBase 2
GetDataSource 10
GetIngestionJob 10
GetKnowledgeBase 10
ListDataSources 10
ListIngestionJobs 10
ListKnowledgeBases 10
Abrufen 5
RetrieveAndGenerate 5
StartIngestionJob 0.1
UpdateDataSource 2
UpdateKnowledgeBase 2
Modellbewertung CreateEvaluationJob 5
GetEvaluationJob 10
ListEvaluationJobs 10
StopEvaluationJob 5
Bereitgestellter Durchsatz CreateProvisionedModelThroughput 1
DeleteProvisionedModelThroughput 1
GetProvisionedModelThroughput 10
ListProvisionedModelThroughputs 10
UpdateProvisionedModelThroughput 1

Wählen Sie eine Registerkarte aus, um modellspezifische Kontingente für Eingabeaufforderungen anzuzeigen.

Amazon Titan Text models
Beschreibung Wert Einstellbar durch Service Quotas
Länge der Textanfrage in Zeichen 42.000 Nein
Amazon Titan-Bildgenerator G1 V1
Beschreibung Wert Einstellbar durch Service Quotas
Länge der Textanfrage in Zeichen 1,024 Nein
Größe des Eingabebilds 5 MB Nein
Höhe des Eingabebilds in Pixeln (beim Übermalen/Übermalen) 1,024 Nein
Breite des Eingabebilds in Pixeln (Inpainting/Outpainting) 1,024 Nein
Höhe des Eingabebilds in Pixeln (Bildvariation) 4.096 Nein
Breite des Eingabebilds in Pixeln (Bildvariation) 4.096 Nein
Gesamtzahl der Pixel des Eingabebilds 12.582.912 Nein
Amazon Titan Embeddings G1 – Text
Beschreibung Wert Einstellbar durch Service Quotas
Länge der Texteingabe in Zeichen 50 000 Nein
Amazon Titan Multimodal Embeddings G1
Beschreibung Wert Einstellbar durch Service Quotas
Länge der Texteingabe in Zeichen 100 000 Nein
Base64-kodierte Bildzeichenfolge in Zeichen 25.000.000 Nein

Bei der Durchführung einer Batch-Inferenz gelten die folgenden Kontingente. Die Kontingente sind von der Modalität der Eingabe- und Ausgabedaten abhängig.

Modalität Minimale Dateigröße Maximale Dateigröße Einstellbar durch Service Quotas
Text zu Einbettungen 75 MB 500 MB Nein
Text zu Text 20 MB 150 MB Nein
Text/Bild zu Bild 1 MB 50 MB Nein

Die folgenden Kontingente werden durchgesetzt, wenn Sie Guardrails verwenden.

Kontingent Beschreibung Wert
Leitplanken pro Konto Die maximale Anzahl von Leitplanken in einem Konto. 100
Versionen pro Leitplanke Die maximale Anzahl von Versionen, die eine Leitplanke haben kann. 20
Themen pro Thema, Leitplanke Die maximale Anzahl von Themen, die in den Richtlinien für Leitplanken definiert werden können. 30
Beispielsätze pro Thema Die maximale Anzahl von Themenbeispielen, die in ein Thema aufgenommen werden können. 5
Regex-Ausdrücke im Filter für vertrauliche Informationen Die maximale Anzahl von Guardrail-Filter-Regexes, die in eine Richtlinie für vertrauliche Informationen aufgenommen werden können 10
Länge der Regex in Zeichen Die maximale Länge eines regulären Leitplankenfilters in Zeichen. 500
Richtlinie „Wörter pro Wort“ Die maximale Anzahl von Wörtern, die in einer Liste blockierter Wörter enthalten sein können. 10.000
Wortlänge in Zeichen Die maximale Länge eines Worts in einer Liste blockierter Wörter in Zeichen. 100
ApplyGuardrail On-Demand-Anfragen pro Sekunde Die maximal zulässige Anzahl von ApplyGuardrail API Aufrufen pro Sekunde. 25
Texteinheiten pro Sekunde für die Richtlinie „ ApplyGuardrail Abgelehnte Themen“ auf Anfrage. Die maximale Anzahl von Texteinheiten, die für Richtlinien zum Thema „Abgelehnt“ pro Sekunde verarbeitet werden können. 25
Texteinheiten pro Sekunde für die Richtlinie zur ApplyGuardrail Inhaltsfilterung auf Abruf Die maximale Anzahl von Texteinheiten, die für Inhaltsfilterrichtlinien pro Sekunde verarbeitet werden können. 25
Texteinheiten pro Sekunde für die ApplyGuardrail Word-Filterrichtlinie auf Abruf Die maximale Anzahl von Texteinheiten, die für Word-Filterrichtlinien pro Sekunde verarbeitet werden können. 25
Richtlinie zum Filtern ApplyGuardrail vertraulicher Informationen auf Abruf — Texteinheiten pro Sekunde Die maximale Anzahl von Texteinheiten, die für Richtlinien zum Filtern vertraulicher Informationen pro Sekunde verarbeitet werden können. 25
Anmerkung

Eine Texteinheit kann bis zu 1.000 Zeichen lang sein

Die folgenden Kontingente gelten für Wissensdatenbanken für Amazon Bedrock.

Beschreibung Maximum Einstellbar durch Service Quotas Beschreibung
Wissensdatenbanken pro Konto 100 Nein Die maximale Anzahl von Wissensdatenbanken pro Konto.
Datenquellen pro Wissensdatenbank 5 Nein Die maximale Anzahl von Datenquellen pro Wissensdatenbank.
Größe des Datenquellenblocks (TitanText G1 — Einbettungen) 8,192 Nein Die maximale Größe (in KB) einer Datenquelle mit. Titan Embeddings G1 - Text
Größe des Datenquellen-Chunks (CohereEmbedEnglisch) 512 Nein Die maximale Größe (in KB) einer Datenquelle in Cohere Embed englischer Sprache.
Größe des Datenquellenblocks (CohereEmbedmehrsprachig) 512 Nein Die maximale Größe (in KB) einer Datenquelle, die Cohere Embed Mehrsprachig verwendet.
Gesamtzahl der Metadatenfelder/Attribute der Datenquelle pro Block. 250 Nein Die maximale Anzahl von Feldern/Attributen für Dokumentmetadaten pro Block.
Gesamtzahl der gecrawlten Inhaltselemente der Datenquelle für Web Crawler 25,000 Nein Die maximale Anzahl von Webseiteninhaltselementen (maximal 50 MB pro Inhaltselement), die gecrawlt werden können.
Gesamtzahl der gecrawlten Dateien der Datenquelle 2,5 Millionen Nein Die maximale Anzahl von Datenquellendateien oder Inhaltselementen (maximal 50 MB pro Datei/Inhaltselement), die gecrawlt werden können.
Gesamtdatengröße beim erweiterten Parsen 100 MB Nein Die maximale kombinierte Größe (in MB) von Daten, die mit erweitertem Parsing analysiert werden können.
Erweitertes Parsen aller Dateien 100 Nein Die maximale Anzahl von Dateien, die mit erweitertem Parsing analysiert werden können.
Dateien, die pro Aufnahmejob hinzugefügt oder aktualisiert werden sollen 5,000,000 Nein Die maximale Anzahl neuer und aktualisierter Dateien, die pro Aufnahmeauftrag aufgenommen werden können.
Zu löschende Dateien pro Aufnahmeauftrag 5,000,000 Nein Die maximale Anzahl von Dateien, die pro Aufnahmeauftrag gelöscht werden können.
Dateigröße des Aufnahmeauftrags (Quelldokument) 50 MB Nein Die maximale Größe (in MB) einer Quelldokumentdatei in einem Aufnahmeauftrag.
Dateigröße des Aufnahmeauftrags (Metadatendatei) 10 KB Nein Die maximale Größe (in KB) einer Metadatendatei in einem Aufnahme-Job.
Größe des Aufnahme-Jobs 100 GB Nein Die maximale Größe (in GB) des Aufnahme-Jobs.
Gleichzeitige Aufnahmeaufträge pro Datenquelle 1 Nein Die maximale Anzahl von Aufnahmeaufträgen, die für eine Datenquelle gleichzeitig ausgeführt werden können.
Gleichzeitige Aufnahmeaufträge pro Wissensdatenbank 1 Nein Die maximale Anzahl von Aufnahmejobs, die für eine Wissensdatenbank gleichzeitig ausgeführt werden können.
Gleichzeitige Aufnahmeaufträge pro Konto 5 Nein Die maximale Anzahl von Aufnahmeaufträgen, die in einem Konto gleichzeitig ausgeführt werden können.
Größe der Benutzerabfrage 1.000 Nein Die maximale Größe (in Zeichen) einer Benutzerabfrage.

Die folgenden Kontingente gelten für Agents for Amazon Bedrock.

Kontingent Maximum Einstellbar durch Service Quotas Beschreibung
Agenten pro Konto 50 Ja Die maximale Anzahl von Agenten in einem Konto.
Zugeordnete Aliase pro Agent 10 Nein Die maximale Anzahl von Aliasen, die Sie einem Agenten zuordnen können.
Zeichen in Anweisungen für Agenten 4.000 Ja Die maximale Anzahl von Zeichen in den Anweisungen für einen Agenten.
Aktionsgruppen pro Agent 20 Ja Die maximale Anzahl von Aktionsgruppen, die Sie einem Agenten hinzufügen können.
Aktivierte Aktionsgruppen pro Agent 11 Ja Die maximale Anzahl von Aktionsgruppen, die in einem Agenten aktiviert werden können.
APIsoder Funktionen pro Agent 11 Ja Die maximale Anzahl davonAPIs, die Sie einem Agenten hinzufügen können.
Parameter pro Funktion 5 Ja Die maximale Anzahl von Parametern, die Sie einer Funktion für eine Aktionsgruppe hinzufügen können.
Größe der Lambda-Antwort-Nutzlast 25 KB Nein Die maximale Größe der Nutzlast in einer Aktionsgruppen-Lambda-Antwort.
Zugeordnete Wissensdatenbanken pro Agent 2 Ja Die maximale Anzahl von Wissensdatenbanken, die Sie einem Agenten zuordnen können.

Die folgenden Kontingente gelten für die Prompt-Verwaltung.

Kontingent Maximum Einstellbar durch Service Quotas Beschreibung
Eingabeaufforderungen pro Konto 50 Nein Die maximale Anzahl von Eingabeaufforderungen in der Prompt-Verwaltung, die Sie in einem Konto haben können.
Versionen pro Eingabeaufforderung 10 Nein Die maximale Anzahl von Versionen, die eine Aufforderung in der Prompt-Verwaltung haben kann.

Die folgenden Kontingente gelten für Prompt Flows.

Kontingent Maximum Einstellbar durch Service Quotas Beschreibung
Schnelle Abläufe pro Konto 10 Nein Die maximale Anzahl von Prompt-Flows, die Sie in einem Konto haben können.
Knoten pro Prompt-Flow 20 Nein Die maximale Anzahl von Knoten, die Sie in einem Prompt-Flow haben können.
Versionen pro Prompt-Flow 10 Nein Die maximale Anzahl von Versionen, die ein Prompt-Flow haben kann.
Aliase pro Prompt-Flow 10 Nein Die maximale Anzahl von Aliasnamen, die Sie einem Prompt-Flow zuordnen können.
Prompt-Flows pro Konto 10 Nein Die maximale Anzahl von Prompt-Flows, die Sie in einem Konto haben können.
Prompt-Flows pro Konto 10 Nein Die maximale Anzahl von Prompt-Flows, die Sie in einem Konto haben können.
Flow-Eingabeknoten pro Prompt-Flow 1 Nein Die maximale Anzahl von Flow-Eingabeknoten, die Sie zu einem Prompt-Flow hinzufügen können.
Flow-Ausgabeknoten pro Prompt-Flow 5 Nein Die maximale Anzahl von Flow-Ausgabeknoten, die Sie zu einem Prompt-Flow hinzufügen können.
Bedingungsknoten pro Prompt-Flow 5 Nein Die maximale Anzahl von Bedingungsknoten, die Sie zu einem Prompt-Flow hinzufügen können.
Iteratorknoten pro Prompt-Flow 1 Nein Die maximale Anzahl von Iteratorknoten, die Sie zu einem Prompt-Flow hinzufügen können.
Collector-Knoten pro Prompt-Flow 1 Nein Die maximale Anzahl von Collector-Knoten, die Sie zu einem Prompt-Flow hinzufügen können.
Prompt-Knoten pro Prompt-Flow 5 Nein Die maximale Anzahl von Prompt-Knoten, die Sie zu einem Prompt-Flow hinzufügen können.
Lambda-Knoten pro Prompt-Flow 5 Nein Die maximale Anzahl von Lambda-Knoten, die Sie zu einem Prompt-Flow hinzufügen können.
Lex-Knoten pro Prompt-Flow 5 Nein Die maximale Anzahl von Lex-Knoten, die Sie zu einem Prompt-Flow hinzufügen können.
Knoten pro Knotentyp pro Prompt-Flow 5 Nein Die maximale Anzahl von Knoten, die Sie für jeden Typ in einem Prompt-Flow hinzufügen können.
Bedingungen pro Bedingungsknoten 5 Nein Die maximale Anzahl von Bedingungen, die Sie einem Bedingungsknoten in einem Prompt-Flow hinzufügen können.

Die folgenden Kontingente gelten für die Modellanpassung.

Beschreibung Maximum Einstellbar durch Service Quotas
Die maximale Anzahl importierter Modelle in einem Konto. 0 Ja
Die maximale Anzahl von geplanten Anpassungsaufträgen. 2 Nein
Die maximale Anzahl von benutzerdefinierten Modellen in einem Konto. 100 Ja

Informationen zu Hyperparameter-Kontingenten finden Sie unterHyperparameter für benutzerdefinierte Modelle.

Wählen Sie eine Registerkarte aus, um modellspezifische Kontingente anzuzeigen, die für Trainings- und Validierungsdatensätze gelten, die für die Anpassung verschiedener Foundation-Modelle verwendet werden.

Amazon Titan Text Premier
Beschreibung Maximum (Fortsetzung der Schulung vor dem Training) Nicht verfügbar Maximaler Wert (Feinabstimmung) Nur Vorschau Einstellbar durch Service Quotas
Summe der Ein- und Ausgabetoken, wenn die Batchgröße 1 ist N/A 4.096 Nein
Summe der Eingabe- und Ausgabetokens, wenn die Batchgröße 2, 3 oder 4 ist N/A N/A Nein
Zeichenkontingent pro Stichprobe im Datensatz N/A Token-Kontingent x 6 Nein
Summe der Schulungs- und Validierungsdatensätze N/A 20 000 Ja
Dateigröße des Trainingsdatensatzes N/A 1 GB Nein
Dateigröße des Validierungsdatensatzes N/A 100 MB Nein
Amazon Titan Text G1 – Express
Beschreibung Maximum (Fortsetzung der Vorschulung) Maximum (Feinabstimmung) Einstellbar durch Service Quotas
Summe der Ein- und Ausgabetoken, wenn die Batchgröße 1 ist 4.096 4.096 Nein
Summe der Eingabe- und Ausgabetokens, wenn die Batchgröße 2, 3 oder 4 ist 2 048 2 048 Nein
Zeichenkontingent pro Stichprobe im Datensatz Token-Kontingent x 6 Token-Kontingent x 6 Nein
Summe der Schulungs- und Validierungsdatensätze 100 000 10.000 Ja
Dateigröße des Trainingsdatensatzes 10 GB 1 GB Nein
Dateigröße des Validierungsdatensatzes 100 MB 100 MB Nein
Amazon Titan Text G1 – Lite
Beschreibung Maximum (Fortsetzung der Vorschulung) Maximum (Feinabstimmung) Einstellbar durch Service Quotas
Summe der Eingabe- und Ausgabetokens, wenn die Batchgröße 1 oder 2 ist 4.096 4.096 Nein
Summe der Eingabe- und Ausgabetokens, wenn die Batchgröße 3, 4, 5 oder 6 ist 2 048 2 048 Nein
Zeichenkontingent pro Stichprobe im Datensatz Token-Kontingent x 6 Token-Kontingent x 6 Nein
Summe der Schulungs- und Validierungsdatensätze 100 000 10.000 Ja
Dateigröße des Trainingsdatensatzes 10 GB 1 GB Nein
Dateigröße des Validierungsdatensatzes 100 MB 100 MB Nein
Amazon Titan-Bildgenerator G1 V1
Beschreibung Minimum (Feinabstimmung) Maximum (Feinabstimmung) Einstellbar durch Service Quotas
Länge der Textanfrage in der Trainingsprobe, in Zeichen 3 1,024 Nein
Datensätze in einem Trainingsdatensatz 5 10.000 Nein
Größe des Eingabebilds 0 50 MB Nein
Höhe des Eingabebilds in Pixeln 512 4.096 Nein
Breite des Eingabebilds in Pixeln 512 4.096 Nein
Gesamtzahl der Pixel des Eingabebilds 0 12.582.912 Nein
Seitenverhältnis des Eingabebilds 1:4 4:1 Nein
Summe der Schulungs- und Validierungsaufzeichnungen N/A 10.000 Ja
Amazon Titan Multimodal Embeddings G1
Beschreibung Minimum (Feinabstimmung) Maximum (Feinabstimmung) Einstellbar durch Service Quotas
Länge der Textanfrage in der Trainingsprobe, in Zeichen 0 2.560 Nein
Aufzeichnungen in einem Trainingsdatensatz 1.000 500 000 Nein
Größe des Eingabebilds 0 5 MB Nein
Höhe des Eingabebilds in Pixeln 128 4096 Nein
Breite des Eingabebilds in Pixeln 128 4096 Nein
Gesamtzahl der Pixel des Eingabebilds 0 12.528.912 Nein
Seitenverhältnis des Eingabebilds 1:4 4:1 Nein
Summe der Schulungs- und Validierungsaufzeichnungen N/A 50 000 Ja
Cohere Befehl
Beschreibung Maximum (Feinabstimmung) Einstellbar durch Service Quotas
Eingabetoken 4.096 Nein
Ausgabetokens 2 048 Nein
Zeichenkontingent pro Stichprobe im Datensatz Token-Kontingent x 6 Nein
Datensätze in einem Trainingsdatensatz 10.000 Nein
Datensätze in einem Validierungsdatensatz 1.000 Nein
Meta Lama 2
Beschreibung Maximum (Feinabstimmung) Einstellbar durch Service Quotas
Eingabetoken 4.096 Nein
Ausgabetokens 2 048 Nein
Zeichenkontingent pro Stichprobe im Datensatz Token-Kontingent x 6 Nein
Summe der Schulungs- und Validierungsaufzeichnungen 10.000 Ja

Die folgenden Kontingente gelten für den bereitgestellten Durchsatz.

Anmerkung

Wenn ein Kontingent über Servicekontingente als nicht anpassbar gekennzeichnet ist, können Sie über das Formular zur Erhöhung des Limits eine Anfrage einreichen, um für eine Erhöhung in Betracht gezogen zu werden.

Beschreibung Standard Einstellbar durch Service Quotas
Modellieren Sie Einheiten, die unverbindlich auf bereitgestellte Durchsätze verteilt werden können 2 Nein
Modellieren Sie Einheiten, die unverbindlich auf bereitgestellte Durchsätze verteilt werden können 0 Nein

Die folgenden Kontingente gelten für Aufträge zur Modellevaluierung,

Job type Beschreibung Standard Anpassbar

Automatisiert

Die maximale Anzahl von Datensätzen, die Sie in einem automatisierten Modellevaluierungsjob angeben können. Dies umfasst sowohl benutzerdefinierte als auch integrierte Prompt-Datensätze.

5 Nein

Automatisiert

Die maximale Anzahl von Metriken, die Sie pro Datensatz in einem automatisierten Modellevaluierungsjob angeben können. Dies umfasst sowohl benutzerdefinierte als auch integrierte Metriken.

3 Nein
Mensch

Die maximale Anzahl von benutzerdefinierten Metriken, die Sie in einem Modellevaluierungsjob angeben können, bei dem menschliche Mitarbeiter eingesetzt werden.

10 Nein

Automatisiert

Die maximale Anzahl von Modellen, die Sie in einem automatisierten Modellevaluierungsjob angeben können.

1 Nein
Mensch

Die maximale Anzahl von Modellen, die Sie in einem Modellevaluierungsjob angeben können, bei dem menschliche Mitarbeiter verwendet werden.

2 Nein
Automatisiert

Die maximale Anzahl von Aufträgen zur automatischen Modellevaluierung, die Sie in diesem Konto in der aktuellen Region gleichzeitig angeben können.

20 Nein
Mensch

Die maximale Anzahl von Modellevaluierungsjobs, für die menschliche Arbeitskräfte eingesetzt werden, die Sie in diesem Konto in der aktuellen Region gleichzeitig angeben können.

10 Nein
beides

Die maximale Anzahl von Modellevaluierungsjobs, die Sie in diesem Konto in der aktuellen Region erstellen können.

500 Nein
Mensch

Die maximale Anzahl von Datensätzen mit benutzerdefinierten Eingabeaufforderungen, die Sie für einen Auftrag zur Evaluierung eines menschlichen Modells in diesem Konto in der aktuellen Region angeben können.

1 Nein
beides

Die maximale Anzahl von Eingabeaufforderungen, die ein Datensatz mit benutzerdefinierten Eingabeaufforderungen enthalten kann.

1.000 Nein
beides

Die maximale Größe (in KB) einer einzelnen Eingabeaufforderung ist ein Datensatz für benutzerdefinierte Eingabeaufforderungen.

4 KB Nein
Mensch

Die maximale Zeitdauer (in Tagen), die einer Arbeitskraft zur Erledigung von Aufgaben zur Verfügung stehen kann.

30 Nein