Quote per Amazon Bedrock - Amazon Bedrock

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Quote per Amazon Bedrock

Hai Account AWS delle quote predefinite, precedentemente denominate limiti, per Amazon Bedrock. Per visualizzare le quote di servizio per Amazon Bedrock, segui i passaggi in Visualizzazione delle quote di servizio e seleziona Amazon Bedrock come servizio. Alcune quote variano in base al modello. Salvo diversa indicazione, una quota si applica a tutte le versioni di un modello.

Per mantenere le prestazioni del servizio e garantire un uso appropriato di Amazon Bedrock, le quote predefinite assegnate a un account potrebbero essere aggiornate in base a fattori regionali, alla cronologia dei pagamenti, all'uso fraudolento e/o all'approvazione di una richiesta di aumento delle quote.

Puoi richiedere un aumento della quota per il tuo account seguendo i passaggi seguenti:

Seleziona un argomento per saperne di più sulle relative quote globali predefinite. Tutte le quote globali e regionali sono uguali se non diversamente specificato.

Le seguenti quote si applicano quando esegui l'inferenza del modello. Queste quote considerano la somma combinata delle richieste Converse, ConverseStreamInvokeModel, e. InvokeModelWithResponseStream La latenza di inferenza varia in base al modello ed è direttamente proporzionale al numero di token di input e output e al numero totale di richieste on-demand in corso da parte di tutti i clienti in quel momento. Per un throughput garantito, ti invitiamo a provare Provisioned Throughput.

Modello Richieste elaborate al minuto Token elaborati al minuto Regioni Regolabile tramite Service Quotas
AI21 Labs Jurassic-2 Mid 400 300.000 us-east-1 No
AI21 Labs Jurassic-2 Ultra 100 300.000 Tutti No
AI21 Jamba-Instruct 100 300.000 Tutti No
Amazon Titan Embeddings G1 - Text 2.000 300.000 Tutti No
Amazon Titan Text Embeddings V2 2.000 300.000 Tutti No
Amazon Titan Image Generator G1 V1 60 N/D Tutti No
Amazon Titan Image Generator G1 V2 60 N/D Tutti No
Amazon Titan Multimodal Embeddings G1 2.000 300.000 Tutti No
Amazon Titan Text G1 - Express 400 300.000 Tutti No
Amazon Titan Text G1 - Lite 800 300.000 Tutti No
Amazon Titan Text Premier 100 300.000 Tutti No
Anthropic Claude Instant 1.000 1.000.000

us-east-1

us-west-2

No
400 300.000 Altre regioni
AnthropicClaude2.x 500 500.000

us-east-1

us-west-2

No
100 200.000 Altre regioni
Anthropic Claude 3 Sonnet 500 1.000.000

us-east-1

us-west-2

No
100 200.000 Altre regioni
Anthropic Claude 3 Haiku 1.000 2.000.000

us-east-1

us-west-2

No
200 200.000

ap-northeast-1

ap-southeast-1

400 300.000 Altre regioni
Anthropic Claude 3.5 Sonnet 250 2.000.000 us-west-2 No
20 200.000

ap-northeast-1

ap-southeast-1

eu-central-1

No
50 400.000 Altre regioni No
Anthropic Claude 3 Opus 50 400.000 Tutti No
Cohere Command R 400 300.000 Tutti No
Cohere Command R+ 400 300.000 Tutti No
Cohere Command 400 300.000 Tutti No
Cohere Command Light 800 300.000 Tutti No
CohereEmbed(inglese) 2.000 300.000 Tutti No
CohereEmbed(Multilingue) 2.000 300.000 Tutti No
MetaLlama 213B 800 300.000 Tutti No
MetaLlama 270 B 400 300.000 Tutti No
Meta Llama 3 8B Instruct 800 300.000 Tutti No
Meta Llama 3 70B Instruct 400 300.000 Tutti No
Meta Llama 3.1 8B Instruct 800 300.000 us-west-2 No
Meta Llama 3.1 70B Instruct 400 300.000 us-west-2 No
Meta Llama 3.1 405B Instruct 50 400.000 us-west-2 No
Mistral AI Mistral 7B Instruct 800 300.000 Tutti No
Mistral AI Mixtral 8X7B Instruct 400 300.000 Tutti No
Mistral AI Mistral Large 400 300.000 Tutti No
Mistral AI Mistral Large 2 (24.07) 400 300.000 us-west-2 No
Mistral AI Mistral Small 400 300.000 Tutti No
Stable Diffusion XL 60 N/D Tutti No

La tabella seguente mostra il numero massimo di API richieste consentite al secondo per diverse API operazioni in Amazon Bedrock:

Funzionalità APIoperazione Numero massimo di richieste al secondo
N/D conversare 200
ConverseStream 200
DeleteModelInvocationLoggingConfiguration 1
GetFoundationModel 10
GetModelInvocationLoggingConfiguration 10
InvokeModel 200
InvokeModelWithResponseStream 200
ListFoundationModels 10
ListTagsForResource 20
PutModelInvocationLoggingConfiguration 1
TagResource 20
UntagResource 20
Agenti AssociateAgentKnowledgeBase 6
CreateAgent 6
CreateAgentActionGroup 12
CreateAgentAlias 2
DeleteAgent 2
DeleteAgentActionGroup 2
DeleteAgentAlias 2
DeleteAgentVersion 2
DisassociateAgentKnowledgeBase 4
GetAgent 15
GetAgentActionGroup 20
GetAgentAlias 10
GetAgentKnowledgeBase 15
GetAgentVersion 10
ListAgents 10
ListAgentActionGroups 10
ListAgentAliases 10
ListAgentKnowledgeBases 10
ListAgentVersions 10
PrepareAgent 2
UpdateAgent 4
UpdateAgentActionGroup 6
UpdateAgentAlias 2
UpdateAgentKnowledgeBase 4
Modelli personalizzati CreateModelCustomizationJob 1
DeleteCustomModel 10
GetCustomModel 10
GetModelCustomizationJob 10
ListModelCustomizationJobs 10
StopModelCustomizationJob 10
Guardrail CreateGuardrail 1
CreateGuardrailVersion 1
DeleteGuardrail 1
GetGuardrail 10
ListGuardrails 10
UpdateGuardrail 1
Knowledge base CreateDataSource 2
CreateKnowledgeBase 2
DeleteDataSource 2
DeleteKnowledgeBase 2
GetDataSource 10
GetIngestionJob 10
GetKnowledgeBase 10
ListDataSources 10
ListIngestionJobs 10
ListKnowledgeBases 10
Retrieve 5
RetrieveAndGenerate 5
StartIngestionJob 0.1
UpdateDataSource 2
UpdateKnowledgeBase 2
Valutazione del modello CreateEvaluationJob 5
GetEvaluationJob 10
ListEvaluationJobs 10
StopEvaluationJob 5
Velocità di trasmissione effettiva assegnata CreateProvisionedModelThroughput 1
DeleteProvisionedModelThroughput 1
GetProvisionedModelThroughput 10
ListProvisionedModelThroughputs 10
UpdateProvisionedModelThroughput 1

Seleziona una scheda per visualizzare le quote specifiche del modello per i prompt.

Amazon Titano Text models
Descrizione Valore Regolabile tramite Service Quotas
Lunghezza del messaggio di testo, in caratteri 42.000 No
Amazon Generatore di immagini Titan G1 V1
Descrizione Valore Regolabile tramite Service Quotas
Lunghezza del messaggio di testo, in caratteri 1,024 No
Dimensione dell'immagine di input 5 MB No
Altezza dell'immagine di input in pixel (in painting/outpainting) 1,024 No
Inserisci la larghezza dell'immagine in pixel (inpainting/outpainting) 1,024 No
Altezza dell'immagine di input in pixel (variazione dell'immagine) 4,096 No
Larghezza dell'immagine di input in pixel (variazione dell'immagine) 4,096 No
Pixel totali dell'immagine di input 12.582.912 No
Amazon Titan Embeddings G1 - Text
Descrizione Valore Regolabile tramite Service Quotas
Lunghezza di immissione del testo, in caratteri 50.000 No
Amazon Titan Multimodal Embeddings G1
Descrizione Valore Regolabile tramite Service Quotas
Lunghezza di immissione del testo, in caratteri 100.000 No
Stringa di immagine con codifica Base64, in caratteri 25.000.000 No

Le seguenti quote si applicano quando esegui l'inferenza in batch. Le quote dipendono dalla modalità dei dati di input e output.

Modalità Dimensione minima dei file Dimensione massima dei file Regolabile tramite Service Quotas
Da testo a incorporamenti 75 MB 500 MB No
Da testo a testo 20 MB 150 MB No
Da testo/immagine a immagine 1 MB 50 MB No

Le seguenti quote vengono applicate quando si utilizzano i guardrail.

Quota Descrizione Valore
Guardrail per account Il numero massimo di guardrail in un account. 100
Versioni per guardrail Il numero massimo di versioni che un guardrail può avere. 20
Argomenti per argomento (guardrail) Il numero massimo di argomenti che possono essere definiti tra le politiche tematiche di guardrail. 30
Frasi di esempio per argomento Il numero massimo di esempi di argomenti che possono essere inclusi in un argomento. 5
Espressioni Regex nel filtro Informazioni sensibili Il numero massimo di espressioni regolari del filtro guardrail che possono essere incluse in una politica di informazioni sensibili 10
Lunghezza delle espressioni regolari in caratteri La lunghezza massima, in caratteri, di un filtro guardrail regex. 500
Politica Words per Word Il numero massimo di parole che possono essere incluse in un elenco di parole bloccate. 10.000
Lunghezza delle parole in caratteri La lunghezza massima di una parola, in caratteri, in un elenco di parole bloccate. 100
Richieste su ApplyGuardrail richiesta al secondo Il numero massimo di ApplyGuardrail API chiamate consentite al secondo. 25
Unità di testo della policy On-demand ApplyGuardrail Denied topic al secondo. Il numero massimo di unità di testo che possono essere elaborate per le politiche relative agli argomenti negati al secondo. 25
Unità di testo della politica ApplyGuardrail di filtro dei contenuti su richiesta (unità di testo al secondo) Il numero massimo di unità di testo che possono essere elaborate per le politiche di filtro dei contenuti al secondo. 25
Unità di testo al secondo delle politiche di filtraggio di ApplyGuardrail Word su richiesta Il numero massimo di unità di testo che possono essere elaborate per i criteri di filtro di Word al secondo. 25
Informazioni ApplyGuardrail riservate su richiesta (unità di testo al secondo) della politica di filtraggio delle informazioni sensibili Il numero massimo di unità di testo che possono essere elaborate per i criteri di filtro delle informazioni riservate al secondo. 25
Nota

Un'unità di testo può contenere fino a 1.000 caratteri

Le seguenti quote si applicano alle Knowledge base per Amazon Bedrock.

Descrizione Massimo Regolabile tramite Service Quotas Descrizione
Basi di conoscenza per account 100 No Il numero massimo di basi di conoscenza per account.
Fonti di dati per base di conoscenza 5 No Il numero massimo di fonti di dati per base di conoscenza.
Dimensione del blocco della sorgente dati (TitanTesto G1 - Incorporamenti) 8,192 No La dimensione massima (in KB) di un'origine dati che utilizza. Titan Embeddings G1 - Text
Dimensione del blocco dell'origine dati (CohereEmbedinglese) 512 No La dimensione massima (in KB) di un'origine dati Cohere Embed in inglese.
Dimensione del blocco dell'origine dati (CohereEmbedmultilingue) 512 No La dimensione massima (in KB) di un'origine dati che utilizza Multilingue. Cohere Embed
Campi e attributi totali di metadati dell'origine dati per blocco. 250 No Il numero massimo di campi/attributi di metadati del documento per blocco.
Fonte di dati: contenuto totale sottoposto a scansione per Web Crawler 25.000 No Il numero massimo di elementi di contenuto della pagina Web (massimo 50 MB per elemento di contenuto) che possono essere sottoposti a scansione.
Fonte dati: totale dei file sottoposti a scansione 2,5 milioni No Il numero massimo di file di origine dati o elementi di contenuto (massimo 50 MB per file/elemento di contenuto) che possono essere sottoposti a scansione.
Analisi avanzata della dimensione totale dei dati 100 MB No La dimensione massima combinata (in MB) dei dati che possono essere analizzati utilizzando l'analisi avanzata.
Analisi avanzata dei file totali 100 No Il numero massimo di file che possono essere analizzati utilizzando l'analisi avanzata.
File da aggiungere o aggiornare per processo di importazione 5.000.000 No Il numero massimo di file nuovi e aggiornati che possono essere importati per processo di ingestione.
File da eliminare per processo di ingestione 5.000.000 No Il numero massimo di file che possono essere eliminati per processo di ingestione.
Dimensione del file del processo di importazione (documento di origine) 50 MB No La dimensione massima (in MB) di un file di documento di origine in un processo di importazione.
Dimensione del file del processo di importazione (file di metadati) 10 KB No La dimensione massima (in KB) di un file di metadati in un processo di importazione.
Dimensione del lavoro di importazione 100 GB No La dimensione massima (in GB) del processo di importazione.
Lavori di ingestione simultanei per origine dati 1 No Il numero massimo di processi di inserimento che possono essere eseguiti contemporaneamente per un'origine dati.
Lavori di inserimento simultanei per base di conoscenza 1 No Il numero massimo di processi di inserimento che possono essere eseguiti contemporaneamente per una knowledge base.
Lavori di ingestione simultanei per account 5 No Il numero massimo di processi di inserimento che possono essere eseguiti contemporaneamente in un account.
Dimensione della query dell'utente 1.000 No La dimensione massima (in caratteri) di una query utente.

Le seguenti quote si applicano agli Agents for Amazon Bedrock.

Quota Massimo Regolabile tramite Service Quotas Descrizione
Agenti per account 50 Il numero massimo di agenti in un account.
Alias associati per agente 10 No Il numero massimo di alias che è possibile associare a un agente.
Personaggi nelle istruzioni dell'agente 4.000 Il numero massimo di caratteri nelle istruzioni per un agente.
Gruppi di azione per agente 20 Il numero massimo di gruppi di azioni che è possibile aggiungere a un agente.
Gruppi di azioni abilitati per agente 11 Il numero massimo di gruppi di azioni che possono essere abilitati in un agente.
APIso Funzioni per agente 11 Il numero massimo di APIs elementi che puoi aggiungere a un agente.
Parametri per funzione 5 Il numero massimo di parametri che è possibile aggiungere a una funzione per un gruppo di azioni.
Dimensione del payload di risposta Lambda 25 KB No La dimensione massima del payload in una risposta Lambda del gruppo di azioni.
Knowledge base associate per agente 2 Il numero massimo di knowledge base che è possibile associare a un agente.

Le seguenti quote si applicano alla gestione dei prompt.

Quota Massimo Regolabile tramite Service Quotas Descrizione
Richieste per account 50 No Il numero massimo di richieste nella gestione dei prompt che puoi avere in un account.
Versioni per prompt 10 No Il numero massimo di versioni che può avere un prompt nella gestione dei prompt.

Le seguenti quote si applicano ai flussi Prompt.

Quota Massimo Regolabile tramite Service Quotas Descrizione
Flussi rapidi per account 10 No Il numero massimo di flussi di prompt che è possibile avere in un account.
Nodi per flusso di prompt 20 No Il numero massimo di nodi che è possibile inserire in un flusso di prompt.
Versioni per flusso di prompt 10 No Il numero massimo di versioni che un flusso di prompt può avere.
Alias per flusso di prompt 10 No Il numero massimo di alias che è possibile associare a un flusso di prompt.
Flussi di prompt per account 10 No Il numero massimo di flussi di prompt che è possibile avere in un account.
Flussi di prompt per account 10 No Il numero massimo di flussi di prompt che è possibile avere in un account.
Nodi di input Flow per flusso di prompt 1 No Il numero massimo di nodi di input del flusso che è possibile aggiungere a un flusso di prompt.
Nodi di output del flusso per flusso di prompt 5 No Il numero massimo di nodi di output del flusso che è possibile aggiungere a un flusso di prompt.
Condiziona i nodi per flusso di prompt 5 No Il numero massimo di nodi condizionali che è possibile aggiungere a un flusso di prompt.
Nodi iteratori per flusso di prompt 1 No Il numero massimo di nodi iteratori che è possibile aggiungere a un flusso di prompt.
Nodi di raccolta per flusso di prompt 1 No Il numero massimo di nodi di raccolta che è possibile aggiungere a un flusso di prompt.
Nodi di prompt per flusso di prompt 5 No Il numero massimo di nodi di prompt che è possibile aggiungere a un flusso di prompt.
Nodi Lambda per flusso di prompt 5 No Il numero massimo di nodi Lambda che è possibile aggiungere a un flusso di prompt.
Nodi Lex per flusso di prompt 5 No Il numero massimo di nodi Lex che è possibile aggiungere a un flusso di prompt.
Nodi per tipo di nodo per flusso di prompt 5 No Il numero massimo di nodi che è possibile aggiungere per ogni tipo in un flusso di prompt.
Condizioni per nodo di condizione 5 No Il numero massimo di condizioni che è possibile aggiungere a un nodo di condizione in un flusso di prompt.

Le quote elencate di seguito sono per la personalizzazione dei modelli.

Descrizione Massimo Regolabile tramite Service Quotas
Il numero massimo di modelli importati in un account. 0
Il numero massimo di lavori di personalizzazione pianificati. 2 No
Il numero massimo di modelli personalizzati in un account. 100

Per visualizzare le quote iperparametriche, vedere. Iperparametri del modello personalizzato

Seleziona una scheda per visualizzare le quote specifiche del modello che si applicano ai set di dati di formazione e convalida utilizzati per personalizzare diversi modelli di base.

Amazon Titan Text Premier
Descrizione Numero massimo (formazione preliminare continua) Non disponibile Solo anteprima massima (messa a punto) Regolabile tramite Service Quotas
Somma dei token di input e output quando la dimensione del batch è 1 N/D 4,096 No
Somma dei token di input e output quando la dimensione del batch è 2, 3 o 4 N/D N/D No
Quota di caratteri per campione nel set di dati N/D Quota di token x 6 No
Somma dei record di formazione e convalida N/D 20.000
Dimensione del file del set di dati di addestramento N/D 1 GB No
Dimensione del file del set di dati di convalida N/D 100 MB No
Amazon Titan Text G1 - Express
Descrizione Massimo (formazione preliminare continua) Massimo (messa a punto) Regolabile tramite Service Quotas
Somma dei token di input e output quando la dimensione del batch è 1 4,096 4,096 No
Somma dei token di input e output quando la dimensione del batch è 2, 3 o 4 2.048 2.048 No
Quota di caratteri per campione nel set di dati Quota di token x 6 Quota di token x 6 No
Somma dei record di formazione e convalida 100.000 10.000
Dimensione del file del set di dati di addestramento 10 GB 1 GB No
Dimensione del file del set di dati di convalida 100 MB 100 MB No
Amazon Titan Text G1 - Lite
Descrizione Massimo (formazione preliminare continua) Massimo (messa a punto) Regolabile tramite Service Quotas
Somma dei token di input e output quando la dimensione del batch è 1 o 2 4,096 4,096 No
Somma dei token di input e output quando la dimensione del batch è 3, 4, 5 o 6 2.048 2.048 No
Quota di caratteri per campione nel set di dati Quota di token x 6 Quota di token x 6 No
Somma dei record di formazione e convalida 100.000 10.000
Dimensione del file del set di dati di addestramento 10 GB 1 GB No
Dimensione del file del set di dati di convalida 100 MB 100 MB No
Amazon Titan Image Generator G1 V1
Descrizione Minimo (regolazione fine) Massimo (regolazione fine) Regolabile tramite Service Quotas
Lunghezza del prompt di testo nell'esempio di addestramento, in caratteri 3 1,024 No
Record in un set di dati di addestramento 5 10.000 No
Dimensione dell'immagine di input 0 50 MB No
Altezza dell'immagine di input in pixel 512 4,096 No
Larghezza dell'immagine di input in pixel 512 4,096 No
Pixel totali dell'immagine di input 0 12.582.912 No
Proporzioni dell'immagine in ingresso 1:4 4:1 No
Somma dei record di formazione e convalida N/D 10.000
Amazon Titan Multimodal Embeddings G1
Descrizione Minimo (messa a punto) Massimo (regolazione fine) Regolabile tramite Service Quotas
Lunghezza del prompt di testo nell'esempio di addestramento, in caratteri 0 2.560 No
Record in un set di dati di addestramento 1.000 500.000 No
Dimensione dell'immagine di input 0 5 MB No
Altezza dell'immagine di input in pixel 128 4096 No
Larghezza dell'immagine di input in pixel 128 4096 No
Pixel totali dell'immagine di input 0 12.528.912 No
Proporzioni dell'immagine in ingresso 1:4 4:1 No
Somma dei record di formazione e convalida N/D 50.000
Cohere Comando
Descrizione Massimo (messa a punto) Regolabile tramite Service Quotas
Token di input 4,096 No
Token di output 2.048 No
Quota di caratteri per campione nel set di dati Quota di token x 6 No
Record in un set di dati di addestramento 10.000 No
Record in un set di dati di convalida 1.000 No
Meta Lama 2
Descrizione Massimo (regolazione fine) Regolabile tramite Service Quotas
Token di input 4,096 No
Token di output 2.048 No
Quota di caratteri per campione nel set di dati Quota di token x 6 No
Somma dei record di formazione e convalida 10.000

Le quote seguenti si applicano alla velocità di trasmissione effettiva assegnata

Nota

Se una quota è contrassegnata come non regolabile tramite Service Quotas, puoi inviare una richiesta tramite il modulo di aumento del limite per prendere in considerazione un aumento.

Descrizione Default Regolabile tramite Service Quotas
Unità modello che possono essere distribuite su throughput forniti senza impegno 2 No
Unità modello che possono essere distribuite su Provisioned Throughput con impegno 0 No

Le seguenti quote si applicano ai lavori di valutazione dei modelli,

Tipo di processo Descrizione Predefinita Adattabile

Automatizzato

Il numero massimo di set di dati che è possibile specificare in un processo di valutazione automatizzato del modello. Ciò include set di dati prompt personalizzati e integrati.

5 No

Automatizzato

Il numero massimo di metriche che è possibile specificare per set di dati in un processo di valutazione automatizzato del modello. Ciò include metriche personalizzate e integrate.

3 No
Umano

Il numero massimo di metriche personalizzate che è possibile specificare in un processo di valutazione del modello che utilizza lavoratori umani.

10 No

Automatizzato

Il numero massimo di modelli che è possibile specificare in un processo di valutazione automatizzato del modello.

1 No
Umano

Il numero massimo di modelli che è possibile specificare in un processo di valutazione dei modelli che utilizza lavoratori umani.

2 No
Automatizzato

Il numero massimo di lavori di valutazione automatica del modello che è possibile specificare contemporaneamente in questo account nella regione corrente.

20 No
Umano

Il numero massimo di lavori di valutazione dei modelli che utilizzano lavoratori umani è possibile specificare contemporaneamente in questo account nella regione corrente.

10 No
Entrambi

Il numero massimo di lavori di valutazione dei modelli che è possibile creare in questo account nella regione corrente.

500 No
Umano

Il numero massimo di set di dati di prompt personalizzati che è possibile specificare in un processo di valutazione di modelli basato sull'uomo in questo account nella regione corrente.

1 No
Entrambi

Il numero massimo di prompt che un set di dati di prompt personalizzato può contenere.

1.000 No
Entrambi

La dimensione massima (in KB) di un singolo prompt è un set di dati di prompt personalizzato.

4 KB No
Umano

La durata massima (in giorni) di tempo a disposizione di un lavoratore per completare le attività.

30 No