Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Quotas pour Amazon Bedrock
Vous Compte AWS disposez de quotas par défaut, anciennement appelés limites, pour Amazon Bedrock. Pour consulter les quotas de service pour Amazon Bedrock, suivez les étapes décrites dans Afficher les quotas de service et sélectionnez Amazon Bedrock comme service. Certains quotas varient selon le modèle. Sauf indication contraire, un quota s'applique à toutes les versions d'un modèle.
Pour maintenir les performances du service et garantir une utilisation appropriée d'Amazon Bedrock, les quotas par défaut attribués à un compte peuvent être mis à jour en fonction de facteurs régionaux, de l'historique des paiements, d'une utilisation frauduleuse et/ou de l'approbation d'une demande d'augmentation de quota.
Vous pouvez demander une augmentation du quota de votre compte en suivant les étapes ci-dessous :
-
Si un quota est marqué Oui dans la colonne Ajustable via les quotas de service des tableaux suivants, vous pouvez l'ajuster en suivant les étapes décrites dans la section Demander une augmentation de quota dans le guide de l'utilisateur sur les quotas de service du guide de l'utilisateur sur les quotas de service.
-
Si un quota est marqué « Non » dans la colonne « Adjustable via Service Quotas » des tableaux suivants, vous pouvez peut-être demander une augmentation du quota de l'une des manières suivantes :
-
Pour demander une augmentation de quota pour un quota d'exécution, contactez votre Compte AWS responsable. Si vous n'avez pas de Compte AWS responsable, vous ne pouvez pas augmenter votre quota pour le moment.
-
Pour demander d'autres augmentations de quotas, soumettez une demande par le biais du formulaire d'augmentation des limites
afin que l'augmentation soit prise en compte.
Note
En raison de la forte demande, la priorité sera accordée aux clients dont le trafic consomme le quota qui leur est alloué. Votre demande peut être refusée si vous ne remplissez pas cette condition.
-
Sélectionnez une rubrique pour en savoir plus sur ses quotas globaux par défaut. Tous les quotas mondiaux et régionaux sont identiques, sauf indication contraire.
Les quotas suivants s’appliquent lorsque vous effectuez une inférence de modèle. Ces quotas tiennent compte de la somme combinée pour Converse, ConverseStreamInvokeModel, et les InvokeModelWithResponseStreamrequêtes. La latence d'inférence varie selon le modèle et est directement proportionnelle au nombre de jetons d'entrée et de sortie et au nombre total de demandes à la demande en cours par tous les clients à la fois. Pour un débit garanti, nous vous encourageons à essayer Provisioned Throughput.
Modèle | Demandes traitées par minute | Jetons traités par minute | Régions | Réglable via des Quotas de Service |
---|---|---|---|---|
AI21 Labs Jurassic-2 Mid | 400 | 300,000 | us-east-1 | Non |
AI21 Labs Jurassic-2 Ultra | 100 | 300,000 | Tous | Non |
AI21 Jamba-Instruct | 100 | 300,000 | Tous | Non |
Amazon Titan Embeddings G1 - Text | 2 000 | 300,000 | Tous | Non |
Amazon Titan Text Embeddings V2 | 2 000 | 300,000 | Tous | Non |
Amazon Titan Image Generator G1 V1 | 60 | N/A | Tous | Non |
Amazon Titan Image Generator G1 V2 | 60 | N/A | Tous | Non |
Amazon Titan Multimodal Embeddings G1 | 2 000 | 300,000 | Tous | Non |
Amazon Titan Text G1 - Express | 400 | 300,000 | Tous | Non |
Amazon Titan Text G1 - Lite | 800 | 300,000 | Tous | Non |
Amazon Titan Text Premier | 100 | 300,000 | Tous | Non |
Anthropic Claude Instant | 1 000 | 1 000 000 |
us-east-1 us-west-2 |
Non |
400 | 300,000 | Autres régions | ||
AnthropicClaude2. x | 500 | 500 000 |
us-east-1 us-west-2 |
Non |
100 | 200 000 | Autres régions | ||
Anthropic Claude 3 Sonnet | 500 | 1 000 000 |
us-east-1 us-west-2 |
Non |
100 | 200 000 | Autres régions | ||
Anthropic Claude 3 Haiku | 1 000 | 2 000 000 |
us-east-1 us-west-2 |
Non |
200 | 200 000 |
ap-northeast-1 ap-southeast-1 |
||
400 | 300,000 | Autres régions | ||
Anthropic Claude 3.5 Sonnet | 250 | 2 000 000 | us-west-2 | Non |
20 | 200 000 |
ap-northeast-1 ap-southeast-1 eu-central-1 |
Non | |
50 | 400 000 | Autres régions | Non | |
Anthropic Claude 3 Opus | 50 | 400 000 | Tous | Non |
Cohere Command R | 400 | 300,000 | Tous | Non |
Cohere Command R+ | 400 | 300,000 | Tous | Non |
Cohere Command | 400 | 300,000 | Tous | Non |
Cohere Command Light | 800 | 300,000 | Tous | Non |
CohereEmbed(en anglais) | 2 000 | 300,000 | Tous | Non |
CohereEmbed(Multilingue) | 2 000 | 300,000 | Tous | Non |
MetaLlama 213 B | 800 | 300,000 | Tous | Non |
MetaLlama 270 B | 400 | 300,000 | Tous | Non |
Meta Llama 3 8B Instruct | 800 | 300,000 | Tous | Non |
Meta Llama 3 70B Instruct | 400 | 300,000 | Tous | Non |
Meta Llama 3.1 8B Instruct | 800 | 300,000 | us-west-2 | Non |
Meta Llama 3.1 70B Instruct | 400 | 300,000 | us-west-2 | Non |
Meta Llama 3.1 405B Instruct | 50 | 400 000 | us-west-2 | Non |
Mistral AI Mistral 7B Instruct | 800 | 300,000 | Tous | Non |
Mistral AI Mixtral 8X7B Instruct | 400 | 300,000 | Tous | Non |
Mistral AI Mistral Large | 400 | 300,000 | Tous | Non |
Mistral AI Mistral Large 2 (24.07) | 400 | 300,000 | us-west-2 | Non |
Mistral AI Mistral Small | 400 | 300,000 | Tous | Non |
Stable Diffusion XL | 60 | N/A | Tous | Non |
Le tableau suivant indique le nombre maximum de API demandes autorisées par seconde pour différentes API opérations dans Amazon Bedrock :
Fonctionnalité | APIopération | Nombre maximum de demandes par seconde |
---|---|---|
N/A | Converse | 200 |
ConverseStream | 200 | |
DeleteModelInvocationLoggingConfiguration | 1 | |
GetFoundationModel | 10 | |
GetModelInvocationLoggingConfiguration | 10 | |
InvokeModel | 200 | |
InvokeModelWithResponseStream | 200 | |
ListFoundationModels | 10 | |
ListTagsForResource | 20 | |
PutModelInvocationLoggingConfiguration | 1 | |
TagResource | 20 | |
UntagResource | 20 | |
Agents | AssociateAgentKnowledgeBase | 6 |
CreateAgent | 6 | |
CreateAgentActionGroup | 12 | |
CreateAgentAlias | 2 | |
DeleteAgent | 2 | |
DeleteAgentActionGroup | 2 | |
DeleteAgentAlias | 2 | |
DeleteAgentVersion | 2 | |
DisassociateAgentKnowledgeBase | 4 | |
GetAgent | 15 | |
GetAgentActionGroup | 20 | |
GetAgentAlias | 10 | |
GetAgentKnowledgeBase | 15 | |
GetAgentVersion | 10 | |
ListAgents | 10 | |
ListAgentActionGroups | 10 | |
ListAgentAliases | 10 | |
ListAgentKnowledgeBases | 10 | |
ListAgentVersions | 10 | |
PrepareAgent | 2 | |
UpdateAgent | 4 | |
UpdateAgentActionGroup | 6 | |
UpdateAgentAlias | 2 | |
UpdateAgentKnowledgeBase | 4 | |
Modèles personnalisés | CreateModelCustomizationJob | 1 |
DeleteCustomModel | 10 | |
GetCustomModel | 10 | |
GetModelCustomizationJob | 10 | |
ListModelCustomizationJobs | 10 | |
StopModelCustomizationJob | 10 | |
Barrières de sécurité | CreateGuardrail | 1 |
CreateGuardrailVersion | 1 | |
DeleteGuardrail | 1 | |
GetGuardrail | 10 | |
ListGuardrails | 10 | |
UpdateGuardrail | 1 | |
Bases de connaissances | CreateDataSource | 2 |
CreateKnowledgeBase | 2 | |
DeleteDataSource | 2 | |
DeleteKnowledgeBase | 2 | |
GetDataSource | 10 | |
GetIngestionJob | 10 | |
GetKnowledgeBase | 10 | |
ListDataSources | 10 | |
ListIngestionJobs | 10 | |
ListKnowledgeBases | 10 | |
Retrieve | 5 | |
RetrieveAndGenerate | 5 | |
StartIngestionJob | 0.1 | |
UpdateDataSource | 2 | |
UpdateKnowledgeBase | 2 | |
Évaluation de modèle | CreateEvaluationJob | 5 |
GetEvaluationJob | 10 | |
ListEvaluationJobs | 10 | |
StopEvaluationJob | 5 | |
Débit provisionné | CreateProvisionedModelThroughput | 1 |
DeleteProvisionedModelThroughput | 1 | |
GetProvisionedModelThroughput | 10 | |
ListProvisionedModelThroughputs | 10 | |
UpdateProvisionedModelThroughput | 1 |
Sélectionnez un onglet pour afficher les quotas spécifiques au modèle pour les invites.
Les quotas suivants s’appliquent lorsque vous exécutez une inférence par lots. Les quotas dépendent de la modalité des données d’entrée et de sortie.
Modalité | Taille minimale du fichier | Taille maximale du fichier | Réglable via des Quotas de Service |
---|---|---|---|
Texte vers représentations vectorielles continues | 75 Mo | 500 Mo | Non |
Texte vers texte | 20 Mo | 150 Mo | Non |
Texte/image vers image | 1 Mo | 50 Mo | Non |
Les quotas suivants sont appliqués lorsque vous utilisez des barrières de sécurité.
Quota | Description | Valeur |
---|---|---|
Rambardes par compte | Le nombre maximum de barrières de sécurité sur un compte. | 100 |
Versions par garde-corps | Le nombre maximum de versions qu'un garde-corps peut avoir. | 20 |
Sujets par sujet : garde-corps | Le nombre maximum de sujets pouvant être définis dans les politiques relatives aux sujets de Guardrail. | 30 |
Exemples de phrases par sujet | Le nombre maximum d'exemples de sujets pouvant être inclus dans un sujet. | 5 |
Expressions Regex dans le filtre Informations sensibles | Le nombre maximum d'expressions régulières du filtre de garde-corps qui peuvent être incluses dans une politique relative aux informations sensibles | 10 |
Longueur de l'expression régulière en caractères | Longueur maximale, en caractères, d'une expression régulière d'un filtre de garde-corps. | 500 |
Politique du nombre de mots par mot | Le nombre maximum de mots pouvant être inclus dans une liste de mots bloqués. | 10 000 |
Longueur du mot en caractères | Longueur maximale d'un mot, en caractères, dans une liste de mots bloqués. | 100 |
ApplyGuardrail Demandes à la demande par seconde | Le nombre maximum d' ApplyGuardrail APIappels autorisés par seconde. | 25 |
Unités de texte de politique de sujets ApplyGuardrail refusés à la demande par seconde. | Nombre maximal d'unités de texte pouvant être traitées pour les politiques relatives aux sujets refusés par seconde. | 25 |
Politique de filtrage ApplyGuardrail du contenu à la demande, unités de texte par seconde | Nombre maximal d'unités de texte pouvant être traitées pour les politiques de filtrage de contenu par seconde. | 25 |
Politique de filtrage ApplyGuardrail Word à la demande, unités de texte par seconde | Nombre maximal d'unités de texte pouvant être traitées pour les politiques de filtrage de Word par seconde. | 25 |
Politique de filtrage des informations ApplyGuardrail sensibles à la demande, unités de texte par seconde | Nombre maximal d'unités de texte pouvant être traitées pour les politiques de filtrage des informations sensibles par seconde. | 25 |
Note
Une unité de texte peut comporter jusqu'à 1 000 caractères
Les quotas suivants s'appliquent aux bases de connaissances d'Amazon Bedrock.
Description | Maximum | Réglable via des Quotas de Service | Description |
---|---|---|---|
Bases de connaissances par compte | 100 | Non | Le nombre maximum de bases de connaissances par compte. |
Sources de données par base de connaissances | 5 | Non | Le nombre maximum de sources de données par base de connaissances. |
Taille de bloc de la source de données (TitanTexte G1 - Embeddings) | 8 192 | Non | Taille maximale (en Ko) d'une source de données utilisantTitan Embeddings G1 - Text. |
Taille du bloc de la source de données (CohereEmbedanglais) | 512 | Non | Taille maximale (en Ko) d'une source de données en Cohere Embed anglais. |
Taille du fragment de la source de données (CohereEmbedmultilingue) | 512 | Non | Taille maximale (en Ko) d'une source de données utilisant Cohere Embed Multilingual. |
Nombre total de champs/attributs de métadonnées de la source de données par bloc. | 250 | Non | Le nombre maximum de champs/attributs de métadonnées du document par bloc. |
Nombre total d'éléments de contenu analysés dans la source de données pour Web Crawler | 25 000 | Non | Nombre maximal d'éléments de contenu de page Web (50 Mo maximum par élément de contenu) pouvant être explorés. |
Nombre total de fichiers analysés de la source de données | 2,5 millions | Non | Nombre maximal de fichiers de source de données ou d'éléments de contenu (50 Mo maximum par fichier/élément de contenu) pouvant être analysés. |
Analyse avancée de la taille totale des données | 100 Mo | Non | Taille combinée maximale (en Mo) des données pouvant être analysées à l'aide d'une analyse avancée. |
Analyse avancée de l'ensemble des fichiers | 100 | Non | Le nombre maximum de fichiers pouvant être analysés à l'aide de l'analyse avancée. |
Fichiers à ajouter ou à mettre à jour par tâche d'ingestion | 5 000 000 | Non | Nombre maximal de fichiers nouveaux et mis à jour pouvant être ingérés par tâche d'ingestion. |
Fichiers à supprimer par tâche d'ingestion | 5 000 000 | Non | Nombre maximal de fichiers pouvant être supprimés par tâche d'ingestion. |
Taille du fichier de tâche d'ingestion (document source) | 50 Mo | Non | Taille maximale (en Mo) d'un fichier de document source dans une tâche d'ingestion. |
Taille du fichier de tâche d'ingestion (fichier de métadonnées) | 10 Ko | Non | Taille maximale (en Ko) d'un fichier de métadonnées dans une tâche d'ingestion. |
Taille de la tâche d'ingestion | 100 Go | Non | Taille maximale (en Go) de la tâche d'ingestion. |
Tâches d'ingestion simultanées par source de données | 1 | Non | Nombre maximal de tâches d'ingestion pouvant avoir lieu simultanément pour une source de données. |
Tâches d'ingestion simultanées par base de connaissances | 1 | Non | Nombre maximal de tâches d'ingestion pouvant avoir lieu simultanément pour une base de connaissances. |
Tâches d'ingestion simultanées par compte | 5 | Non | Nombre maximum de tâches d'ingestion pouvant avoir lieu simultanément sur un compte. |
Taille de la requête utilisateur | 1 000 | Non | Taille maximale (en caractères) d'une requête utilisateur. |
Les quotas suivants s'appliquent aux agents pour Amazon Bedrock.
Quota | Maximum | Réglable via des Quotas de Service | Description |
---|---|---|---|
Agents par compte | 50 | Oui | Le nombre maximum d'agents dans un compte. |
Alias associés par agent | 10 | Non | Le nombre maximum d'alias que vous pouvez associer à un agent. |
Personnages des instructions de l'agent | 4 000 | Oui | Le nombre maximum de caractères dans les instructions destinées à un agent. |
Groupes d'action par agent | 20 | Oui | Nombre maximal de groupes d'actions que vous pouvez ajouter à un agent. |
Groupes d'actions activés par agent | 11 | Oui | Nombre maximal de groupes d'actions pouvant être activés dans un agent. |
APIsou fonctions par agent | 11 | Oui | Le nombre maximum APIs que vous pouvez ajouter à un agent. |
Paramètres par fonction | 5 | Oui | Nombre maximal de paramètres que vous pouvez ajouter à une fonction pour un groupe d'actions. |
Taille de la charge utile de réponse Lambda | 25 KO | Non | Taille maximale de la charge utile dans une réponse Lambda de groupe d'actions. |
Bases de connaissances associées par agent | 2 | Oui | Le nombre maximum de bases de connaissances que vous pouvez associer à un agent. |
Les quotas suivants s'appliquent à la gestion de Prompt.
Quota | Maximum | Réglable via des Quotas de Service | Description |
---|---|---|---|
Invites par compte | 50 | Non | Le nombre maximum d'invites que vous pouvez avoir dans un compte dans Prompt Management. |
Versions par invite | 10 | Non | Nombre maximal de versions que peut avoir une invite dans Prompt Management. |
Les quotas suivants s'appliquent aux flux Prompt.
Quota | Maximum | Réglable via des Quotas de Service | Description |
---|---|---|---|
Flux rapides par compte | 10 | Non | Le nombre maximum de flux de messages que vous pouvez avoir dans un compte. |
Nœuds par flux rapide | 20 | Non | Le nombre maximum de nœuds que vous pouvez avoir dans un flux rapide. |
Versions par flux rapide | 10 | Non | Nombre maximal de versions qu'un flux rapide peut avoir. |
Alias par flux d'invite | 10 | Non | Le nombre maximum d'alias que vous pouvez associer à un flux d'invite. |
Flux rapides par compte | 10 | Non | Le nombre maximum de flux de messages que vous pouvez avoir dans un compte. |
Flux rapides par compte | 10 | Non | Le nombre maximum de flux de messages que vous pouvez avoir dans un compte. |
Nœuds d'entrée de flux par flux invité | 1 | Non | Nombre maximal de nœuds d'entrée de flux que vous pouvez ajouter à un flux rapide. |
Nœuds de sortie de flux par flux invité | 5 | Non | Nombre maximal de nœuds de sortie de flux que vous pouvez ajouter à un flux rapide. |
Conditionnez les nœuds par flux d'invite | 5 | Non | Nombre maximal de nœuds conditionnels que vous pouvez ajouter à un flux d'invite. |
Nœuds d'itérateur par flux d'invite | 1 | Non | Le nombre maximal de nœuds itérateurs que vous pouvez ajouter à un flux d'instructions. |
Nœuds collecteurs par flux rapide | 1 | Non | Nombre maximal de nœuds collecteurs que vous pouvez ajouter à un flux rapide. |
Nœuds d'invite par flux d'invite | 5 | Non | Nombre maximal de nœuds d'invite que vous pouvez ajouter à un flux d'invite. |
Nœuds Lambda par flux d'invite | 5 | Non | Nombre maximal de nœuds Lambda que vous pouvez ajouter à un flux rapide. |
Nœuds Lex par flux d'invite | 5 | Non | Nombre maximal de nœuds Lex que vous pouvez ajouter à un flux d'appels. |
Nœuds par type de nœud par flux d'invite | 5 | Non | Le nombre maximum de nœuds que vous pouvez ajouter pour chaque type dans un flux d'invite. |
Conditions par nœud de condition | 5 | Non | Nombre maximal de conditions que vous pouvez ajouter à un nœud de condition dans un flux rapide. |
Les quotas suivants s’appliquent à la personnalisation des modèles.
Description | Maximum | Réglable via des Quotas de Service |
---|---|---|
Le nombre maximum de modèles importés dans un compte. | 0 | Oui |
Le nombre maximum de tâches de personnalisation planifiées. | 2 | Non |
Le nombre maximum de modèles personnalisés dans un compte. | 100 | Oui |
Pour consulter les quotas d'hyperparamètres, consultezHyperparamètres du modèle personnalisé.
Sélectionnez un onglet pour voir les quotas spécifiques au modèle qui s'appliquent aux ensembles de données de formation et de validation utilisés pour personnaliser les différents modèles de base.
Les quotas suivants s’appliquent au débit provisionné.
Note
Si un quota est marqué comme non ajustable par le biais de Service Quotas, vous pouvez soumettre une demande d'augmentation de limite par le biais du formulaire d'augmentation
Description | Par défaut | Réglable via des Quotas de Service |
---|---|---|
Modélisez des unités pouvant être distribuées sur des débits provisionnés sans engagement | 2 | Non |
Modélisez des unités qui peuvent être distribuées sur des débits provisionnés avec engagement | 0 | Non |
Les quotas suivants s'appliquent aux tâches d'évaluation de modèles,
Type de tâche | Description | Par défaut | Ajustable |
---|---|---|---|
Automatisé |
Nombre maximal de jeux de données que vous pouvez spécifier dans une tâche d'évaluation de modèle automatisée. Cela inclut les ensembles de données d'invite personnalisés et intégrés. |
5 | Non |
Automatisé |
Nombre maximal de mesures que vous pouvez spécifier par ensemble de données dans une tâche d'évaluation automatique de modèle. Cela inclut à la fois des métriques personnalisées et intégrées. |
3 | Non |
Humain |
Nombre maximal de mesures personnalisées que vous pouvez spécifier dans une tâche d'évaluation de modèle faisant appel à des travailleurs humains. |
10 | Non |
Automatisé |
Nombre maximal de modèles que vous pouvez spécifier dans une tâche d'évaluation automatique de modèles. |
1 | Non |
Humain |
Nombre maximal de modèles que vous pouvez spécifier dans une tâche d'évaluation de modèles faisant appel à des travailleurs humains. |
2 | Non |
Automatisé |
Nombre maximal de tâches d'évaluation automatique de modèles que vous pouvez spécifier simultanément dans ce compte dans la région actuelle. |
20 | Non |
Humain |
Le nombre maximum de tâches d'évaluation de modèles faisant appel à des travailleurs humains peut être spécifié simultanément dans ce compte dans la région actuelle. |
10 | Non |
les deux |
Le nombre maximum de tâches d'évaluation de modèles que vous pouvez créer dans ce compte dans la région actuelle. |
500 | Non |
Humain |
Le nombre maximum de jeux de données d'invite personnalisés que vous pouvez spécifier dans une tâche d'évaluation de modèle basée sur l'homme dans ce compte dans la région actuelle. |
1 | Non |
les deux |
Le nombre maximum d'invites qu'un jeu de données d'invite personnalisé peut contenir. |
1 000 | Non |
les deux |
La taille maximale (en Ko) d'une invite individuelle est un jeu de données d'invite personnalisé. |
4 Ko | Non |
Humain |
Durée maximale (en jours) dont un travailleur peut disposer pour effectuer des tâches. |
30 | Non |