Consignes et quotas - Amazon Comprehend

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Consignes et quotas

Sauf indication contraire, les quotas Amazon Comprehend sont définis par région. Vous pouvez demander une augmentation des quotas ajustables si cela est nécessaire pour vos applications. Pour plus d'informations sur les quotas et pour demander une augmentation de quota, consultez AWS Service Quotas.

Régions prises en charge

Amazon Comprehend est disponible dans les régions suivantes : AWS

  • USA Est (Ohio)

  • USA Est (Virginie du Nord)

  • USA Ouest (Oregon)

  • Asie-Pacifique (Mumbai)

  • Asie-Pacifique (Séoul)

  • Asie-Pacifique (Singapour)

  • Asie-Pacifique (Sydney)

  • Asie-Pacifique (Tokyo)

  • Canada (Centre)

  • Europe (Francfort)

  • Europe (Irlande)

  • Europe (Londres)

  • AWS GovCloud (US-Ouest)

Par défaut, Amazon Comprehend fournit toutes les opérations d'API dans chacune des régions prises en charge. Pour les exceptions, voirTraitement des documents.

Pour plus d'informations sur les points de terminaison d'API, consultez Amazon Comprehend Regions and Endpoints dans le manuel Amazon Web Services General Reference.

Pour consulter les quotas actuels dans une région, ou pour demander des augmentations de quotas pour des quotas ajustables, ouvrez la console Service Quotas.

Quotas pour les modèles intégrés

Amazon Comprehend fournit des modèles intégrés qui vous permettent d'analyser des documents texte UTF-8. Amazon Comprehend fournit des opérations synchrones et asynchrones qui utilisent les modèles intégrés.

Analyse en temps réel (synchrone)

Cette section décrit les quotas liés à l'analyse en temps réel à l'aide des modèles intégrés.

Opérations sur un seul document

L'API Amazon Comprehend fournit des opérations qui prennent un seul document en entrée. Les quotas suivants s'appliquent à ces opérations.

Quotas généraux pour les opérations portant sur un seul document

Les quotas suivants s'appliquent à l'analyse en temps réel visant à détecter les entités, les phrases clés ou le langage dominant. Pour la détection des entités, ces quotas s'appliquent à la détection à l'aide des modèles intégrés. Pour la détection d'entités personnalisées, consultez les quotas dansReconnaissance d'entités personnalisée .

Description Quot/ligne directrice
Taille maximale du document 100 Ko
Quotas spécifiques aux opérations pour les opérations portant sur un seul document

Les quotas suivants s'appliquent à l'analyse en temps réel pour détecter le sentiment, le sentiment ciblé et la syntaxe.

Description Quot/ligne directrice
Taille maximale du document 5 KO

Opérations sur plusieurs documents

L'API Amazon Comprehend fournit des opérations par lots qui traitent plusieurs documents avec une seule demande d'API. Les quotas suivants s'appliquent aux opérations par lots.

Description Quot/ligne directrice
Taille maximale du document 5 KO
Nombre maximum de documents par demande 25

Pour plus d'informations sur l'utilisation des opérations sur les documents par lots, consultezTraitement synchrone de plusieurs documents.

Limitation des demandes pour les demandes en temps réel (synchrones)

Amazon Comprehend applique une régulation dynamique aux demandes synchrones. Si la bande passante de traitement du système est disponible, Amazon Comprehend augmente progressivement le nombre de demandes traitées. Pour contrôler l'utilisation des opérations d'API synchrones par votre application, nous vous recommandons d'activer les alertes de facturation ou d'implémenter une limitation de débit dans votre application.

Analyse asynchrone

Cette section décrit les quotas liés à l'analyse asynchrone à l'aide des modèles intégrés.

Les opérations d'API asynchrones prennent chacune en charge un maximum de 10 tâches actives. Pour consulter les quotas pour chaque opération d'API, consultez le tableau des quotas de service dans les points de terminaison Amazon Comprehend et les quotas dans le manuel Amazon Web Services General Reference.

Pour les quotas ajustables, vous pouvez demander une augmentation de quota à l'aide de la console Service Quotas.

Quotas généraux pour les opérations asynchrones

Vous pouvez exécuter des tâches d'analyse asynchrones à l'aide de la console ou de l'une des opérations de l'APIStart*. Pour plus d'informations sur les circonstances dans lesquelles utiliser les opérations asynchrones, consultez. Traitement par lots asynchrone Les quotas suivants s'appliquent à la plupart des Start* opérations d'API pour les modèles intégrés. Pour les exceptions, voirQuotas spécifiques à l'opération pour les tâches asynchrones.

Description Quot/ligne directrice
Taille maximale de chaque document dans les tâches qui détectent les entités, les phrases clés, les informations personnelles et les langues 1 Mo
Taille totale maximale de tous les fichiers d'une demande 5 Go
Taille totale minimale de tous les fichiers d'une demande 500 octets
Nombre maximum de fichiers, un document par fichier 1 000 000
Nombre total maximum de lignes, un document par ligne 1 000 000

Quotas spécifiques à l'opération pour les tâches asynchrones

Cette section décrit les quotas pour des opérations asynchrones spécifiques. Si aucun quota n'est spécifié dans les tableaux suivants, la valeur du quota général s'applique.

Sentiment

Les jobs de sentiment asynchrones, que vous créez avec l'StartSentimentDetectionJobopération, sont soumis aux quotas suivants.

Description Quot/ligne directrice
Taille maximale de chaque document d'entrée 5 KO
Sentiment ciblé

Les jobs de sentiment ciblés asynchrones, que vous créez avec l'StartTargetedSentimentDetectionJobopération, ont les quotas suivants.

Description Quot/ligne directrice
Formats de document pris en charge UTF-8
Taille maximale de chaque document d'une tâche 10 Ko
Taille maximale de tous les documents d'une tâche 300 MO
Nombre maximum de fichiers, un document par fichier 30 000
Nombre total maximum de lignes, un document par ligne (pour tous les fichiers d'une demande) 30 000
Événements

Les tâches de détection d'événements asynchrones, que vous créez avec l'StartEventsDetectionJobopération, ont les quotas suivants.

Description Quotas
Encodage de caractères UTF-8
Taille totale de tous les fichiers d'une tâche 50 Mo
Taille maximale de chaque document d'une tâche 10 Ko
Nombre maximum de fichiers, un document par fichier 5 000
Nombre total maximum de lignes, un document par ligne (pour tous les fichiers demandés) 5 000
Modélisation des rubriques

Les tâches de modélisation de sujets asynchrones, que vous créez avec l'StartTopicsDetectionJobopération, ont les quotas suivants.

Description Quot/ligne directrice
Encodage de caractères UTF-8
Nombre maximum de sujets à renvoyer 100
Taille de fichier maximale pour un fichier, un document par fichier 100 Mo

Pour plus d’informations, consultez Modélisation des rubriques.

Limitation des demandes pour les demandes asynchrones

Chaque opération d'API asynchrone prend en charge un nombre maximum de demandes par seconde (par région, par compte), ainsi qu'un maximum de 10 tâches actives. Pour consulter les quotas pour chaque opération d'API, consultez le tableau des quotas de service dans les points de terminaison Amazon Comprehend et les quotas dans le manuel Amazon Web Services General Reference.

Pour les quotas ajustables, vous pouvez demander une augmentation de quota à l'aide de la console Service Quotas.

Quotas pour les modèles personnalisés

Vous pouvez utiliser Amazon Comprehend pour créer vos propres modèles personnalisés pour une classification personnalisée et une reconnaissance d'entité personnalisée. Cette section fournit les directives et les quotas relatifs à la formation et à l'utilisation de modèles personnalisés. Pour plus d'informations sur les modèles personnalisés, consultezAmazon Comprehend personnalisé.

Quotas généraux

Amazon Comprehend définit des quotas de taille généraux pour chaque type de document d'entrée que vous pouvez analyser à l'aide de modèles personnalisés. Pour les quotas d'analyse en temps réel, voirTailles de document maximales pour une analyse en temps réel. Pour les quotas d'analyse asynchrones, consultez. Entrées pour une analyse personnalisée asynchrone

Chaque opération d'API asynchrone prend en charge un nombre maximum de demandes par seconde (par région, par compte), ainsi qu'un maximum de 10 tâches actives. Pour consulter les quotas pour chaque opération d'API, consultez le tableau des quotas de service dans les points de terminaison Amazon Comprehend et les quotas dans le manuel Amazon Web Services General Reference.

Pour les quotas ajustables, vous pouvez demander une augmentation de quota à l'aide de la console Service Quotas.

Quotas pour les terminaux

Vous créez un point de terminaison pour exécuter une analyse en temps réel avec un modèle personnalisé. Pour plus d'informations sur les points de terminaison, consultezGestion des points de terminaison Amazon Comprehend.

Les quotas suivants s'appliquent aux points de terminaison. Pour plus d'informations sur la procédure à suivre pour demander une augmentation de quota, consultez AWS Service Quotas.

Description Quot/ligne directrice
Nombre maximum de points de terminaison actifs par région pour chaque compte 20
Nombre maximum d'unités d'inférence par région pour chaque compte 200
Nombre maximal d'unités d'inférence par point de terminaison par région 50
Débit maximal par unité d'inférence (caractères) 100/seconde
Débit maximal par unité d'inférence (documents) 2/seconde

Classification des documents

Cette section décrit les directives et les quotas pour les opérations de classification de documents suivantes :

Quotas généraux pour le classement des documents

Le tableau suivant décrit les quotas généraux liés à la formation des classificateurs personnalisés.

Description Quot/ligne directrice
Longueur maximale du nom de classe 5 000 caractères
Nombre de classes (mode multi-classes) 2 à 1 000
Nombre de classes (mode multi-étiquettes) 2 à 100
Format des annotations
Nombre minimum d'annotations par classe (mode multi-classes) 10
Nombre minimum d'annotations par classe (mode multi-étiquettes) 10
Nombre minimum d'annotations (mode multi-étiquettes) 50
Format de fichier CSV
Nombre minimum de documents de formation par classe (mode multi-cours) 50
Nombre minimum de documents de formation par classe (mode multi-étiquettes) 10
Nombre minimal de documents de formation (mode multi-étiquettes) 50

Classification des documents en texte brut

Vous créez et entraînez un modèle en texte brut à l'aide de documents d'entrée en texte brut. Amazon Comprehend fournit des opérations asynchrones et en temps réel pour classer les documents en texte brut à l'aide d'un modèle en texte brut.

Entraînement

Le tableau suivant décrit les quotas liés à l'entraînement d'un classificateur personnalisé avec des documents en texte brut.

Description Quot/ligne directrice
Taille totale de tous les fichiers relatifs à la tâche de formation 5 Go
Nombre maximum de fichiers manifestes augmentés pour la formation d'un classificateur personnalisé 5
Nombre maximum de noms d'attributs pour chaque fichier manifeste augmenté 5
Longueur maximale du nom d'attribut 63 personnages
Analyse en temps réel (synchrone)

Le tableau suivant décrit les quotas liés à la classification en temps réel des documents en texte brut.

Description Quot/ligne directrice
Nombre maximum de documents par demande synchrone 1
Taille maximale du document texte (encodé en UTF-8) 10 Ko
Analyse asynchrone

Le tableau suivant décrit les quotas liés à la classification asynchrone des documents en texte brut.

Description Quot/ligne directrice
Taille totale de tous les fichiers dans une tâche asynchrone 5 Go
Taille de fichier maximale pour un fichier, un document par fichier 10 Mo
Nombre maximum de fichiers, un document par fichier 1 000 000
Nombre total maximum de lignes, un document par ligne (pour tous les fichiers demandés) 1 000 000

Classification des documents semi-structurés

Cette section décrit les directives et les quotas pour la classification des documents semi-structurés. Pour classer des documents semi-structurés, utilisez un modèle de document natif que vous avez entraîné avec des documents d'entrée natifs.

Formation d'un modèle de document natif avec des documents semi-structurés

Le tableau suivant décrit les quotas liés à l'entraînement d'un classificateur personnalisé avec des documents semi-structurés, tels que des documents PDF, des documents Word et des fichiers image.

Description Quot/ligne directrice
Nombre maximum de pages pour tous les documents 10 000
Taille maximale du fichier d'annotations (toutes tailles de fichiers CSV combinées) 5 Mo
Taille du corpus de documents (documents de formation et de test) 10 Go
Tailles de fichiers pour les fichiers de formation et de test
Taille du fichier image (JPG, PNG, TIFF). 1 octet à 10 Mo.

Fichiers TIFF : une page maximum.

Taille de page pour les documents PDF 1 octet—10 Mo
Taille de page pour les documents Word 1 octet—10 Mo
Taille JSON de sortie de l'API Amazon Textract 1 octet—1 Mo
Analyse en temps réel (synchrone)

Cette section décrit les quotas liés à la classification en temps réel des documents semi-structurés.

Le tableau suivant indique les tailles de fichier maximales pour les documents d'entrée. Pour tous les types de documents d'entrée, le maximum du fichier d'entrée est d'une page, avec un maximum de 10 000 caractères.

Type de fichier Taille maximale (API) Taille maximale (console)
Documents texte UTF-8 10 Ko 10 Ko
Documents PDF 10 Mo 5 Mo
Documents Word 10 Mo 5 Mo
Fichiers image 10 Mo 5 Mo
Taille de sortie de l'API Amazon Textract 1 Mo N/A
Analyse asynchrone

Le tableau suivant décrit les quotas liés à la classification asynchrone des documents semi-structurés.

Description Quot/ligne directrice
Nombre maximal de pages pour tous les documents d'entrée pour une tâche 25 000
Taille du corpus de documents 25 Go
Taille du fichier image (JPG, PNG ou TIFF) 1 octet à 10 Mo.

Fichiers TIFF : une page maximum.

Taille de page pour les documents PDF 1 octet—10 Mo
Taille de page pour les documents Word 1 octet—10 Mo
Taille JSON de sortie de l'API Textract 1 octet—1 Mo.

Reconnaissance d'entités personnalisée

Cette section décrit les directives et les quotas pour les opérations suivantes relatives à la reconnaissance d'entités personnalisées :

  • Les tâches de formation relatives à la reconnaissance d'entités ont débuté lors de l'CreateEntityRecognizeropération.

  • Les tâches de reconnaissance d'entités asynchrones ont démarré avec l'StartEntitiesDetectionJobopération.

  • Demandes de reconnaissance d'entités synchrones utilisant l'DetectEntitiesopération.

Reconnaissance d'entités personnalisée pour les documents en texte brut

Amazon Comprehend propose des opérations asynchrones et de synchronisation pour analyser des documents en texte brut à l'aide d'un outil de reconnaissance d'entités personnalisé.

Entraînement

Cette section décrit les quotas liés à la formation d'un outil de reconnaissance d'entités personnalisé pour analyser des documents en texte brut. Pour entraîner le modèle, vous pouvez fournir une liste d'entités ou un ensemble de documents texte annotés.

Le tableau suivant décrit les quotas liés à l'entraînement du modèle avec une liste d'entités.

Description Quot/ligne directrice
Nombre d'entités par modèle 1 à 25
Taille du document (UTF-8) 1 à 5 000 octets
Nombre d'éléments dans la liste des entités 1 à 1 million
Durée de l'inscription individuelle (post-strip) dans la liste des inscrits 1 à 5 000
Taille du corpus de la liste d'entités (tous les documents en texte brut combinés) 5 KO —200 MB

Le tableau suivant décrit les quotas liés à l'entraînement du modèle avec des documents texte annotés.

Description Quot/ligne directrice
Nombre d'entités par modèle/outil de reconnaissance d'entités personnalisé 1 à 25
Taille du document (UTF-8) 1 à 5 000 octets
Nombre de documents (voir Annotations en texte brut) 3 à 200 000
Taille du corpus du document (tous les documents en texte brut combinés) 5 KO - 200 MB
Nombre minimum d'annotations par entité 25
Analyse en temps réel (synchrone)

Le tableau suivant décrit les quotas liés à l'analyse en temps réel de documents en texte brut.

Description Quot/ligne directrice
Nombre maximum de documents par demande synchrone 1
Taille maximale du document texte (encodé en UTF-8) 5 KO
Analyse asynchrone

Le tableau suivant décrit les quotas liés à la reconnaissance d'entités asynchrones de documents en texte brut.

Description Quot/ligne directrice
Taille du document (UTF-8) 1 octet—1 Mo
Nombre maximum de fichiers, un document par fichier 1 000 000
Nombre total maximum de lignes, un document par ligne (pour tous les fichiers demandés) 1 000 000
Taille du corpus du document (tous les documents en texte brut combinés) 1 octet—5 Go

Reconnaissance d'entités personnalisée pour les documents semi-structurés

Amazon Comprehend propose des opérations asynchrones et de synchronisation pour analyser des documents semi-structurés à l'aide d'un outil de reconnaissance d'entités personnalisé. Vous devez entraîner le modèle à l'aide de documents PDF annotés.

Entraînement

Le tableau suivant décrit les quotas liés à la formation d'un outil de reconnaissance d'entités personnalisé (CreateEntityRecognizer) pour analyser des documents semi-structurés.

Description Quot/ligne directrice
Nombre d'entités par modèle/outil de reconnaissance d'entités personnalisé 1 à 25
Taille maximale du fichier d'annotation (UTF-8 JSON) 5 Mo
Nombre de documents 250 à 10 000
Taille du corpus du document (tous les documents en texte brut combinés) 5 KO À 1 GO
Nombre minimum d'annotations par entité 100
Nombre maximum de fichiers manifestes augmentés pour la formation d'un outil de reconnaissance d'entités personnalisé 5
Nombre maximum de noms d'attributs pour chaque fichier manifeste augmenté 5
Longueur maximale du nom d'attribut 63 personnages
Analyse en temps réel (synchrone)

Cette section décrit les quotas liés à l'analyse en temps réel de documents semi-structurés.

Le tableau suivant indique les tailles de fichier maximales pour les documents d'entrée. Pour tous les types de documents d'entrée, le maximum du fichier d'entrée est d'une page, avec un maximum de 10 000 caractères.

Type de fichier Taille maximale (API) Taille maximale (console)
Documents texte UTF-8 10 Ko 10 Ko
Documents PDF 10 Mo 5 Mo
Documents Word 10 Mo 5 Mo
Fichiers image 10 Mo 5 Mo
Textract les fichiers de sortie 1 Mo N/A
Analyse asynchrone

Cette section décrit les quotas pour l'analyse asynchrone de documents semi-structurés.

Description Quot/ligne directrice
Taille de l'image (JPG ou PNG) 1 octet—10 Mo
Taille de l'image (TIFF) 1 octet à 10 Mo. Une page au maximum.
Taille du document (PDF) 1 octet—50 Mo
Taille du document (Docx) 1 octet—5 Mo
Taille du document (UTF-8) 1 octet—1 Mo
Nombre maximum de fichiers, un document par fichier (un document par ligne n'est pas autorisé pour les fichiers image ou les documents PDF/Word) 500
Nombre maximum de pages pour un fichier PDF ou Docx 100
Taille du corpus du document après extraction du texte (texte brut, tous fichiers confondus) 1 octet—5 Go

Pour plus d'informations sur les limites applicables aux images, consultez la section Limites strictes dans Amazon Textract

Quotas pour les volants

Utilisez des volants pour gérer la formation et le suivi des versions de modèles personnalisés à des fins de classification et de reconnaissance d'entités personnalisées. Pour plus d'informations sur Flywheels, voirVolants.

Quotas généraux pour les volants

Les quotas suivants s'appliquent aux volants et aux itérations de volants.

Description Quot/ligne directrice
Nombre maximum de volants 50
Nombre maximum de volants en état CREATING 10
Nombre maximum de jeux de données d'entraînement par volant 50
Nombre maximum de jeux de données de test par volant 50
Nombre maximum de jeux de données ayant le statut INGESTING 10
Nombre maximum d'itérations de volant en cours par compte 10

Quotas de jeux de données pour les modèles de classification personnalisés

Lorsque vous ingérez un jeu de données pour un volant associé à un modèle de classification personnalisé, les quotas suivants s'appliquent.

Description Quot/ligne directrice
Nombre minimum de documents de formation par classe (mode multi-étiquettes) 50
Nombre maximum de documents de formation 1 000 000
Taille minimale du jeu de données 500 octets
Taille maximale du jeu de données 5 Go
Taille de fichier maximale pour un fichier, un document par fichier 10 Mo

Quotas de jeux de données pour les modèles de reconnaissance d'entités personnalisés

Lorsque vous ingérez un ensemble de données pour un volant associé à un modèle de reconnaissance d'entité personnalisé, les quotas suivants s'appliquent.

Description Quot/ligne directrice
Taille maximale du document 5 KO
Nombre minimum de documents de formation 3
Nombre maximum de documents de formation 200 000
Nombre minimum d'annotations par entité 25
Taille maximale du jeu de données 200 Mo