Exécution de tâches d'analyse pour une reconnaissance d'entités personnalisée - Amazon Comprehend

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Exécution de tâches d'analyse pour une reconnaissance d'entités personnalisée

Vous pouvez exécuter une tâche d'analyse asynchrone pour détecter des entités personnalisées dans un ensemble d'un ou de plusieurs documents.

Avant de commencer

Vous avez besoin d'un modèle de reconnaissance d'entités personnalisé (également appelé outil de reconnaissance) avant de pouvoir détecter des entités personnalisées. Pour plus d'informations sur ces modèles, consultezFormer des modèles de reconnaissance d'entités personnalisés.

Un outil de reconnaissance entraîné avec des annotations en texte brut prend en charge la détection d'entités uniquement pour les documents en texte brut. Un outil de reconnaissance formé à l'aide d'annotations de documents PDF permet de détecter les entités pour les documents en texte brut, les images, les fichiers PDF et les documents Word. Pour les fichiers autres que des fichiers texte, Amazon Comprehend effectue une extraction de texte avant d'exécuter l'analyse. Pour plus d'informations sur les fichiers d'entrée, consultezEntrées pour une analyse personnalisée asynchrone.

Si vous prévoyez d'analyser des fichiers image ou des documents PDF numérisés, votre politique IAM doit autoriser l'utilisation de deux méthodes d'API Amazon Textract DetectDocumentText ( AnalyzeDocumentet). Amazon Comprehend invoque ces méthodes lors de l'extraction de texte. Pour un exemple de politique, consultez Autorisations requises pour effectuer des actions d'analyse de documents.

Pour exécuter une tâche d'analyse asynchrone, vous devez suivre les étapes générales suivantes :

  1. Stockez les documents dans un compartiment Amazon S3.

  2. Utilisez l'API ou la console pour démarrer le travail d'analyse.

  3. Surveillez la progression de la tâche d'analyse.

  4. Une fois le travail terminé, récupérez les résultats de l'analyse dans le compartiment S3 que vous avez spécifié lorsque vous avez démarré le travail.