Sorties pour les tâches d'analyse asynchrones - Amazon Comprehend

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Sorties pour les tâches d'analyse asynchrones

Une fois qu'une tâche d'analyse est terminée, elle stocke les résultats dans le compartiment S3 que vous avez spécifié dans la demande.

Sorties pour entrées de texte

Quel que soit le format des documents de saisie de texte (multi-classes ou multi-étiquettes), le résultat de la tâche consiste en un seul fichier nommé. output.tar.gz Il s'agit d'un fichier d'archive compressé qui contient un fichier texte avec le résultat.

Sortie multiclasse

Lorsque vous utilisez un classificateur entraîné en mode multi-classes, vos résultats s'affichent. classes Chacune d'entre elles classes est la classe utilisée pour créer l'ensemble de catégories lors de l'entraînement de votre classificateur.

Pour plus de détails sur ces champs de sortie, consultez ClassifyDocumentle Amazon Comprehend API Reference.

Les exemples suivants utilisent les classes mutuellement exclusives suivantes.

DOCUMENTARY SCIENCE_FICTION ROMANTIC_COMEDY SERIOUS_DRAMA OTHER

Si le format de vos données d'entrée est d'un document par ligne, le fichier de sortie contient une ligne pour chaque ligne de l'entrée. Chaque ligne inclut le nom du fichier, le numéro de ligne de base zéro de la ligne d'entrée et la ou les classes présentes dans le document. Cela se termine par la certitude qu'Amazon Comprehend a que l'instance individuelle a été correctement classée.

Par exemple :

{"File": "file1.txt", "Line": "0", "Classes": [{"Name": "Documentary", "Score": 0.8642}, {"Name": "Other", "Score": 0.0381}, {"Name": "Serious_Drama", "Score": 0.0372}]} {"File": "file1.txt", "Line": "1", "Classes": [{"Name": "Science_Fiction", "Score": 0.5}, {"Name": "Science_Fiction", "Score": 0.0381}, {"Name": "Science_Fiction", "Score": 0.0372}]} {"File": "file2.txt", "Line": "2", "Classes": [{"Name": "Documentary", "Score": 0.1}, {"Name": "Documentary", "Score": 0.0381}, {"Name": "Documentary", "Score": 0.0372}]} {"File": "file2.txt", "Line": "3", "Classes": [{"Name": "Serious_Drama", "Score": 0.3141}, {"Name": "Other", "Score": 0.0381}, {"Name": "Other", "Score": 0.0372}]}

Si le format de vos données d'entrée est un document par fichier, le fichier de sortie contient une ligne pour chaque document. Chaque ligne contient le nom du fichier et la ou les classes présentes dans le document. Cela se termine par la certitude qu'Amazon Comprehend a classé l'instance individuelle avec précision.

Par exemple :

{"File": "file0.txt", "Classes": [{"Name": "Documentary", "Score": 0.8642}, {"Name": "Other", "Score": 0.0381}, {"Name": "Serious_Drama", "Score": 0.0372}]} {"File": "file1.txt", "Classes": [{"Name": "Science_Fiction", "Score": 0.5}, {"Name": "Science_Fiction", "Score": 0.0381}, {"Name": "Science_Fiction", "Score": 0.0372}]} {"File": "file2.txt", "Classes": [{"Name": "Documentary", "Score": 0.1}, {"Name": "Documentary", "Score": 0.0381}, {"Name": "Domentary", "Score": 0.0372}]} {"File": "file3.txt", "Classes": [{"Name": "Serious_Drama", "Score": 0.3141}, {"Name": "Other", "Score": 0.0381}, {"Name": "Other", "Score": 0.0372}]}

Sortie multi-étiquettes

Lorsque vous utilisez un classificateur entraîné en mode multi-étiquettes, vos résultats s'affichent. labels Chacune de ces étiquettes labels est utilisée pour créer l'ensemble de catégories lors de l'entraînement de votre classificateur.

Les exemples suivants utilisent ces étiquettes uniques.

SCIENCE_FICTION ACTION DRAMA COMEDY ROMANCE

Si le format de vos données d'entrée est d'un document par ligne, le fichier de sortie contient une ligne pour chaque ligne de l'entrée. Chaque ligne inclut le nom du fichier, le numéro de ligne de base zéro de la ligne d'entrée et la ou les classes présentes dans le document. Cela se termine par la certitude qu'Amazon Comprehend a que l'instance individuelle a été correctement classée.

Par exemple :

{"File": "file1.txt", "Line": "0", "Labels": [{"Name": "Action", "Score": 0.8642}, {"Name": "Drama", "Score": 0.650}, {"Name": "Science Fiction", "Score": 0.0372}]} {"File": "file1.txt", "Line": "1", "Labels": [{"Name": "Comedy", "Score": 0.5}, {"Name": "Action", "Score": 0.0381}, {"Name": "Drama", "Score": 0.0372}]} {"File": "file1.txt", "Line": "2", "Labels": [{"Name": "Action", "Score": 0.9934}, {"Name": "Drama", "Score": 0.0381}, {"Name": "Action", "Score": 0.0372}]} {"File": "file1.txt", "Line": "3", "Labels": [{"Name": "Romance", "Score": 0.9845}, {"Name": "Comedy", "Score": 0.8756}, {"Name": "Drama", "Score": 0.7723}, {"Name": "Science_Fiction", "Score": 0.6157}]}

Si le format de vos données d'entrée est un document par fichier, le fichier de sortie contient une ligne pour chaque document. Chaque ligne contient le nom du fichier et la ou les classes présentes dans le document. Cela se termine par la certitude qu'Amazon Comprehend a classé l'instance individuelle avec précision.

Par exemple :

{"File": "file0.txt", "Labels": [{"Name": "Action", "Score": 0.8642}, {"Name": "Drama", "Score": 0.650}, {"Name": "Science Fiction", "Score": 0.0372}]} {"File": "file1.txt", "Labels": [{"Name": "Comedy", "Score": 0.5}, {"Name": "Action", "Score": 0.0381}, {"Name": "Drama", "Score": 0.0372}]} {"File": "file2.txt", "Labels": [{"Name": "Action", "Score": 0.9934}, {"Name": "Drama", "Score": 0.0381}, {"Name": "Action", "Score": 0.0372}]} {"File": "file3.txt”, "Labels": [{"Name": "Romance", "Score": 0.9845}, {"Name": "Comedy", "Score": 0.8756}, {"Name": "Drama", "Score": 0.7723}, {"Name": "Science_Fiction", "Score": 0.6157}]}

Sorties pour documents d'entrée semi-structurés

Pour les documents d'entrée semi-structurés, la sortie peut inclure les champs supplémentaires suivants :

  • DocumentMetadata — Informations d'extraction relatives au document. Les métadonnées incluent une liste de pages du document, avec le nombre de caractères extraits de chaque page. Ce champ est présent dans la réponse si la demande inclut le Byte paramètre.

  • DocumentType — Type de document pour chaque page du document d'entrée. Ce champ est présent dans la réponse si la demande inclut le Byte paramètre.

  • Erreurs : erreurs au niveau de la page détectées par le système lors du traitement du document d'entrée. Le champ est vide si le système n'a détecté aucune erreur.

Pour plus de détails sur ces champs de sortie, consultez ClassifyDocumentle Amazon Comprehend API Reference.

L'exemple suivant montre la sortie d'un PDF fichier numérisé de deux pages.

[{ #First page output "Classes": [ { "Name": "__label__2 ", "Score": 0.9993996620178223 }, { "Name": "__label__3 ", "Score": 0.0004330444789957255 } ], "DocumentMetadata": { "PageNumber": 1, "Pages": 2 }, "DocumentType": "ScannedPDF", "File": "file.pdf", "Version": "VERSION_NUMBER" }, #Second page output { "Classes": [ { "Name": "__label__2 ", "Score": 0.9993996620178223 }, { "Name": "__label__3 ", "Score": 0.0004330444789957255 } ], "DocumentMetadata": { "PageNumber": 2, "Pages": 2 }, "DocumentType": "ScannedPDF", "File": "file.pdf", "Version": "VERSION_NUMBER" }]