Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Sorties pour les tâches d'analyse asynchrones
Une fois qu'une tâche d'analyse est terminée, elle stocke les résultats dans le compartiment S3 que vous avez spécifié dans la demande.
Sorties pour entrées de texte
Quel que soit le format des documents de saisie de texte (multi-classes ou multi-étiquettes), le résultat de la tâche consiste en un seul fichier nommé. output.tar.gz
Il s'agit d'un fichier d'archive compressé qui contient un fichier texte avec le résultat.
Sortie multiclasse
Lorsque vous utilisez un classificateur entraîné en mode multi-classes, vos résultats s'affichent. classes
Chacune d'entre elles classes
est la classe utilisée pour créer l'ensemble de catégories lors de l'entraînement de votre classificateur.
Pour plus de détails sur ces champs de sortie, consultez ClassifyDocumentle Amazon Comprehend API Reference.
Les exemples suivants utilisent les classes mutuellement exclusives suivantes.
DOCUMENTARY
SCIENCE_FICTION
ROMANTIC_COMEDY
SERIOUS_DRAMA
OTHER
Si le format de vos données d'entrée est d'un document par ligne, le fichier de sortie contient une ligne pour chaque ligne de l'entrée. Chaque ligne inclut le nom du fichier, le numéro de ligne de base zéro de la ligne d'entrée et la ou les classes présentes dans le document. Cela se termine par la certitude qu'Amazon Comprehend a que l'instance individuelle a été correctement classée.
Par exemple :
{"File": "file1.txt", "Line": "0", "Classes": [{"Name": "Documentary", "Score": 0.8642}, {"Name": "Other", "Score": 0.0381}, {"Name": "Serious_Drama", "Score": 0.0372}]} {"File": "file1.txt", "Line": "1", "Classes": [{"Name": "Science_Fiction", "Score": 0.5}, {"Name": "Science_Fiction", "Score": 0.0381}, {"Name": "Science_Fiction", "Score": 0.0372}]} {"File": "file2.txt", "Line": "2", "Classes": [{"Name": "Documentary", "Score": 0.1}, {"Name": "Documentary", "Score": 0.0381}, {"Name": "Documentary", "Score": 0.0372}]} {"File": "file2.txt", "Line": "3", "Classes": [{"Name": "Serious_Drama", "Score": 0.3141}, {"Name": "Other", "Score": 0.0381}, {"Name": "Other", "Score": 0.0372}]}
Si le format de vos données d'entrée est un document par fichier, le fichier de sortie contient une ligne pour chaque document. Chaque ligne contient le nom du fichier et la ou les classes présentes dans le document. Cela se termine par la certitude qu'Amazon Comprehend a classé l'instance individuelle avec précision.
Par exemple :
{"File": "file0.txt", "Classes": [{"Name": "Documentary", "Score": 0.8642}, {"Name": "Other", "Score": 0.0381}, {"Name": "Serious_Drama", "Score": 0.0372}]} {"File": "file1.txt", "Classes": [{"Name": "Science_Fiction", "Score": 0.5}, {"Name": "Science_Fiction", "Score": 0.0381}, {"Name": "Science_Fiction", "Score": 0.0372}]} {"File": "file2.txt", "Classes": [{"Name": "Documentary", "Score": 0.1}, {"Name": "Documentary", "Score": 0.0381}, {"Name": "Domentary", "Score": 0.0372}]} {"File": "file3.txt", "Classes": [{"Name": "Serious_Drama", "Score": 0.3141}, {"Name": "Other", "Score": 0.0381}, {"Name": "Other", "Score": 0.0372}]}
Sortie multi-étiquettes
Lorsque vous utilisez un classificateur entraîné en mode multi-étiquettes, vos résultats s'affichent. labels
Chacune de ces étiquettes labels
est utilisée pour créer l'ensemble de catégories lors de l'entraînement de votre classificateur.
Les exemples suivants utilisent ces étiquettes uniques.
SCIENCE_FICTION
ACTION
DRAMA
COMEDY
ROMANCE
Si le format de vos données d'entrée est d'un document par ligne, le fichier de sortie contient une ligne pour chaque ligne de l'entrée. Chaque ligne inclut le nom du fichier, le numéro de ligne de base zéro de la ligne d'entrée et la ou les classes présentes dans le document. Cela se termine par la certitude qu'Amazon Comprehend a que l'instance individuelle a été correctement classée.
Par exemple :
{"File": "file1.txt", "Line": "0", "Labels": [{"Name": "Action", "Score": 0.8642}, {"Name": "Drama", "Score": 0.650}, {"Name": "Science Fiction", "Score": 0.0372}]} {"File": "file1.txt", "Line": "1", "Labels": [{"Name": "Comedy", "Score": 0.5}, {"Name": "Action", "Score": 0.0381}, {"Name": "Drama", "Score": 0.0372}]} {"File": "file1.txt", "Line": "2", "Labels": [{"Name": "Action", "Score": 0.9934}, {"Name": "Drama", "Score": 0.0381}, {"Name": "Action", "Score": 0.0372}]} {"File": "file1.txt", "Line": "3", "Labels": [{"Name": "Romance", "Score": 0.9845}, {"Name": "Comedy", "Score": 0.8756}, {"Name": "Drama", "Score": 0.7723}, {"Name": "Science_Fiction", "Score": 0.6157}]}
Si le format de vos données d'entrée est un document par fichier, le fichier de sortie contient une ligne pour chaque document. Chaque ligne contient le nom du fichier et la ou les classes présentes dans le document. Cela se termine par la certitude qu'Amazon Comprehend a classé l'instance individuelle avec précision.
Par exemple :
{"File": "file0.txt", "Labels": [{"Name": "Action", "Score": 0.8642}, {"Name": "Drama", "Score": 0.650}, {"Name": "Science Fiction", "Score": 0.0372}]} {"File": "file1.txt", "Labels": [{"Name": "Comedy", "Score": 0.5}, {"Name": "Action", "Score": 0.0381}, {"Name": "Drama", "Score": 0.0372}]} {"File": "file2.txt", "Labels": [{"Name": "Action", "Score": 0.9934}, {"Name": "Drama", "Score": 0.0381}, {"Name": "Action", "Score": 0.0372}]} {"File": "file3.txt”, "Labels": [{"Name": "Romance", "Score": 0.9845}, {"Name": "Comedy", "Score": 0.8756}, {"Name": "Drama", "Score": 0.7723}, {"Name": "Science_Fiction", "Score": 0.6157}]}
Sorties pour documents d'entrée semi-structurés
Pour les documents d'entrée semi-structurés, la sortie peut inclure les champs supplémentaires suivants :
DocumentMetadata — Informations d'extraction relatives au document. Les métadonnées incluent une liste de pages du document, avec le nombre de caractères extraits de chaque page. Ce champ est présent dans la réponse si la demande inclut le
Byte
paramètre.DocumentType — Type de document pour chaque page du document d'entrée. Ce champ est présent dans la réponse si la demande inclut le
Byte
paramètre.Erreurs : erreurs au niveau de la page détectées par le système lors du traitement du document d'entrée. Le champ est vide si le système n'a détecté aucune erreur.
Pour plus de détails sur ces champs de sortie, consultez ClassifyDocumentle Amazon Comprehend API Reference.
L'exemple suivant montre la sortie d'un PDF fichier numérisé de deux pages.
[{ #First page output "Classes": [ { "Name": "__label__2 ", "Score": 0.9993996620178223 }, { "Name": "__label__3 ", "Score": 0.0004330444789957255 } ], "DocumentMetadata": { "PageNumber": 1, "Pages": 2 }, "DocumentType": "ScannedPDF", "File": "file.pdf", "Version": "VERSION_NUMBER" }, #Second page output { "Classes": [ { "Name": "__label__2 ", "Score": 0.9993996620178223 }, { "Name": "__label__3 ", "Score": 0.0004330444789957255 } ], "DocumentMetadata": { "PageNumber": 2, "Pages": 2 }, "DocumentType": "ScannedPDF", "File": "file.pdf", "Version": "VERSION_NUMBER" }]