Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Sorties pour les tâches d'analyse asynchrones
Une fois le travail d'analyse terminé, il stocke les résultats dans le compartiment S3 que vous avez spécifié dans la demande.
Sorties pour entrées de texte
Pour les fichiers de saisie de texte, la sortie consiste en une liste d'entités pour chaque document d'entrée.
L'exemple suivant montre la sortie de deux documents à partir d'un fichier d'entrée nommé50_docs, en utilisant un format de document par ligne.
{ "File": "50_docs", "Line": 0, "Entities": [ { "BeginOffset": 0, "EndOffset": 22, "Score": 0.9763959646224976, "Text": "John Johnson", "Type": "JUDGE" } ] } { "File": "50_docs", "Line": 1, "Entities": [ { "BeginOffset": 11, "EndOffset": 15, "Score": 0.9615424871444702, "Text": "Thomas Kincaid", "Type": "JUDGE" } ] }
Sorties pour entrées semi-structurées
Pour les documents d'entrée semi-structurés, la sortie peut inclure les champs supplémentaires suivants :
DocumentMetadata — Informations d'extraction relatives au document. Les métadonnées incluent une liste de pages du document, avec le nombre de caractères extraits de chaque page. Ce champ est présent dans la réponse si la demande inclut le
Byte
paramètre.DocumentType — Type de document pour chaque page du document d'entrée. Ce champ est présent dans la réponse à une demande incluant le
Byte
paramètre.Blocs : informations relatives à chaque bloc de texte du document d'entrée. Les blocs peuvent s'imbriquer dans un bloc. Un bloc de page contient un bloc pour chaque ligne de texte, qui contient un bloc pour chaque mot. Ce champ est présent dans la réponse à une demande incluant le
Byte
paramètre.BlockReferences — Une référence à chaque bloc pour cette entité. Ce champ est présent dans la réponse à une demande incluant le
Byte
paramètre. Le champ n'est pas présent pour les fichiers texte.Erreurs : erreurs au niveau de la page détectées par le système lors du traitement du document d'entrée. Le champ est vide si le système n'a détecté aucune erreur.
Pour plus de détails sur ces champs de sortie, consultez DetectEntitiesle manuel Amazon Comprehend API Reference
L'exemple suivant montre le résultat d'un document d'entrée PDF natif d'une page.
Exemple de résultat d'une analyse de reconnaissance d'entités personnalisée d'un document PDF
{ "Blocks": [ { "BlockType": "LINE", "Geometry": { "BoundingBox": { "Height": 0.012575757575757575, "Left": 0.0, "Top": 0.0015063131313131314, "Width": 0.02262091503267974 }, "Polygon": [ { "X": 0.0, "Y": 0.0015063131313131314 }, { "X": 0.02262091503267974, "Y": 0.0015063131313131314 }, { "X": 0.02262091503267974, "Y": 0.014082070707070706 }, { "X": 0.0, "Y": 0.014082070707070706 } ] }, "Id": "4330efed-6334-4fc4-ba48-e050afa95c8d", "Page": 1, "Relationships": [ { "ids": [ "f343ce48-583d-4abe-b84b-a232e266450f" ], "type": "CHILD" } ], "Text": "S-3" }, { "BlockType": "WORD", "Geometry": { "BoundingBox": { "Height": 0.012575757575757575, "Left": 0.0, "Top": 0.0015063131313131314, "Width": 0.02262091503267974 }, "Polygon": [ { "X": 0.0, "Y": 0.0015063131313131314 }, { "X": 0.02262091503267974, "Y": 0.0015063131313131314 }, { "X": 0.02262091503267974, "Y": 0.014082070707070706 }, { "X": 0.0, "Y": 0.014082070707070706 } ] }, "Id": "f343ce48-583d-4abe-b84b-a232e266450f", "Page": 1, "Relationships": [], "Text": "S-3" } ], "DocumentMetadata": { "PageNumber": 1, "Pages": 1 }, "DocumentType": "NativePDF", "Entities": [ { "BlockReferences": [ { "BeginOffset": 25, "BlockId": "4330efed-6334-4fc4-ba48-e050afa95c8d", "ChildBlocks": [ { "BeginOffset": 1, "ChildBlockId": "cbba5534-ac69-4bc4-beef-306c659f70a6", "EndOffset": 6 } ], "EndOffset": 30 } ], "Score": 0.9998825926329088, "Text": "0.001", "Type": "OFFERING_PRICE" }, { "BlockReferences": [ { "BeginOffset": 41, "BlockId": "f343ce48-583d-4abe-b84b-a232e266450f", "ChildBlocks": [ { "BeginOffset": 0, "ChildBlockId": "292a2e26-21f0-401b-a2bf-03aa4c47f787", "EndOffset": 9 } ], "EndOffset": 50 } ], "Score": 0.9809727537330395, "Text": "6,097,560", "Type": "OFFERED_SHARES" } ], "File": "example.pdf", "Version": "2021-04-30" }