Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Pages
Un document est composé d'une ou plusieurs pages. UNBlockobjet de typePAGE
existe pour chaque page du document. UNPAGE
bloc objet contient une liste des ID enfants des lignes de texte, des paires clé-valeur et des tables détectées sur la page de document.
Le JSON pour unPAGE
ressemble à ce qui suit.
{ "Geometry": .... "Relationships": [ { "Type": "CHILD", "Ids": [ "2602b0a6-20e3-4e6e-9e46-3be57fd0844b", // Line - Hello, world. "82aedd57-187f-43dd-9eb1-4f312ca30042", // Line - How are you? "52be1777-53f7-42f6-a7cf-6d09bdc15a30", "7ca7caa6-00ef-4cda-b1aa-5571dfed1a7c" ] } ], "BlockType": "PAGE", "Id": "8136b2dc-37c1-4300-a9da-6ed8b276ea97" // Page identifier },
Si vous utilisez des opérations asynchrones avec un document multipage au format PDF, vous pouvez déterminer la page sur laquelle se trouve un bloc en inspectant lePage
du champBlock
objet. Une image numérisée (image au format JPEG, PNG, PDF ou TIFF) est considérée comme un document d'une seule page, même s'il y a plusieurs pages de document sur l'image. Les opérations asynchrones renvoient toujours unPage
valeur 1 pour les images numérisées.
Le nombre total de pages est renvoyé dans laPages
field ofDocumentMetadata
.DocumentMetadata
est renvoyé avec chaque liste deBlock
objets renvoyés par une opération Amazon Textract.