Pages

Un document est composé d'une ou plusieurs pages. UNBlockobjet de typePAGEexiste pour chaque page du document. UNPAGEbloc objet contient une liste des ID enfants des lignes de texte, des paires clé-valeur et des tables détectées sur la page de document.

Le JSON pour unPAGEressemble à ce qui suit.


{

    "Geometry": .... 
    "Relationships": [
        {
            "Type": "CHILD", 
            "Ids": [
                "2602b0a6-20e3-4e6e-9e46-3be57fd0844b", // Line - Hello, world.
                "82aedd57-187f-43dd-9eb1-4f312ca30042", // Line - How are you?
                "52be1777-53f7-42f6-a7cf-6d09bdc15a30", 
                "7ca7caa6-00ef-4cda-b1aa-5571dfed1a7c"   
            ]
        }
    ], 
    "BlockType": "PAGE", 
    "Id": "8136b2dc-37c1-4300-a9da-6ed8b276ea97"  // Page identifier
},

Si vous utilisez des opérations asynchrones avec un document multipage au format PDF, vous pouvez déterminer la page sur laquelle se trouve un bloc en inspectant lePagedu champBlockobjet. Une image numérisée (image au format JPEG, PNG, PDF ou TIFF) est considérée comme un document d'une seule page, même s'il y a plusieurs pages de document sur l'image. Les opérations asynchrones renvoient toujours unPagevaleur 1 pour les images numérisées.

Le nombre total de pages est renvoyé dans laPagesfield ofDocumentMetadata.DocumentMetadataest renvoyé avec chaque liste deBlockobjets renvoyés par une opération Amazon Textract.

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

Objets de réponse Détection de texte et analyse de documents

Lignes et mots de texte