Páginas - Amazon Textract

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Páginas

Um documento consiste em uma ou mais páginas. UMABlockobjeto do tipoPAGEexiste para cada página do documento. UMAPAGEobjeto de bloco contém uma lista das IDs filho para as linhas de texto, pares de valores-chave e tabelas detectadas na página do documento.

O JSON para umPAGEO bloco será semelhante à seguinte.

{ "Geometry": .... "Relationships": [ { "Type": "CHILD", "Ids": [ "2602b0a6-20e3-4e6e-9e46-3be57fd0844b", // Line - Hello, world. "82aedd57-187f-43dd-9eb1-4f312ca30042", // Line - How are you? "52be1777-53f7-42f6-a7cf-6d09bdc15a30", "7ca7caa6-00ef-4cda-b1aa-5571dfed1a7c" ] } ], "BlockType": "PAGE", "Id": "8136b2dc-37c1-4300-a9da-6ed8b276ea97" // Page identifier },

Se você estiver usando operações assíncronas com um documento de várias páginas em formato PDF, você pode determinar a página em que um bloco está localizado inspecionando oPagecampo doBlockobjeto. Uma imagem digitalizada (uma imagem em formato JPEG, PNG, PDF ou TIFF) é considerada um documento de página única, mesmo se houver mais de uma página de documento na imagem. Operações assíncronas sempre retornam umPagevalor de 1 para imagens digitalizadas.

O número total de páginas é retornado noPagescampo deDocumentMetadata.DocumentMetadataé retornado com cada lista deBlockobjetos retornados por uma operação do Amazon Textract.