Halaman - Amazon Textract

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Halaman

Sebuah dokumen terdiri dari satu atau beberapa halaman. SEBUAHBlockobjek tipePAGEada untuk setiap halaman dokumen. SEBUAHPAGEblok objek berisi daftar ID anak untuk baris teks, pasangan kunci-nilai, dan tabel yang terdeteksi pada halaman dokumen.

JSON untukPAGEterlihat seperti berikut ini.

{ "Geometry": .... "Relationships": [ { "Type": "CHILD", "Ids": [ "2602b0a6-20e3-4e6e-9e46-3be57fd0844b", // Line - Hello, world. "82aedd57-187f-43dd-9eb1-4f312ca30042", // Line - How are you? "52be1777-53f7-42f6-a7cf-6d09bdc15a30", "7ca7caa6-00ef-4cda-b1aa-5571dfed1a7c" ] } ], "BlockType": "PAGE", "Id": "8136b2dc-37c1-4300-a9da-6ed8b276ea97" // Page identifier },

Jika Anda menggunakan operasi asinkron dengan dokumen multipage yang ada dalam format PDF, Anda dapat menentukan halaman tempat blok berada di dengan memeriksaPagebidangBlockobjek. Gambar yang dipindai (gambar dalam format JPEG, PNG, PDF, atau TIFF) dianggap sebagai dokumen satu halaman, bahkan jika ada lebih dari satu halaman dokumen pada gambar. Operasi asinkron selalu mengembalikanPagenilai 1 untuk gambar yang dipindai.

Jumlah total halaman dikembalikan dalamPagesbidangDocumentMetadata.DocumentMetadatadikembalikan dengan setiap daftarBlockobjek yang dikembalikan oleh operasi Amazon Textract.