ページ - Amazon Textract

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

ページ

ドキュメントは 1 ページ以上で構成されます。あるBlock型のオブジェクトPAGEドキュメントの各ページに存在します。あるPAGEブロックオブジェクトには、ドキュメントページで検出されたテキスト行、キーと値のペア、およびテーブルの子 ID のリストが含まれます。

の JSONPAGEblock は次の例のようになります。

{ "Geometry": .... "Relationships": [ { "Type": "CHILD", "Ids": [ "2602b0a6-20e3-4e6e-9e46-3be57fd0844b", // Line - Hello, world. "82aedd57-187f-43dd-9eb1-4f312ca30042", // Line - How are you? "52be1777-53f7-42f6-a7cf-6d09bdc15a30", "7ca7caa6-00ef-4cda-b1aa-5571dfed1a7c" ] } ], "BlockType": "PAGE", "Id": "8136b2dc-37c1-4300-a9da-6ed8b276ea97" // Page identifier },

PDF 形式の複数ページのドキュメントで非同期操作を使用している場合は、PageのフィールドBlockオブジェクト。スキャンした画像(JPEG、PNG、PDF、または TIFF 形式の画像)は、画像に複数のドキュメントページがあっても、単一ページのドキュメントと見なされます。非同期操作は常にPageスキャンした画像の値 1。

合計ページ数は、PagesのフィールドDocumentMetadataDocumentMetadataの各リストとともに返されます。BlockAmazon Textract オペレーションによって返されるオブジェクト。