选择元素 - Amazon Textract

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

选择元素

Amazon Textract 可以检测选择元素,例如文档页面上的选项按钮(单选按钮)和复选框。可以在中检测到选择元素表单数据然后在桌子. 例如,在表单上检测到下表时,Amazon Textract 会检测到表格单元格中的复选框。

同意

Neutral

不同意

服务不错

易于使用

公平的价格

检测到的选择元素将返回为Block来自的响应中的对象AnalyzeDocumentGetDocumentAnalysis.

注意

您可以使用FeatureTypes输入参数来检索关于键值对、表或两者的信息。例如,如果对表进行筛选,则响应将包括在表中检测到的选择元素。在键值对中检测到的选择元素不包括在响应中。

有关选择元素的信息包含在Block类型的对象SELECTION_ELEMENT. 要确定可选元素的状态,请使用SelectionStatus字段中的SELECTION_ELEMENT阻止。状态可以是已选中要么没有选择. 例如,的值SelectionStatus对于上一张图片是已选中.

一个SELECTION_ELEMENT Block对象与键值对或表格单元格关联。一个SELECTION_ELEMENT Block对象包含选择元素的边界框信息Geometry字段中返回的子位置类型。一个SELECTION_ELEMENT Block对象不是一个孩子PAGE Block对象。

表单数据(键值对)

键值对用于表示在表单上检测到的选择元素。这些区域有:KEY块包含选择元素的文本。这些区域有:VALUE块包含 SELECTION_ELEMENT 块。下图显示了选择元素的表示方式。Block对象。

有关键值对的更多信息,请参阅表单数据(键值对).

以下 JSON 代码段显示了包含选择元素的键值对的键值对的键(男 ☑)。子 ID(编号 bd14cfd5-9005-498b-a7f3-45ceb171f0ff)是包含选择元素文本的 WORD 块的 ID()。值 ID(编号 24aaac7f-FCC-49c7-a4f0-3688b05586d4)是VALUE包含SELECTION_ELEMENT阻止对象。

{ "Relationships": [ { "Type": "VALUE", "Ids": [ "24aaac7f-fcce-49c7-a4f0-3688b05586d4" // Value containing Selection Element ] }, { "Type": "CHILD", "Ids": [ "bd14cfd5-9005-498b-a7f3-45ceb171f0ff" // WORD - male ] } ], "Confidence": 94.15619659423828, "Geometry": { "BoundingBox": { "Width": 0.022914813831448555, "Top": 0.08072036504745483, "Left": 0.18966935575008392, "Height": 0.014860388822853565 }, "Polygon": [ { "Y": 0.08072036504745483, "X": 0.18966935575008392 }, { "Y": 0.08072036504745483, "X": 0.21258416771888733 }, { "Y": 0.09558075666427612, "X": 0.21258416771888733 }, { "Y": 0.09558075666427612, "X": 0.18966935575008392 } ] }, "BlockType": "KEY_VALUE_SET", "EntityTypes": [ "KEY" ], "Id": "a118dc43-d5f7-49a2-a20a-5f876d9ffd79" }

以下 JSON 片段是该词的 WORD 块. WORD 模块还有一个父级 LINE 块。

{ "Geometry": { "BoundingBox": { "Width": 0.022464623674750328, "Top": 0.07842985540628433, "Left": 0.18863198161125183, "Height": 0.01617223583161831 }, "Polygon": [ { "Y": 0.07842985540628433, "X": 0.18863198161125183 }, { "Y": 0.07842985540628433, "X": 0.2110965996980667 }, { "Y": 0.09460209310054779, "X": 0.2110965996980667 }, { "Y": 0.09460209310054779, "X": 0.18863198161125183 } ] }, "Text": "Male", "BlockType": "WORD", "Confidence": 54.06439208984375, "Id": "bd14cfd5-9005-498b-a7f3-45ceb171f0ff" },

VALUE 块有一个子项(编号为 f2f5e8d-e73a-4e99-a095-053acd3b6bfb),即选择 _ELECTION_E8d-e73a-4e99-a095-053acd3b6bfb)。

{ "Relationships": [ { "Type": "CHILD", "Ids": [ "f2f5e8cd-e73a-4e99-a095-053acd3b6bfb" // Selection element ] } ], "Confidence": 94.15619659423828, "Geometry": { "BoundingBox": { "Width": 0.017281491309404373, "Top": 0.07643391191959381, "Left": 0.2271782010793686, "Height": 0.026274094358086586 }, "Polygon": [ { "Y": 0.07643391191959381, "X": 0.2271782010793686 }, { "Y": 0.07643391191959381, "X": 0.24445968866348267 }, { "Y": 0.10270800441503525, "X": 0.24445968866348267 }, { "Y": 0.10270800441503525, "X": 0.2271782010793686 } ] }, "BlockType": "KEY_VALUE_SET", "EntityTypes": [ "VALUE" ], "Id": "24aaac7f-fcce-49c7-a4f0-3688b05586d4" }, }

以下 JSON 是 SELECTION_ELEMENT 块。的价值SelectionStatus表示复选框处于选中状态。

{ "Geometry": { "BoundingBox": { "Width": 0.020316146314144135, "Top": 0.07575977593660355, "Left": 0.22590067982673645, "Height": 0.027631107717752457 }, "Polygon": [ { "Y": 0.07575977593660355, "X": 0.22590067982673645 }, { "Y": 0.07575977593660355, "X": 0.2462168186903 }, { "Y": 0.1033908873796463, "X": 0.2462168186903 }, { "Y": 0.1033908873796463, "X": 0.22590067982673645 } ] }, "BlockType": "SELECTION_ELEMENT", "SelectionStatus": "SELECTED", "Confidence": 74.14942932128906, "Id": "f2f5e8cd-e73a-4e99-a095-053acd3b6bfb" }

表单元格

Amazon Textract 可以检测表格单元格中的选择元素。例如,下表中的单元格有复选框。

同意

Neutral

不同意

服务不错

易于使用

公平的价格

一个CELL可以包含子项SELECTION_ELEMENT用于选择元素的对象以及子元素WORD阻止检测到的文本。

有关表的更多信息,请参阅.

TABLEBlock上一个表格的对象看起来类似于这个。

{ "Geometry": {.....}, "Relationships": [ { "Type": "CHILD", "Ids": [ "652c09eb-8945-473d-b1be-fa03ac055928", "37efc5cc-946d-42cd-aa04-e68e5ed4741d", "4a44940a-435a-4c5c-8a6a-7fea341fa295", "2de20014-9a3b-4e26-b453-0de755144b1a", "8ed78aeb-5c9a-4980-b669-9e08b28671d2", "1f8e1c68-2c97-47b2-847c-a19619c02ca9", "9927e1d1-6018-4960-ac17-aadb0a94f4d9", "68f0ed8b-a887-42a5-b618-f68b494a6034", "fcba16e0-6bd7-4ea5-b86e-36e8330b68ea", "2250357c-ae34-4ed9-86da-45dac5a5e903", "c63ad40d-5a14-4646-a8df-2d4304213dbc", // Cell "2b8417dc-e65f-4fcd-aa0f-61a23f1e8cb0", "26c62932-72f0-4dc2-9893-1ae27829c060", "27f291cc-abf4-4c23-aa24-676abe99cb1e", "7e5ce028-1bcd-4d9f-ad42-15ac181c5b47", "bf32e3d2-efa2-4fc1-b09b-ab9cc52ff734" ] } ], "BlockType": "TABLE", "Confidence": 99.99993896484375, "Id": "f66eac36-2e74-406e-8032-14d1c14e0b86" }

单元格BLOCK包含复选框的单元格的对象(ID c63ad40d-5a14-4646-a8df-2d4304213dbc)服务不错看上去与下类似。它包括一个孩子Block(Id = 26d122fd-c5f4-4b53-92c4-0ae92730ee1e)这就是SELECTION_ELEMENT Block对象用于复选框。

{ "Geometry": {.....}, "Relationships": [ { "Type": "CHILD", "Ids": [ "26d122fd-c5f4-4b53-92c4-0ae92730ee1e" // Selection Element ] } ], "Confidence": 79.741689682006836, "RowSpan": 1, "RowIndex": 3, "ColumnIndex": 3, "ColumnSpan": 1, "BlockType": "CELL", "Id": "c63ad40d-5a14-4646-a8df-2d4304213dbc" }

Selection_ElementBlock对象如下所示。的价值SelectionStatus表示复选框处于选中状态。

{ "Geometry": {.......}, "BlockType": "SELECTION_ELEMENT", "SelectionStatus": "SELECTED", "Confidence": 88.79517364501953, "Id": "26d122fd-c5f4-4b53-92c4-0ae92730ee1e" }