表單數據(鍵值對) - Amazon Textract

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

表單數據(鍵值對)

Amazon Textract 可以從文件中提取表單數據作為鍵/值對。例如,在以下的文字中,Amazon Textract 可以識別金鑰 (名稱:)和一個值(安娜·卡羅萊納州

名稱: 安娜·卡羅萊納州

檢測到的金鑰值組返回為Block響應中的對象AnalyzeDocumentGetDocumentAnalysis。您可以使用FeatureTypes輸入參數來檢索關於鍵值對、表或兩者的信息。僅對於鍵值對,請使用值FORMS。如需範例,請參閱 從表單文檔中提取鍵值對。如需文件如何由Block對象,請參閲文本檢測和文檔分析響應對象

類型為 KEY_VALUE_SET 的塊對象是用於存儲文檔中檢測到的鏈接文本項的信息的鍵或值塊對象的容器。您可以使用EntityType屬性來確定塊是 KEY 還是值。

  • 一個物件包含鏈接文字鍵的資訊。例如:名稱:。KEY 塊有兩個關係列表。VALUE 類型的關係是一個列表,其中包含與該鍵相關聯的 VALUE 塊的 ID。類型的關係是組成鍵文本的 WORD 塊的 ID 列表。

  • 一個物件包含與鍵相關的文字的資訊。在上述範例中,安娜·卡羅萊納州是鍵的值。名稱:。VALUE 塊與標識 WORD 塊的子塊列表存在關係。每個 WORD 塊包含組成值文本的單詞之一。一個VALUE物件也可以包含選取元素的資訊。如需詳細資訊,請參閱 選擇元素

鍵值集的每個實例Block物件是 PAGE 的子項Block對象,該對應於當前頁面。

下圖顯示鍵/值對名稱: 安娜·卡羅萊納州表示為Block物件。

以下範例會示範鍵/值對名稱: 安娜·卡羅萊納州由 JSON 表示。

頁面塊具有類型為KEY_VALUE_SET對於文檔中檢測到的每個鍵和值塊。

{ "Geometry": .... "Relationships": [ { "Type": "CHILD", "Ids": [ "2602b0a6-20e3-4e6e-9e46-3be57fd0844b", "82aedd57-187f-43dd-9eb1-4f312ca30042", "52be1777-53f7-42f6-a7cf-6d09bdc15a30", // Key - Name: "7ca7caa6-00ef-4cda-b1aa-5571dfed1a7c" // Value - Ana Caroline ] } ], "BlockType": "PAGE", "Id": "8136b2dc-37c1-4300-a9da-6ed8b276ea97" // Page identifier },

下面的 JSON 顯示了密鑰塊(52be1777-53f7-4f6-4f6-a7c)與值塊有關係(7ca7Ca6-00EF -41a-51a-5571a7c)。它還有一個用於單詞塊的子塊(c734fca6-c4c4-415-b6c1-30f7510b72ee),其中包含密鑰的文本(名稱:

{ "Relationships": [ { "Type": "VALUE", "Ids": [ "7ca7caa6-00ef-4cda-b1aa-5571dfed1a7c" // Value identifier ] }, { "Type": "CHILD", "Ids": [ "c734fca6-c4c4-415c-b6c1-30f7510b72ee" // Name: ] } ], "Confidence": 51.55965805053711, "Geometry": ...., "BlockType": "KEY_VALUE_SET", "EntityTypes": [ "KEY" ], "Id": "52be1777-53f7-42f6-a7cf-6d09bdc15a30" //Key identifier },

下面的 JSON 顯示值塊 7ca7caa6-00ef-4cda-b1aa-5571dfed1a7c 具有組成值文本的字塊的子 ID 列表 (安娜卡羅萊納州

{ "Relationships": [ { "Type": "CHILD", "Ids": [ "db553509-64ef-4ecf-ad3c-bea62cc1cd8a", // Ana "e5d7646c-eaa2-413a-95ad-f4ae19f53ef3" // Carolina ] } ], "Confidence": 51.55965805053711, "Geometry": ...., "BlockType": "KEY_VALUE_SET", "EntityTypes": [ "VALUE" ], "Id": "7ca7caa6-00ef-4cda-b1aa-5571dfed1a7c" // Value identifier }

下面的 JSON 顯示了Block單詞的對象名稱:安娜,以及卡羅萊納州

{ "Geometry": {...}, "Text": "Name:", "TextType": "PRINTED". "BlockType": "WORD", "Confidence": 99.56285858154297, "Id": "c734fca6-c4c4-415c-b6c1-30f7510b72ee" }, { "Geometry": {...}, "Text": "Ana", "TextType": "PRINTED", "BlockType": "WORD", "Confidence": 99.52057647705078, "Id": "db553509-64ef-4ecf-ad3c-bea62cc1cd8a" }, { "Geometry": {...}, "Text": "Carolina", "TextType": "PRINTED", "BlockType": "WORD", "Confidence": 99.84207916259766, "Id": "e5d7646c-eaa2-413a-95ad-f4ae19f53ef3" },