フォームデータ (キーと値のペア) - Amazon Textract

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

フォームデータ (キーと値のペア)

Amazon Textract は、キーと値のペアで、ドキュメントからフォームデータを抽出できます。たとえば、次のテキストでは、Amazon Textract はキーを識別できます (名前:) と値 (アナ・カロライナ).

名前: アナ・カロライナ

検出されたキーと値のペアは、次のように返されます。Blockからの応答内のオブジェクトAnalyzeDocumentそしてGetDocumentAnalysis。♪FeatureTypesキーと値のペア、テーブル、またはその両方に関する情報を取得するための入力パラメータ。キーと値のペアの場合のみ、値を使用します。FORMS。例については、フォームドキュメントからのキーと値のペアの抽出 を参照してください。でドキュメントがどのように表されるかに関する一般情報については、Blockオブジェクト、「」を参照してください。テキスト検出および文書分析応答オブジェクト

KEY_VALUE_SET 型のブロックオブジェクトは、文書内で検出されたリンクされたテキストアイテムに関する情報を格納する KEY または VALUE ブロックオブジェクトのコンテナです。♪EntityType属性を使用して、ブロックがKEYかVALUEかを決定します。

  • あるキーオブジェクトには、リンクテキストのキーに関する情報が含まれています。たとえば、名前:。KEY ブロックには 2 つのリレーションシップリストがあります。VALUE 型の関係は、キーに関連付けられた VALUE ブロックの ID を含むリストです。CHILD 型の関係は、キーのテキストを構成する WORD ブロックの ID のリストです。

  • あるオブジェクトには、キーに関連付けられているテキストに関する情報が含まれています。前の例では、以下のようになっています。アナ・カロライナキーの値はです。名前:。VALUE ブロックは、WORD ブロックを識別する CHILD ブロックのリストとの関係を持ちます。各 WORD ブロックには、値のテキストを構成する単語の 1 つが含まれています。あるVALUEオブジェクトには、選択した要素に関する情報を含めることもできます。詳細については、「選択エレメント」を参照してください。

KEY_VALUE_SET の各インスタンスBlockオブジェクトはページの子ですBlock現在のページに対応するオブジェクト。

次の図は、キーと値のペアの仕組みを示しています。名前: アナ・カロライナで表される。Blockオブジェクト。

次の例は、キーと値のペアの仕組みを示しています。名前: アナ・カロライナは JSON で表されます。

PAGE ブロックにはタイプの CHILD ブロックがありますKEY_VALUE_SETドキュメント内で検出された KEY および VALUE ブロックごとに。

{ "Geometry": .... "Relationships": [ { "Type": "CHILD", "Ids": [ "2602b0a6-20e3-4e6e-9e46-3be57fd0844b", "82aedd57-187f-43dd-9eb1-4f312ca30042", "52be1777-53f7-42f6-a7cf-6d09bdc15a30", // Key - Name: "7ca7caa6-00ef-4cda-b1aa-5571dfed1a7c" // Value - Ana Caroline ] } ], "BlockType": "PAGE", "Id": "8136b2dc-37c1-4300-a9da-6ed8b276ea97" // Page identifier },

以下のJSONは、KEYブロック (52be177-53f7-42f6-a7cf-6d09bdc15a30) がVALUEブロック (7ca7caa6-00ef-4cda-b1aa-5571dfed1a7c) との関係を示している。また、キーのテキストを含むWORDブロック(c734fca6-c4c4-415c-B6c1-30f7510b72ee)のCHILDブロックもある。名前:).

{ "Relationships": [ { "Type": "VALUE", "Ids": [ "7ca7caa6-00ef-4cda-b1aa-5571dfed1a7c" // Value identifier ] }, { "Type": "CHILD", "Ids": [ "c734fca6-c4c4-415c-b6c1-30f7510b72ee" // Name: ] } ], "Confidence": 51.55965805053711, "Geometry": ...., "BlockType": "KEY_VALUE_SET", "EntityTypes": [ "KEY" ], "Id": "52be1777-53f7-42f6-a7cf-6d09bdc15a30" //Key identifier },

次の JSON は、VALUE ブロック 7ca7caa6-00ef-4cda-b1aa-5571dfed1a7c に、値のテキストを構成する単語ブロックの ID の子リストがあることを示しています (アナそしてカロライナ).

{ "Relationships": [ { "Type": "CHILD", "Ids": [ "db553509-64ef-4ecf-ad3c-bea62cc1cd8a", // Ana "e5d7646c-eaa2-413a-95ad-f4ae19f53ef3" // Carolina ] } ], "Confidence": 51.55965805053711, "Geometry": ...., "BlockType": "KEY_VALUE_SET", "EntityTypes": [ "VALUE" ], "Id": "7ca7caa6-00ef-4cda-b1aa-5571dfed1a7c" // Value identifier }

以下の JSON は、Block単語のためのオブジェクト名前:,アナ, およびカロライナ

{ "Geometry": {...}, "Text": "Name:", "TextType": "PRINTED". "BlockType": "WORD", "Confidence": 99.56285858154297, "Id": "c734fca6-c4c4-415c-b6c1-30f7510b72ee" }, { "Geometry": {...}, "Text": "Ana", "TextType": "PRINTED", "BlockType": "WORD", "Confidence": 99.52057647705078, "Id": "db553509-64ef-4ecf-ad3c-bea62cc1cd8a" }, { "Geometry": {...}, "Text": "Carolina", "TextType": "PRINTED", "BlockType": "WORD", "Confidence": 99.84207916259766, "Id": "e5d7646c-eaa2-413a-95ad-f4ae19f53ef3" },