Formulardaten (Schlüssel-Wert-Paare) - Amazon Textract

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Formulardaten (Schlüssel-Wert-Paare)

Amazon Textract kann Formulardaten aus Dokumenten als Schlüssel-Wert-Paare extrahieren. Beispielsweise kann Amazon Textract im folgenden Text einen Schlüssel (Name:) und ein Wert (Ana Carolina) enthalten.

Name: Ana Carolina

Erkannte Schlüssel-Wert-Paare werden alsBlockObjekte in den Antworten vonAnalyzeDocumentundGetDocumentAnalysisaus. Sie können dasFeatureTypesInput-Parameter zum Abrufen von Informationen über Schlüssel-Wert-Paare, Tabellen oder beides. Verwenden Sie nur für Schlüssel-Wert-Paare den WertFORMSaus. Ein Beispiel finden Sie unter Extrahieren von Schlüssel-Wert-Paaren aus einem Formulardokument. Für allgemeine Informationen, wie ein Dokument dargestellt wirdBlockobjekte, sieheAntwortobjekte für Texterkennung und Dokumentanalyseaus.

Blockobjekte mit dem Typ KEY_VALUE_SET sind die Container für KEY- oder VALUE Block-Objekte, die Informationen zu verknüpften Textelementen speichern, die in einem Dokument erkannt wurden. Sie können dasEntityType-Attribut, um festzustellen, ob ein Block ein KEY oder ein WERT ist.

  • EINSCHLÜSSELDas -Objekt enthält Informationen über den Schlüssel für verknüpften Text. Beispiel,Name:aus. Ein KEY-Block hat zwei Beziehungslisten. Eine Beziehung vom Typ VALUE ist eine Liste, die die ID des VALUE-Blocks enthält, der mit dem Schlüssel verknüpft ist. Eine Beziehung vom Typ CHILD ist eine Liste von IDs für die WORD-Blöcke, aus denen der Text des Schlüssels besteht.

  • EINWERTDas -Objekt enthält Informationen über den Text, der einem Schlüssel zugeordnet ist. Für das obige Beispiel gilt:Ana Carolinaist der -Wert für den SchlüsselName:aus. Ein VALUE-Block hat eine Beziehung zu einer Liste von CHILD-Blöcken, die WORD-Blöcke identifizieren. Jeder WORD-Block enthält eines der Wörter, aus denen der Text des Wertes besteht. EINVALUEDas -Objekt kann auch Informationen über ausgewählte Elemente enthalten. Weitere Informationen finden Sie unter Auswahl-Elemente .

Jede Instanz eines KEY_VALUE_SETBlockobject ist untergeordnet der PAGEBlockObjekt, das der aktuellen Seite entspricht.

Das folgende Diagramm zeigt, wie das Schlüssel-Wert-PaarName: Ana Carolinawird vertreten durchBlockObjekte.

Die folgenden Beispiele zeigen, wie das Schlüssel-Wert-PaarName: Ana Carolinawird durch JSON vertreten.

Der PAGE Block hat CHILD-Blöcke vom TypKEY_VALUE_SETfür jeden im Dokument erkannten KEY- und VALUE-Block.

{ "Geometry": .... "Relationships": [ { "Type": "CHILD", "Ids": [ "2602b0a6-20e3-4e6e-9e46-3be57fd0844b", "82aedd57-187f-43dd-9eb1-4f312ca30042", "52be1777-53f7-42f6-a7cf-6d09bdc15a30", // Key - Name: "7ca7caa6-00ef-4cda-b1aa-5571dfed1a7c" // Value - Ana Caroline ] } ], "BlockType": "PAGE", "Id": "8136b2dc-37c1-4300-a9da-6ed8b276ea97" // Page identifier },

Der folgende JSON zeigt, dass der KEY-Block (52be1777-53f7-42f6-a7cf-6d09bdc15a30) eine Beziehung zum VALUE-Block (7ca7caa6-00ef-4cda-b1aa-5571dfed1a7c) hat. Es hat auch einen CHILD-Block für den WORD-Block (c734fca6-c4c4-415c-b6c1-30f7510b72ee), der den Text für den Schlüssel (Name:) enthalten.

{ "Relationships": [ { "Type": "VALUE", "Ids": [ "7ca7caa6-00ef-4cda-b1aa-5571dfed1a7c" // Value identifier ] }, { "Type": "CHILD", "Ids": [ "c734fca6-c4c4-415c-b6c1-30f7510b72ee" // Name: ] } ], "Confidence": 51.55965805053711, "Geometry": ...., "BlockType": "KEY_VALUE_SET", "EntityTypes": [ "KEY" ], "Id": "52be1777-53f7-42f6-a7cf-6d09bdc15a30" //Key identifier },

Der folgende JSON zeigt, dass VALUE Block 7ca7caa6-00ef-4cda-b1aa-5571dfed1a7c eine CHILD-Liste von IDs für die WORD-Blöcke enthält, die den Text des Wertes ausmachen (AnaundCarolina) enthalten.

{ "Relationships": [ { "Type": "CHILD", "Ids": [ "db553509-64ef-4ecf-ad3c-bea62cc1cd8a", // Ana "e5d7646c-eaa2-413a-95ad-f4ae19f53ef3" // Carolina ] } ], "Confidence": 51.55965805053711, "Geometry": ...., "BlockType": "KEY_VALUE_SET", "EntityTypes": [ "VALUE" ], "Id": "7ca7caa6-00ef-4cda-b1aa-5571dfed1a7c" // Value identifier }

Der folgende JSON zeigt dieBlockObjekte für die WörterName:,Ana, undCarolinaaus.

{ "Geometry": {...}, "Text": "Name:", "TextType": "PRINTED". "BlockType": "WORD", "Confidence": 99.56285858154297, "Id": "c734fca6-c4c4-415c-b6c1-30f7510b72ee" }, { "Geometry": {...}, "Text": "Ana", "TextType": "PRINTED", "BlockType": "WORD", "Confidence": 99.52057647705078, "Id": "db553509-64ef-4ecf-ad3c-bea62cc1cd8a" }, { "Geometry": {...}, "Text": "Carolina", "TextType": "PRINTED", "BlockType": "WORD", "Confidence": 99.84207916259766, "Id": "e5d7646c-eaa2-413a-95ad-f4ae19f53ef3" },