Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Datos de formulario (pares clave-valor)
Amazon Texact puede extraer datos de formulario de documentos en pares clave-valor. Por ejemplo, en el siguiente texto, Amazon Textract puede identificar una clave (Name:) y un valor (Ana Carolina).
Name: Ana Carolina
Los pares clave-valor detectados se devuelven comoBlockobjetos en las respuestas deAnalyzeDocumentyGetDocumentAnalysis. Puede utilizar elFeatureTypes
parámetro de entrada para recuperar información sobre pares clave-valor, tablas o ambos. Solo para pares clave-valor, utilice el valorFORMS
. Para ver un ejemplo, consulte Extracción de pares clave-valor de un documento de formulario. Para obtener información general sobre cómo un documento está representado porBlock
objetos, consulteObjetos de respuesta de detección de texto y análisis de documentos.
Los objetos de bloque con el tipo KEY_VALUE_SET son los contenedores de los objetos KEY o VALUE Block que almacenan información sobre los elementos de texto vinculados detectados en un documento. Puede utilizar elEntityType
para determinar si un bloque es KEY o VALUE.
-
UNACLAVEobjeto contiene información sobre la clave del texto vinculado. Por ejemplo,Name:. Un bloque KEY tiene dos listas de relaciones. Una relación de tipo VALUE es una lista que contiene el ID del bloque VALUE asociado a la clave. Una relación de tipo CHILD es una lista de ID de los bloques WORD que componen el texto de la clave.
-
UNAVALUEobjeto contiene información sobre el texto asociado a una clave. En el modelo de ejemplo anterior,Ana Carolinaes el valor de la claveName:. Un bloque VALUE tiene una relación con una lista de bloques CHILD que identifican bloques WORD. Cada bloque WORD contiene una de las palabras que componen el texto del valor. UNA
VALUE
El objeto también puede contener información sobre los elementos seleccionados. Para obtener más información, consulte Elementos de selección.
Cada instancia de un KEY_VALUE_SETBlock
es un elemento secundario de la PAGEBlock
objeto que corresponde a la página actual.
En el siguiente diagrama se muestra cómo el par clave-valorName: Ana Carolinaestá representado porBlock
objects.
En los siguientes ejemplos se muestra cómo el par clave-valorName: Ana Carolinaestá representado por JSON.
El bloque PAGE tiene bloques CHILD de tipoKEY_VALUE_SET
para cada bloque KEY y VALUE detectados en el documento.
{ "Geometry": .... "Relationships": [ { "Type": "CHILD", "Ids": [ "2602b0a6-20e3-4e6e-9e46-3be57fd0844b", "82aedd57-187f-43dd-9eb1-4f312ca30042", "52be1777-53f7-42f6-a7cf-6d09bdc15a30", // Key - Name: "7ca7caa6-00ef-4cda-b1aa-5571dfed1a7c" // Value - Ana Caroline ] } ], "BlockType": "PAGE", "Id": "8136b2dc-37c1-4300-a9da-6ed8b276ea97" // Page identifier },
El siguiente JSON muestra que el bloque KEY (52be1777-53f7-42f6-a7cf-6d09bdc15a30) tiene una relación con el bloque VALUE (7ca7caa6-00ef-4cda-b1aa-5571dfed1a7c). También tiene un bloque CHILD para el bloque WORD (c734fca6-c4c4-415c-b6c1-30f7510b72ee) que contiene el texto de la clave (Name:).
{ "Relationships": [ { "Type": "VALUE", "Ids": [ "7ca7caa6-00ef-4cda-b1aa-5571dfed1a7c" // Value identifier ] }, { "Type": "CHILD", "Ids": [ "c734fca6-c4c4-415c-b6c1-30f7510b72ee" // Name: ] } ], "Confidence": 51.55965805053711, "Geometry": ...., "BlockType": "KEY_VALUE_SET", "EntityTypes": [ "KEY" ], "Id": "52be1777-53f7-42f6-a7cf-6d09bdc15a30" //Key identifier },
El siguiente JSON muestra que el bloque VALUE 7ca7caa6-00ef-4cda-b1aa-5571dfed1a7c tiene una lista SECUNDARIA de ID para los bloques WORD que componen el texto del valor (AnayCarolina).
{ "Relationships": [ { "Type": "CHILD", "Ids": [ "db553509-64ef-4ecf-ad3c-bea62cc1cd8a", // Ana "e5d7646c-eaa2-413a-95ad-f4ae19f53ef3" // Carolina ] } ], "Confidence": 51.55965805053711, "Geometry": ...., "BlockType": "KEY_VALUE_SET", "EntityTypes": [ "VALUE" ], "Id": "7ca7caa6-00ef-4cda-b1aa-5571dfed1a7c" // Value identifier }
El siguiente JSON muestra elBlock
objetos para las palabrasName:,Ana, yCarolina.
{ "Geometry": {...}, "Text": "Name:", "TextType": "PRINTED". "BlockType": "WORD", "Confidence": 99.56285858154297, "Id": "c734fca6-c4c4-415c-b6c1-30f7510b72ee" }, { "Geometry": {...}, "Text": "Ana", "TextType": "PRINTED", "BlockType": "WORD", "Confidence": 99.52057647705078, "Id": "db553509-64ef-4ecf-ad3c-bea62cc1cd8a" }, { "Geometry": {...}, "Text": "Carolina", "TextType": "PRINTED", "BlockType": "WORD", "Confidence": 99.84207916259766, "Id": "e5d7646c-eaa2-413a-95ad-f4ae19f53ef3" },