Seleccione sus preferencias de cookies

Usamos cookies esenciales y herramientas similares que son necesarias para proporcionar nuestro sitio y nuestros servicios. Usamos cookies de rendimiento para recopilar estadísticas anónimas para que podamos entender cómo los clientes usan nuestro sitio y hacer mejoras. Las cookies esenciales no se pueden desactivar, pero puede hacer clic en “Personalizar” o “Rechazar” para rechazar las cookies de rendimiento.

Si está de acuerdo, AWS y los terceros aprobados también utilizarán cookies para proporcionar características útiles del sitio, recordar sus preferencias y mostrar contenido relevante, incluida publicidad relevante. Para aceptar o rechazar todas las cookies no esenciales, haga clic en “Aceptar” o “Rechazar”. Para elegir opciones más detalladas, haga clic en “Personalizar”.

Salidas para análisis en tiempo real

Modo de enfoque
Salidas para análisis en tiempo real - Amazon Comprehend

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Salidas para entradas de texto

Si introduce texto mediante el parámetro Text, la salida consiste en una matriz de entidades detectadas por el análisis. En el siguiente ejemplo se muestra un análisis que detectó dos entidades de JUDGE.

{ "Entities": [ { "BeginOffset": 0, "EndOffset": 22, "Score": 0.9763959646224976, "Text": "John Johnson", "Type": "JUDGE" }, { "BeginOffset": 11, "EndOffset": 15, "Score": 0.9615424871444702, "Text": "Thomas Kincaid", "Type": "JUDGE" } ] }

Salidas para entradas semiestructuradas

En el caso de un documento de entrada semiestructurado o un archivo de texto, la salida puede incluir los siguientes campos adicionales:

  • DocumentMetadata — Extracción de información sobre el documento. Los metadatos incluyen una lista de páginas del documento, con el número de caracteres extraídos de cada página. Este campo está presente en la respuesta si la solicitud incluía el parámetro Byte.

  • DocumentType — El tipo de documento para cada página del documento de entrada. Este campo está presente en la respuesta para una solicitud que incluía el parámetro Byte.

  • Bloques: información sobre cada bloque de texto del documento de entrada. Los bloques están anidados. Un bloque de página contiene un bloque para cada línea de texto, que contiene un bloque para cada palabra. Este campo está presente en la respuesta para una solicitud que incluía el parámetro Byte.

  • BlockReferences — Una referencia a cada bloque de esta entidad. Este campo está presente en la respuesta para una solicitud que incluía el parámetro Byte. El campo no está presente en los archivos de texto.

  • Errores: errores a nivel de la página que el sistema detectó al procesar el documento de entrada. El campo está vacío si el sistema no ha detectado ningún error.

Para obtener descripciones de estos campos de salida, consulte la DetectEntitiesreferencia de la API de Amazon Comprehend. Para obtener más información sobre los elementos de diseño, consulte los objetos de análisis de Amazon Textract en la Guía para desarrolladores de Amazon Textract.

En el siguiente ejemplo se muestra la salida de un documento de entrada en formato PDF escaneado de una página.

{ "Entities": [{ "Score": 0.9984670877456665, "Type": "DATE-TIME", "Text": "September 4,", "BlockReferences": [{ "BlockId": "42dcaaee-c484-4b5d-9e3f-ae0be928b3e1", "BeginOffset": 0, "EndOffset": 12, "ChildBlocks": [{ "ChildBlockId": "6e9cbb43-f8be-4da0-9a4b-ff9a6c350a14", "BeginOffset": 0, "EndOffset": 9 }, { "ChildBlockId": "599e0d53-ae9f-491b-a762-459b22c79ff5", "BeginOffset": 0, "EndOffset": 2 }, { "ChildBlockId": "599e0d53-ae9f-491b-a762-459b22c79ff5", "BeginOffset": 0, "EndOffset": 2 } ] }] }], "DocumentMetadata": { "Pages": 1, "ExtractedCharacters": [{ "Page": 1, "Count": 609 }] }, "DocumentType": [{ "Page": 1, "Type": "SCANNED_PDF" }], "Blocks": [{ "Id": "ee82edf3-28de-4d63-8883-40e2e4938ccb", "BlockType": "LINE", "Text": "Your Band", "Page": 1, "Geometry": { "BoundingBox": { "Height": 0.024125460535287857, "Left": 0.11745482683181763, "Top": 0.06821706146001816, "Width": 0.12074867635965347 }, "Polygon": [{ "X": 0.11745482683181763, "Y": 0.06821706146001816 }, { "X": 0.2382034957408905, "Y": 0.06821706146001816 }, { "X": 0.2382034957408905, "Y": 0.09234252572059631 }, { "X": 0.11745482683181763, "Y": 0.09234252572059631 } ] }, "Relationships": [{ "Ids": [ "b105c561-c8d9-485a-a728-7a5b1a308935", "60ecb119-3173-4de2-8c5d-de182a5f86a5" ], "Type": "CHILD" }] }] }

El siguiente ejemplo muestra la salida para el análisis de un documento PDF nativo.

ejemplo Ejemplo de salida de un análisis de reconocimiento de entidades personalizado de un documento PDF
{ "Blocks": [ { "BlockType": "LINE", "Geometry": { "BoundingBox": { "Height": 0.012575757575757575, "Left": 0.0, "Top": 0.0015063131313131314, "Width": 0.02262091503267974 }, "Polygon": [ { "X": 0.0, "Y": 0.0015063131313131314 }, { "X": 0.02262091503267974, "Y": 0.0015063131313131314 }, { "X": 0.02262091503267974, "Y": 0.014082070707070706 }, { "X": 0.0, "Y": 0.014082070707070706 } ] }, "Id": "4330efed-6334-4fc4-ba48-e050afa95c8d", "Page": 1, "Relationships": [ { "ids": [ "f343ce48-583d-4abe-b84b-a232e266450f" ], "type": "CHILD" } ], "Text": "S-3" }, { "BlockType": "WORD", "Geometry": { "BoundingBox": { "Height": 0.012575757575757575, "Left": 0.0, "Top": 0.0015063131313131314, "Width": 0.02262091503267974 }, "Polygon": [ { "X": 0.0, "Y": 0.0015063131313131314 }, { "X": 0.02262091503267974, "Y": 0.0015063131313131314 }, { "X": 0.02262091503267974, "Y": 0.014082070707070706 }, { "X": 0.0, "Y": 0.014082070707070706 } ] }, "Id": "f343ce48-583d-4abe-b84b-a232e266450f", "Page": 1, "Relationships": [], "Text": "S-3" } ], "DocumentMetadata": { "PageNumber": 1, "Pages": 1 }, "DocumentType": "NativePDF", "Entities": [ { "BlockReferences": [ { "BeginOffset": 25, "BlockId": "4330efed-6334-4fc4-ba48-e050afa95c8d", "ChildBlocks": [ { "BeginOffset": 1, "ChildBlockId": "cbba5534-ac69-4bc4-beef-306c659f70a6", "EndOffset": 6 } ], "EndOffset": 30 } ], "Score": 0.9998825926329088, "Text": "0.001", "Type": "OFFERING_PRICE" }, { "BlockReferences": [ { "BeginOffset": 41, "BlockId": "f343ce48-583d-4abe-b84b-a232e266450f", "ChildBlocks": [ { "BeginOffset": 0, "ChildBlockId": "292a2e26-21f0-401b-a2bf-03aa4c47f787", "EndOffset": 9 } ], "EndOffset": 50 } ], "Score": 0.9809727537330395, "Text": "6,097,560", "Type": "OFFERED_SHARES" } ], "File": "example.pdf", "Version": "2021-04-30" }
PrivacidadTérminos del sitioPreferencias de cookies
© 2025, Amazon Web Services, Inc o sus afiliados. Todos los derechos reservados.