AnalyzeExpense - Amazon Textract

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

AnalyzeExpense

AnalyzeExpenseanaliza sincrónicamente un documento de entrada para ver las relaciones financieras entre texto.

La información se devuelve comoExpenseDocumentsy separados de la siguiente manera.

  • LineItemGroups- Conjunto de datos que contieneLineItemsque almacenan información sobre las líneas de texto, como un artículo comprado y su precio en un recibo.

  • SummaryFields- Contiene toda la demás información de un recibo, como la información del encabezado o el nombre del proveedor.

Sintaxis de la solicitud

{ "Document": { "Bytes": blob, "S3Object": { "Bucket": "string", "Name": "string", "Version": "string" } } }

Parámetros de solicitud

La solicitud acepta los siguientes datos en formato JSON.

Document

El documento de entrada, ya sea en bytes o como objeto S3.

Puede transferir bytes de imágenes a una operación API Amazon Textract Texact utilizando laBytespropiedad. Por ejemplo, usaría elBytespara pasar un documento cargado desde un sistema de archivos local. Bytes de imagen pasados mediante elBytesdebe tener codificación base64. Es posible que el código no necesite codificar bytes de archivos de documentos si utiliza un SDK de AWS para llamar a las operaciones de la API de Amazon Textract Texact.

Puede transferir imágenes almacenadas en un bucket de S3 a una operación API Amazon Textract Texact utilizando elS3Objectpropiedad. Los documentos almacenados en un bucket de S3 no tienen por qué estar codificados en base64.

La región de AWS para el bucket de S3 que contiene el objeto S3 debe coincidir con la región de AWS que utiliza para las operaciones de Amazon Textract Texact.

Si utiliza la CLI de AWS para llamar a las operaciones de Amazon Textract Texact, no es posible transferir bytes de imágenes utilizando la propiedad Bytes. Debe cargar primero el documento en un bucket de Amazon S3 y, a continuación, llamar a la operación utilizando la propiedad S3Object.

Para que Amazon Textract Texact procese un objeto de S3, el usuario debe tener permiso para acceder al objeto de S3.

Tipo: objeto Document

Obligatorio: Sí

Sintaxis de la respuesta

{ "DocumentMetadata": { "Pages": number }, "ExpenseDocuments": [ { "ExpenseIndex": number, "LineItemGroups": [ { "LineItemGroupIndex": number, "LineItems": [ { "LineItemExpenseFields": [ { "LabelDetection": { "Confidence": number, "Geometry": { "BoundingBox": { "Height": number, "Left": number, "Top": number, "Width": number }, "Polygon": [ { "X": number, "Y": number } ] }, "Text": "string" }, "PageNumber": number, "Type": { "Confidence": number, "Text": "string" }, "ValueDetection": { "Confidence": number, "Geometry": { "BoundingBox": { "Height": number, "Left": number, "Top": number, "Width": number }, "Polygon": [ { "X": number, "Y": number } ] }, "Text": "string" } } ] } ] } ], "SummaryFields": [ { "LabelDetection": { "Confidence": number, "Geometry": { "BoundingBox": { "Height": number, "Left": number, "Top": number, "Width": number }, "Polygon": [ { "X": number, "Y": number } ] }, "Text": "string" }, "PageNumber": number, "Type": { "Confidence": number, "Text": "string" }, "ValueDetection": { "Confidence": number, "Geometry": { "BoundingBox": { "Height": number, "Left": number, "Top": number, "Width": number }, "Polygon": [ { "X": number, "Y": number } ] }, "Text": "string" } } ] } ] }

Elementos de respuesta

Si la acción se realiza correctamente, el servicio devuelve una respuesta HTTP 200.

El servicio devuelve los datos siguientes en formato JSON.

DocumentMetadata

Información sobre el documento de entrada.

Tipo: objeto DocumentMetadata

ExpenseDocuments

Los gastos detectados por Amazon Textract.

Type: Matriz deExpenseDocumentobjects

Errores

AccessDeniedException

No tiene autorización para realizar la acción. Utilice el nombre de recurso de Amazon (ARN) de un usuario autorizado o un rol de IAM para realizar la operación.

Código de estado HTTP: 400

BadDocumentException

Amazon Textract Texact no puede leer el documento. Para obtener más información sobre los límites de documentos en Amazon Textract, consulteLímites máximos de Amazon Textract.

Código de estado HTTP: 400

DocumentTooLargeException

El documento no se puede procesar porque es demasiado grande. Tamaño máximo de documento para operaciones síncronas de 10 MB. El tamaño máximo de documento para operaciones asíncronas es de 500 MB para los archivos PDF.

Código de estado HTTP: 400

InternalServerError

Amazon Textract ha tenido un problema de servicio. Pruebe la llamada de nuevo.

Código de estado HTTP: 500

InvalidParameterException

Un parámetro de entrada infringió una restricción. Por ejemplo, en operaciones sincrónicas, unInvalidParameterExceptionse produce cuando ninguno de losS3ObjectoByteslos valores se proporcionan en elDocumentparámetro de solicitud. Valide el parámetro antes de llamar a la operación de la API de nuevo.

Código de estado HTTP: 400

InvalidS3ObjectException

Amazon Textract no puede obtener acceso al objeto de S3 que se especifica en la solicituda. para obtener más información,Configuración del acceso a Amazon S3Para obtener información sobre la resolución de problemas, consulteSolución de problemas de Amazon S3

Código de estado HTTP: 400

ProvisionedThroughputExceededException

El número de solicitudes ha superado su límite de rendimiento. Si necesita aumentar este límite, póngase en contacto con Amazon Textract.

Código de estado HTTP: 400

ThrottlingException

Amazon Textract Texact no puede procesar temporalmente la solicitud. Pruebe la llamada de nuevo.

Código de estado HTTP: 500

UnsupportedDocumentException

El formato del documento de entrada no es posible. Los documentos para operaciones pueden estar en formato PNG, JPEG, PDF o TIFF.

Código de estado HTTP: 400

Véase también

Para obtener más información sobre el uso de esta API en un SDK de AWS de un lenguaje específico, consulte: