Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
AnalyzeExpense
AnalyzeExpense
analiza sincrónicamente un documento de entrada para ver las relaciones financieras entre texto.
La información se devuelve comoExpenseDocuments
y separados de la siguiente manera.
-
LineItemGroups
- Conjunto de datos que contieneLineItems
que almacenan información sobre las líneas de texto, como un artículo comprado y su precio en un recibo. -
SummaryFields
- Contiene toda la demás información de un recibo, como la información del encabezado o el nombre del proveedor.
Sintaxis de la solicitud
{
"Document": {
"Bytes": blob
,
"S3Object": {
"Bucket": "string
",
"Name": "string
",
"Version": "string
"
}
}
}
Parámetros de solicitud
La solicitud acepta los siguientes datos en formato JSON.
- Document
-
El documento de entrada, ya sea en bytes o como objeto S3.
Puede transferir bytes de imágenes a una operación API Amazon Textract Texact utilizando la
Bytes
propiedad. Por ejemplo, usaría elBytes
para pasar un documento cargado desde un sistema de archivos local. Bytes de imagen pasados mediante elBytes
debe tener codificación base64. Es posible que el código no necesite codificar bytes de archivos de documentos si utiliza un SDK de AWS para llamar a las operaciones de la API de Amazon Textract Texact.Puede transferir imágenes almacenadas en un bucket de S3 a una operación API Amazon Textract Texact utilizando el
S3Object
propiedad. Los documentos almacenados en un bucket de S3 no tienen por qué estar codificados en base64.La región de AWS para el bucket de S3 que contiene el objeto S3 debe coincidir con la región de AWS que utiliza para las operaciones de Amazon Textract Texact.
Si utiliza la CLI de AWS para llamar a las operaciones de Amazon Textract Texact, no es posible transferir bytes de imágenes utilizando la propiedad Bytes. Debe cargar primero el documento en un bucket de Amazon S3 y, a continuación, llamar a la operación utilizando la propiedad S3Object.
Para que Amazon Textract Texact procese un objeto de S3, el usuario debe tener permiso para acceder al objeto de S3.
Tipo: objeto Document
Obligatorio: Sí
Sintaxis de la respuesta
{
"DocumentMetadata": {
"Pages": number
},
"ExpenseDocuments": [
{
"ExpenseIndex": number,
"LineItemGroups": [
{
"LineItemGroupIndex": number,
"LineItems": [
{
"LineItemExpenseFields": [
{
"LabelDetection": {
"Confidence": number,
"Geometry": {
"BoundingBox": {
"Height": number,
"Left": number,
"Top": number,
"Width": number
},
"Polygon": [
{
"X": number,
"Y": number
}
]
},
"Text": "string"
},
"PageNumber": number,
"Type": {
"Confidence": number,
"Text": "string"
},
"ValueDetection": {
"Confidence": number,
"Geometry": {
"BoundingBox": {
"Height": number,
"Left": number,
"Top": number,
"Width": number
},
"Polygon": [
{
"X": number,
"Y": number
}
]
},
"Text": "string"
}
}
]
}
]
}
],
"SummaryFields": [
{
"LabelDetection": {
"Confidence": number,
"Geometry": {
"BoundingBox": {
"Height": number,
"Left": number,
"Top": number,
"Width": number
},
"Polygon": [
{
"X": number,
"Y": number
}
]
},
"Text": "string"
},
"PageNumber": number,
"Type": {
"Confidence": number,
"Text": "string"
},
"ValueDetection": {
"Confidence": number,
"Geometry": {
"BoundingBox": {
"Height": number,
"Left": number,
"Top": number,
"Width": number
},
"Polygon": [
{
"X": number,
"Y": number
}
]
},
"Text": "string"
}
}
]
}
]
}
Elementos de respuesta
Si la acción se realiza correctamente, el servicio devuelve una respuesta HTTP 200.
El servicio devuelve los datos siguientes en formato JSON.
- DocumentMetadata
-
Información sobre el documento de entrada.
Tipo: objeto DocumentMetadata
- ExpenseDocuments
-
Los gastos detectados por Amazon Textract.
Type: Matriz deExpenseDocumentobjects
Errores
- AccessDeniedException
-
No tiene autorización para realizar la acción. Utilice el nombre de recurso de Amazon (ARN) de un usuario autorizado o un rol de IAM para realizar la operación.
Código de estado HTTP: 400
- BadDocumentException
-
Amazon Textract Texact no puede leer el documento. Para obtener más información sobre los límites de documentos en Amazon Textract, consulteLímites máximos de Amazon Textract.
Código de estado HTTP: 400
- DocumentTooLargeException
-
El documento no se puede procesar porque es demasiado grande. Tamaño máximo de documento para operaciones síncronas de 10 MB. El tamaño máximo de documento para operaciones asíncronas es de 500 MB para los archivos PDF.
Código de estado HTTP: 400
- InternalServerError
-
Amazon Textract ha tenido un problema de servicio. Pruebe la llamada de nuevo.
Código de estado HTTP: 500
- InvalidParameterException
-
Un parámetro de entrada infringió una restricción. Por ejemplo, en operaciones sincrónicas, un
InvalidParameterException
se produce cuando ninguno de losS3Object
oBytes
los valores se proporcionan en elDocument
parámetro de solicitud. Valide el parámetro antes de llamar a la operación de la API de nuevo.Código de estado HTTP: 400
- InvalidS3ObjectException
-
Amazon Textract no puede obtener acceso al objeto de S3 que se especifica en la solicituda. para obtener más información,Configuración del acceso a Amazon S3Para obtener información sobre la resolución de problemas, consulteSolución de problemas de Amazon S3
Código de estado HTTP: 400
- ProvisionedThroughputExceededException
-
El número de solicitudes ha superado su límite de rendimiento. Si necesita aumentar este límite, póngase en contacto con Amazon Textract.
Código de estado HTTP: 400
- ThrottlingException
-
Amazon Textract Texact no puede procesar temporalmente la solicitud. Pruebe la llamada de nuevo.
Código de estado HTTP: 500
- UnsupportedDocumentException
-
El formato del documento de entrada no es posible. Los documentos para operaciones pueden estar en formato PNG, JPEG, PDF o TIFF.
Código de estado HTTP: 400
Véase también
Para obtener más información sobre el uso de esta API en un SDK de AWS de un lenguaje específico, consulte: