AnalyzeExpense - Amazon Textract

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

AnalyzeExpense

AnalyzeExpenseanalisa de forma síncrona um documento de entrada para relacionamentos financeiramente relacionados entre o texto.

As informações são retornadas comoExpenseDocumentse separado da seguinte forma.

  • LineItemGroups- Um conjunto de dados contendoLineItemsque armazenam informações sobre as linhas de texto, como um item comprado e seu preço em um recibo.

  • SummaryFields- Contém todas as outras informações de um recibo, como informações de cabeçalho ou o nome dos fornecedores.

Sintaxe da solicitação

{ "Document": { "Bytes": blob, "S3Object": { "Bucket": "string", "Name": "string", "Version": "string" } } }

Parâmetros de solicitação

A solicitação aceita os dados a seguir no formato JSON.

Document

O documento de entrada, seja como bytes ou como um objeto S3.

Passe bytes de imagem para a operação de uma API Amazon Textract usando aBytespropriedade. Por exemplo, você usaria aBytespropriedade para passar um documento carregado de um sistema de arquivos local. Bytes de imagem passados usando oBytesA propriedade deve ser codificada em base64. Talvez seu código não precise codificar bytes de arquivos de documentos se você estiver usando um AWS SDK para chamar as operações da API do Amazon Textract.

Passe imagens armazenadas em um bucket do S3 para uma operação de API Amazon Textract usando aS3Objectpropriedade. Os documentos armazenados em um bucket do S3 não precisam ser codificados em base64.

A Região da AWS do bucket do S3 que contém o objeto S3 deve corresponder à região da AWS que você usa para operações Amazon Textract.

Se você usar a AWS CLI para chamar operações do Amazon Textract, não haverá suporte para a passagem dos bytes da imagem da propriedade. Você deve primeiramente carregar o documento em um bucket do Amazon S3 e, em seguida, chamar a operação usando a propriedade S3Object.

Para que o Amazon Textract processe um objeto do S3, o usuário deve ter permissão para acessar o objeto do S3.

Tipo: objeto Document

: obrigatório Sim

Sintaxe da resposta

{ "DocumentMetadata": { "Pages": number }, "ExpenseDocuments": [ { "ExpenseIndex": number, "LineItemGroups": [ { "LineItemGroupIndex": number, "LineItems": [ { "LineItemExpenseFields": [ { "LabelDetection": { "Confidence": number, "Geometry": { "BoundingBox": { "Height": number, "Left": number, "Top": number, "Width": number }, "Polygon": [ { "X": number, "Y": number } ] }, "Text": "string" }, "PageNumber": number, "Type": { "Confidence": number, "Text": "string" }, "ValueDetection": { "Confidence": number, "Geometry": { "BoundingBox": { "Height": number, "Left": number, "Top": number, "Width": number }, "Polygon": [ { "X": number, "Y": number } ] }, "Text": "string" } } ] } ] } ], "SummaryFields": [ { "LabelDetection": { "Confidence": number, "Geometry": { "BoundingBox": { "Height": number, "Left": number, "Top": number, "Width": number }, "Polygon": [ { "X": number, "Y": number } ] }, "Text": "string" }, "PageNumber": number, "Type": { "Confidence": number, "Text": "string" }, "ValueDetection": { "Confidence": number, "Geometry": { "BoundingBox": { "Height": number, "Left": number, "Top": number, "Width": number }, "Polygon": [ { "X": number, "Y": number } ] }, "Text": "string" } } ] } ] }

Elementos de resposta

Se a ação for bem-sucedida, o serviço reenviará uma resposta HTTP 200.

Os seguintes dados são retornados no formato JSON pelo serviço.

DocumentMetadata

Informações sobre o documento de entrada.

Tipo: objeto DocumentMetadata

ExpenseDocuments

As despesas detectadas pelo Amazon Textract.

Type: Matriz deExpenseDocumentobjetos

Erros

AccessDeniedException

Você não está autorizado a executar a ação. Use o nome de recurso da Amazon (ARN) de um usuário autorizado ou a função do IAM para executar a operação.

Código de status HTTP: 400

BadDocumentException

O Amazon Textract não consegue ler o documento. Para obter mais informações sobre os limites de documentos no Amazon Textract, consulteLimites rígidos no Amazon Textract.

Código de status HTTP: 400

DocumentTooLargeException

O documento não pode ser processado porque é muito grande. O tamanho máximo do documento para operações síncronas 10 MB. O tamanho máximo do documento para operações assíncronas é de 500 MB para arquivos PDF.

Código de status HTTP: 400

InternalServerError

Amazon Textract teve um problema de serviço. Tente fazer a chamada novamente.

Código de status HTTP: 500

InvalidParameterException

Um parâmetro de entrada violou uma restrição. Por exemplo, em operações síncronas, umInvalidParameterExceptionexceção ocorre quando nenhum dosS3ObjectouBytesvalores são fornecidos noDocumentparâmetro de solicitação. Valide seu parâmetro antes de chamar a operação de API novamente.

Código de status HTTP: 400

InvalidS3ObjectException

O Amazon Textract não pode acessar o objeto do S3 especificado na solicitação. para obter mais informações,Configuração de acesso ao Amazon S3Para obter informações sobre a solução de problemas, consulteSolução de problemas do Amazon S3

Código de status HTTP: 400

ProvisionedThroughputExceededException

O número de solicitações excedeu o limite da taxa de transferência. Se precisar aumentar esse limite, entre em contato com o Amazon Textract.

Código de status HTTP: 400

ThrottlingException

Amazon Textract está temporariamente indisponível para processar a solicitação. Tente fazer a chamada novamente.

Código de status HTTP: 500

UnsupportedDocumentException

O formato do documento de entrada não é oferecido o suporte. Os documentos para operações podem estar no formato PNG, JPEG, PDF ou TIFF.

Código de status HTTP: 400

Consulte também

Para obter mais informações sobre como usar essa API em um dos AWS SDKs específicos de linguagem, consulte o seguinte: