Analisi di fatture e ricevute - Amazon Textract

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Analisi di fatture e ricevute

Amazon Textract estrae i dati rilevanti come le informazioni di contatto, gli articoli acquistati e il nome del fornitore, da quasi tutte le fatture o ricevute senza la necessità di modelli o configurazione. Le fatture e le ricevute utilizzano spesso diversi layout, rendendo difficile e dispendioso in termini di tempo l'estrazione manuale dei dati su larga scala. Amazon Textract utilizza ML per comprendere il contesto delle fatture e delle ricevute ed estrae automaticamente dati quali data di fattura o ricezione, numero di fattura o ricevuta, prezzi degli articoli, importo totale e termini di pagamento in base alle esigenze aziendali.

Amazon Textract identifica anche i nomi dei fornitori che sono fondamentali per i flussi di lavoro ma potrebbero non essere etichettati in modo esplicito. Ad esempio, Amazon Textract può trovare il nome del fornitore su una ricevuta anche se è indicato solo all'interno di un logo nella parte superiore della pagina senza una combinazione esplicita di coppie chiave-valore. Amazon Textract semplifica inoltre il consolidamento dell'input da diverse ricevute e fatture che utilizzano parole diverse per lo stesso concetto. Ad esempio, Amazon Textract mappa le relazioni tra i nomi dei campi in documenti diversi, come numero cliente, numero cliente e ID account, emettendo la tassonomia standard comeINVOICE_RECEIPT_ID. In questo caso, Amazon Textract rappresenta i dati in modo coerente tra diversi tipi di documenti. I campi che non sono allineati con la tassonomia standard sono classificati comeOTHER.

Di seguito è riportato un elenco dei campi standard attualmente supportati da AnalyzeExpense:

  • Nome fornitore:VENDOR_NAME

  • Totale:TOTAL

  • Indirizzo ricevitore:RECEIVER_ADDRESS

  • Data fattura/ricezione:INVOICE_RECEIPT_DATE

  • ID fattura/ricevuta:INVOICE_RECEIPT_ID

  • Termini di pagamento:PAYMENT_TERMS

  • Subtotale:SUBTOTAL

  • Data di scadenza:DUE_DATE

  • Imposta:TAX

  • ID contribuente fiscale fattura (SSN/ITIN o EIN):TAX_PAYER_ID

  • Nome articolo:ITEM_NAME

  • Prezzo articolo:PRICE

  • Quantità articolo:QUANTITY

L'API AnalyzeExpense restituisce i seguenti elementi per una determinata pagina del documento:

  • Il numero di ricevute o fatture all'interno di una pagina rappresentata comeExpenseIndex

  • Il nome standardizzato per i singoli campi rappresentati comeType

  • Il nome effettivo del campo come appare sul documento, rappresentato comeLabelDetection

  • Il valore del campo corrispondente rappresentato comeValueDetection

  • Il numero di pagine all'interno del documento inviato rappresentato comePages

  • Il numero di pagina su cui sono stati rilevati il campo, il valore o gli elementi riga, rappresentato comePageNumber

  • La geometria, che include il riquadro di selezione e la posizione delle coordinate del singolo campo, valore o elementi di linea nella pagina, rappresentata comeGeometry

  • Il punteggio di confidenza associato a ciascun dato rilevato sul documento, rappresentato comeConfidence

  • L'intera riga di singoli articoli acquistati, rappresentati comeEXPENSE_ROW

Di seguito è riportata una parte dell'output API per una ricevuta elaborata da AnalyzeExpense che mostra il Totale: $55,64 nel documento estratto come campo standardTOTAL, il testo effettivo sul documento come «Totale», Punteggio di confidenza di «97,1», Numero di pagina «1», Il valore totale come «$55,64» e il riquadro di selezione e le coordinate poligonali:

{ "Type": { "Text": "TOTAL", "Confidence": 99.94717407226562 }, "LabelDetection": { "Text": "Total:", "Geometry": { "BoundingBox": { "Width": 0.09809663146734238, "Height": 0.0234375, "Left": 0.36822840571403503, "Top": 0.8017578125 }, "Polygon": [ { "X": 0.36822840571403503, "Y": 0.8017578125 }, { "X": 0.466325044631958, "Y": 0.8017578125 }, { "X": 0.466325044631958, "Y": 0.8251953125 }, { "X": 0.36822840571403503, "Y": 0.8251953125 } ] }, "Confidence": 97.10792541503906 }, "ValueDetection": { "Text": "$55.64", "Geometry": { "BoundingBox": { "Width": 0.10395314544439316, "Height": 0.0244140625, "Left": 0.66837477684021, "Top": 0.802734375 }, "Polygon": [ { "X": 0.66837477684021, "Y": 0.802734375 }, { "X": 0.7723279595375061, "Y": 0.802734375 }, { "X": 0.7723279595375061, "Y": 0.8271484375 }, { "X": 0.66837477684021, "Y": 0.8271484375 } ] }, "Confidence": 99.85165405273438 }, "PageNumber": 1 }

È possibile utilizzare operazioni sincrone per analizzare una fattura o una ricevuta. Per analizzare questi documenti, si utilizza l'operazione AnalyzeExpense e si passa una ricevuta o una fattura.AnalyzeExpenserestituisce l'intero set di risultati. Per ulteriori informazioni, consultare Analisi di fatture e ricevute con Amazon Textract.

Per analizzare fatture e ricevute in modo asincrono, utilizzareStartExpenseAnalysisper avviare l'elaborazione di un file di documento di input. Per ricevere i risultati, chiamaGetExpenseAnalysis. I risultati di una determinata chiamata aStartExpenseAnalysisvengono restituiti daGetExpenseAnalysis. Per ulteriori informazioni e un esempio, consulta Elaborazione di documenti con operazioni asincrone.