Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Analisi di fatture e ricevute
Amazon Textract estrae i dati rilevanti come le informazioni di contatto, gli articoli acquistati e il nome del fornitore, da quasi tutte le fatture o ricevute senza la necessità di modelli o configurazione. Le fatture e le ricevute utilizzano spesso diversi layout, rendendo difficile e dispendioso in termini di tempo l'estrazione manuale dei dati su larga scala. Amazon Textract utilizza ML per comprendere il contesto delle fatture e delle ricevute ed estrae automaticamente dati quali data di fattura o ricezione, numero di fattura o ricevuta, prezzi degli articoli, importo totale e termini di pagamento in base alle esigenze aziendali.
Amazon Textract identifica anche i nomi dei fornitori che sono fondamentali per i flussi di lavoro ma potrebbero non essere etichettati in modo esplicito. Ad esempio, Amazon Textract può trovare il nome del fornitore su una ricevuta anche se è indicato solo all'interno di un logo nella parte superiore della pagina senza una combinazione esplicita di coppie chiave-valore. Amazon Textract semplifica inoltre il consolidamento dell'input da diverse ricevute e fatture che utilizzano parole diverse per lo stesso concetto. Ad esempio, Amazon Textract mappa le relazioni tra i nomi dei campi in documenti diversi, come numero cliente, numero cliente e ID account, emettendo la tassonomia standard comeINVOICE_RECEIPT_ID
. In questo caso, Amazon Textract rappresenta i dati in modo coerente tra diversi tipi di documenti. I campi che non sono allineati con la tassonomia standard sono classificati comeOTHER
.
Di seguito è riportato un elenco dei campi standard attualmente supportati da AnalyzeExpense:
-
Nome fornitore:
VENDOR_NAME
-
Totale:
TOTAL
-
Indirizzo ricevitore:
RECEIVER_ADDRESS
-
Data fattura/ricezione:
INVOICE_RECEIPT_DATE
-
ID fattura/ricevuta:
INVOICE_RECEIPT_ID
-
Termini di pagamento:
PAYMENT_TERMS
-
Subtotale:
SUBTOTAL
-
Data di scadenza:
DUE_DATE
-
Imposta:
TAX
-
ID contribuente fiscale fattura (SSN/ITIN o EIN):
TAX_PAYER_ID
-
Nome articolo:
ITEM_NAME
-
Prezzo articolo:
PRICE
-
Quantità articolo:
QUANTITY
L'API AnalyzeExpense restituisce i seguenti elementi per una determinata pagina del documento:
-
Il numero di ricevute o fatture all'interno di una pagina rappresentata come
ExpenseIndex
-
Il nome standardizzato per i singoli campi rappresentati come
Type
-
Il nome effettivo del campo come appare sul documento, rappresentato come
LabelDetection
-
Il valore del campo corrispondente rappresentato come
ValueDetection
-
Il numero di pagine all'interno del documento inviato rappresentato come
Pages
-
Il numero di pagina su cui sono stati rilevati il campo, il valore o gli elementi riga, rappresentato come
PageNumber
-
La geometria, che include il riquadro di selezione e la posizione delle coordinate del singolo campo, valore o elementi di linea nella pagina, rappresentata come
Geometry
-
Il punteggio di confidenza associato a ciascun dato rilevato sul documento, rappresentato come
Confidence
-
L'intera riga di singoli articoli acquistati, rappresentati come
EXPENSE_ROW
Di seguito è riportata una parte dell'output API per una ricevuta elaborata da AnalyzeExpense che mostra il Totale: $55,64 nel documento estratto come campo standardTOTAL
, il testo effettivo sul documento come «Totale», Punteggio di confidenza di «97,1», Numero di pagina «1», Il valore totale come «$55,64» e il riquadro di selezione e le coordinate poligonali:
{ "Type": { "Text": "TOTAL", "Confidence": 99.94717407226562 }, "LabelDetection": { "Text": "Total:", "Geometry": { "BoundingBox": { "Width": 0.09809663146734238, "Height": 0.0234375, "Left": 0.36822840571403503, "Top": 0.8017578125 }, "Polygon": [ { "X": 0.36822840571403503, "Y": 0.8017578125 }, { "X": 0.466325044631958, "Y": 0.8017578125 }, { "X": 0.466325044631958, "Y": 0.8251953125 }, { "X": 0.36822840571403503, "Y": 0.8251953125 } ] }, "Confidence": 97.10792541503906 }, "ValueDetection": { "Text": "$55.64", "Geometry": { "BoundingBox": { "Width": 0.10395314544439316, "Height": 0.0244140625, "Left": 0.66837477684021, "Top": 0.802734375 }, "Polygon": [ { "X": 0.66837477684021, "Y": 0.802734375 }, { "X": 0.7723279595375061, "Y": 0.802734375 }, { "X": 0.7723279595375061, "Y": 0.8271484375 }, { "X": 0.66837477684021, "Y": 0.8271484375 } ] }, "Confidence": 99.85165405273438 }, "PageNumber": 1 }
È possibile utilizzare operazioni sincrone per analizzare una fattura o una ricevuta. Per analizzare questi documenti, si utilizza l'operazione AnalyzeExpense e si passa una ricevuta o una fattura.AnalyzeExpense
restituisce l'intero set di risultati. Per ulteriori informazioni, consultare Analisi di fatture e ricevute con Amazon Textract.
Per analizzare fatture e ricevute in modo asincrono, utilizzareStartExpenseAnalysisper avviare l'elaborazione di un file di documento di input. Per ricevere i risultati, chiamaGetExpenseAnalysis. I risultati di una determinata chiamata aStartExpenseAnalysisvengono restituiti daGetExpenseAnalysis
. Per ulteriori informazioni e un esempio, consulta Elaborazione di documenti con operazioni asincrone.