Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Analysieren von Rechnungen und Belegen
Amazon Textract extrahiert relevante Daten wie Kontaktinformationen, gekaufte Artikel und den Namen des Lieferanten aus fast jeder Rechnung oder Quittung, ohne dass Vorlagen oder Konfigurationen erforderlich sind. Rechnungen und Belege verwenden häufig verschiedene Layouts, was es schwierig und zeitaufwändig macht, Daten in großem Maßstab manuell zu extrahieren. Amazon Textract verwendet ML, um den Kontext von Rechnungen und Belegen zu verstehen, und extrahiert automatisch Daten wie Rechnungs- oder Empfangsdatum, Rechnungs- oder Belegnummer, Artikelpreise, Gesamtbetrag und Zahlungsbedingungen, um Ihren Geschäftsanforderungen gerecht zu werden.
Amazon Textract identifiziert auch Anbieternamen, die für Ihre Workflows entscheidend sind, aber möglicherweise nicht explizit gekennzeichnet sind. Amazon Textract kann beispielsweise den Händlernamen auf einer Quittung finden, auch wenn er nur in einem Logo oben auf der Seite ohne explizite Schlüssel-Wert-Paarkombination angegeben ist. Amazon Textract macht es Ihnen auch leicht, Eingaben aus verschiedenen Belegen und Rechnungen zu konsolidieren, die unterschiedliche Wörter für dasselbe Konzept verwenden. Amazon Textract ordnet beispielsweise Beziehungen zwischen Feldnamen in verschiedenen Dokumenten wie Kundennummer, Kundennummer und Konto-ID ab und gibt Standardtaxonomie alsINVOICE_RECEIPT_ID
aus. In diesem Fall repräsentiert Amazon Textract Daten konsistent über verschiedene Dokumenttypen hinweg. Felder, die nicht mit der Standardtaxonomie übereinstimmen, werden kategorisiert alsOTHER
aus.
Nachfolgend ist eine Liste der Standardfelder, die AnalyzeExpense derzeit unterstützt:
-
Anbieter-Name:
VENDOR_NAME
-
Gesamt:
TOTAL
-
Adresse des Empfängers:
RECEIVER_ADDRESS
-
Rechnung/Zahlungsdatum:
INVOICE_RECEIPT_DATE
-
Rechnung/Belegnummer:
INVOICE_RECEIPT_ID
-
Zahlungsbedingungen:
PAYMENT_TERMS
-
Zwischensumme:
SUBTOTAL
-
Fälligkeitsdatum:
DUE_DATE
-
Steuer:
TAX
-
Rechnungssteuerzahler-ID (SSN/ITIN oder EIN):
TAX_PAYER_ID
-
Elementname:
ITEM_NAME
-
Preis des Artikels:
PRICE
-
Artikelmenge:
QUANTITY
Die AnalyzeExpense-API gibt die folgenden Elemente für eine bestimmte Dokumentseite zurück:
-
Die Anzahl der Belege oder Rechnungen innerhalb einer Seite, die als
ExpenseIndex
-
Der standardisierte Name für einzelne Felder dargestellt als
Type
-
Der tatsächliche Name des Feldes, wie es im Dokument angezeigt wird, dargestellt als
LabelDetection
-
Der Wert des entsprechenden Feldes, dargestellt als
ValueDetection
-
Die Anzahl der Seiten innerhalb des eingereichten Dokuments, dargestellt als
Pages
-
Die Seitenzahl, unter der das Feld, der Wert oder die Einzelposten erkannt wurden, dargestellt als
PageNumber
-
Die Geometrie, die den Begrenzungsrahmen und die Koordinatenposition des einzelnen Feldes, Werts oder der Einzelposten auf der Seite enthält, dargestellt als
Geometry
-
Der Konfidenzwert, der mit jedem im Dokument erkannten Daten verknüpft ist, dargestellt als
Confidence
-
Die gesamte Reihe der gekauften Einzelposten, dargestellt als
EXPENSE_ROW
Das Folgende ist ein Teil der API-Ausgabe für einen von AnalyzeExpense verarbeiteten Beleg, der die Summe anzeigt: 55,64$ in dem als Standardfeld extrahierten DokumentTOTAL
, tatsächlicher Text auf dem Dokument als „Gesamt“, Konfidenzwert von „97.1“, Seitenzahl „1“, Der Gesamtwert als „55,64$“ und der Begrenzungsrahmen- und Polygonkoordinaten:
{ "Type": { "Text": "TOTAL", "Confidence": 99.94717407226562 }, "LabelDetection": { "Text": "Total:", "Geometry": { "BoundingBox": { "Width": 0.09809663146734238, "Height": 0.0234375, "Left": 0.36822840571403503, "Top": 0.8017578125 }, "Polygon": [ { "X": 0.36822840571403503, "Y": 0.8017578125 }, { "X": 0.466325044631958, "Y": 0.8017578125 }, { "X": 0.466325044631958, "Y": 0.8251953125 }, { "X": 0.36822840571403503, "Y": 0.8251953125 } ] }, "Confidence": 97.10792541503906 }, "ValueDetection": { "Text": "$55.64", "Geometry": { "BoundingBox": { "Width": 0.10395314544439316, "Height": 0.0244140625, "Left": 0.66837477684021, "Top": 0.802734375 }, "Polygon": [ { "X": 0.66837477684021, "Y": 0.802734375 }, { "X": 0.7723279595375061, "Y": 0.802734375 }, { "X": 0.7723279595375061, "Y": 0.8271484375 }, { "X": 0.66837477684021, "Y": 0.8271484375 } ] }, "Confidence": 99.85165405273438 }, "PageNumber": 1 }
Sie können synchrone Vorgänge verwenden, um eine Rechnung oder einen Beleg zu analysieren. Um diese Dokumente zu analysieren, verwenden Sie den AnalyzeExpense-Vorgang und übergeben eine Quittung oder Rechnung an sie.AnalyzeExpense
gibt den gesamten Ergebnissatz zurück. Weitere Informationen finden Sie unter Rechnungen und Belege mit Amazon Textract analysieren .
Um Rechnungen und Belege asynchron zu analysieren, verwenden SieStartExpenseAnalysisum mit der Verarbeitung einer Eingabedokumentdatei zu beginnen. Rufen Sie an, um die Ergebnisse zu erhaltenGetExpenseAnalysisaus. Die Ergebnisse für einen bestimmten Aufruf anStartExpenseAnalysiswerden von zurückgegebenGetExpenseAnalysis
aus. Weitere Informationen sowie ein Beispiel finden Sie unter Dokumente mit asynchronen Operationen verarbeiten.