分析發票和收款 - Amazon Textract

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

分析發票和收款

Amazon Textract 從幾乎任何發票或收據中提取相關數據,例如聯繫信息、購買的商品和供應商名稱,而無需任何模板或配置。發票和收據通常使用各種佈局,因此很難大規模手動提取數據。Amazon Textract 使用 ML 來瞭解發票和收據的上下文,並自動提取發票或收據日期、發票或收據編號、商品價格、總金額和付款條件等數據,以滿足您的業務需求。

Amazon Textract 還會識別對您的工作流程至關重要但未明確標記的供應商名稱。例如,Amazon Textract 可以在收據上找到供應商名稱,即使該名稱僅在頁面頂部的徽標中顯示,而沒有明確的鍵值對組合。Amazon Textract 還可以讓您輕鬆整合不同收據和發票的輸入,這些收據和發票為同一概念使用不同詞語。例如,Amazon Textract 會映射不同文檔中的字段名稱之間的關係,例如客户編號、客户編號和賬户 ID,並將標準分類輸出為INVOICE_RECEIPT_ID。在這種情況下,Amazon Textract 會在不同文檔類型中一致地表示數據。與標準分類不一致的字段被歸類為OTHER

以下為分析費用目前支持的標準字段清單:

  • 廠商名稱:VENDOR_NAME

  • 資料總數:TOTAL

  • 接收方地址:RECEIVER_ADDRESS

  • 發票/接收日期:INVOICE_RECEIPT_DATE

  • 發票/收據編號:INVOICE_RECEIPT_ID

  • 付款條件:PAYMENT_TERMS

  • 小計:SUBTOTAL

  • 截止日期:DUE_DATE

  • 務:TAX

  • 發票納税人編號(SSN/ITIN 或 EIN):TAX_PAYER_ID

  • 項目名稱:ITEM_NAME

  • 商品價格:PRICE

  • 商品數量:QUANTITY

分析費用 API 返回給定文檔頁面的以下元素:

  • 頁面內的收據或發票數量,表示為ExpenseIndex

  • 單個字段的標準化名稱,表示為Type

  • 字段的實際名稱,如文件中所顯示的欄位名稱,表示為LabelDetection

  • 對應字段的值表示為ValueDetection

  • 所提交文檔中的頁數表示為Pages

  • 檢測到字段、值或行項目的頁碼,表示為PageNumber

  • 幾何,其中包括頁面上各個字段、值或行項目的邊界框和座標位置,表示為Geometry

  • 與文檔上檢測到的每個數據段相關聯的置信度分數,表示為Confidence

  • 購買的單個行項目的整行,表示為EXPENSE_ROW

以下是由分析費用處理的收據的 API 輸出的一部分,顯示合計:55.64 在文檔中提取為標準字段TOTAL, 文檔上的實際文本為「總」, 置信度分為「97.1」, 頁碼「1」, 總值為「$55.64」和邊界框和多邊形座標:

{ "Type": { "Text": "TOTAL", "Confidence": 99.94717407226562 }, "LabelDetection": { "Text": "Total:", "Geometry": { "BoundingBox": { "Width": 0.09809663146734238, "Height": 0.0234375, "Left": 0.36822840571403503, "Top": 0.8017578125 }, "Polygon": [ { "X": 0.36822840571403503, "Y": 0.8017578125 }, { "X": 0.466325044631958, "Y": 0.8017578125 }, { "X": 0.466325044631958, "Y": 0.8251953125 }, { "X": 0.36822840571403503, "Y": 0.8251953125 } ] }, "Confidence": 97.10792541503906 }, "ValueDetection": { "Text": "$55.64", "Geometry": { "BoundingBox": { "Width": 0.10395314544439316, "Height": 0.0244140625, "Left": 0.66837477684021, "Top": 0.802734375 }, "Polygon": [ { "X": 0.66837477684021, "Y": 0.802734375 }, { "X": 0.7723279595375061, "Y": 0.802734375 }, { "X": 0.7723279595375061, "Y": 0.8271484375 }, { "X": 0.66837477684021, "Y": 0.8271484375 } ] }, "Confidence": 99.85165405273438 }, "PageNumber": 1 }

您可以使用同步操作來分析發票或收據。若要分析這些單據,您可以使用 AnalyzeFesments 操作並將收據或發票傳遞給它。AnalyzeExpense返回整組結果。如需詳細資訊,請參閱 使用 Amazon Textract 分析發票和收據

若要異步分析發票和收據,請使用StartExpenseAnalysis開始處理輸入文檔文件。若要獲取結果,請調用GetExpenseAnalysis。給定調用的結果StartExpenseAnalysis返回的GetExpenseAnalysis。如需詳細資訊和範例,請參閱 使用異步操作處理文檔