本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
Amazon Textract 從幾乎任何發票或收據中提取相關數據,例如聯繫信息、購買的商品和供應商名稱,而無需任何模板或配置。發票和收據通常使用各種佈局,因此很難大規模手動提取數據。Amazon Textract 使用 ML 來瞭解發票和收據的上下文,並自動提取發票或收據日期、發票或收據編號、商品價格、總金額和付款條件等數據,以滿足您的業務需求。
Amazon Textract 還會識別對您的工作流程至關重要但未明確標記的供應商名稱。例如,Amazon Textract 可以在收據上找到供應商名稱,即使該名稱僅在頁面頂部的徽標中顯示,而沒有明確的鍵值對組合。Amazon Textract 還可以讓您輕鬆整合不同收據和發票的輸入,這些收據和發票為同一概念使用不同詞語。例如,Amazon Textract 會映射不同文檔中的字段名稱之間的關係,例如客户編號、客户編號和賬户 ID,並將標準分類輸出為INVOICE_RECEIPT_ID
。在這種情況下,Amazon Textract 會在不同文檔類型中一致地表示數據。與標準分類不一致的字段被歸類為OTHER
。
以下為分析費用目前支持的標準字段清單:
-
廠商名稱:
VENDOR_NAME
-
資料總數:
TOTAL
-
接收方地址:
RECEIVER_ADDRESS
-
發票/接收日期:
INVOICE_RECEIPT_DATE
-
發票/收據編號:
INVOICE_RECEIPT_ID
-
付款條件:
PAYMENT_TERMS
-
小計:
SUBTOTAL
-
截止日期:
DUE_DATE
-
務:
TAX
-
發票納税人編號(SSN/ITIN 或 EIN):
TAX_PAYER_ID
-
項目名稱:
ITEM_NAME
-
商品價格:
PRICE
-
商品數量:
QUANTITY
分析費用 API 返回給定文檔頁面的以下元素:
-
頁面內的收據或發票數量,表示為
ExpenseIndex
-
單個字段的標準化名稱,表示為
Type
-
字段的實際名稱,如文件中所顯示的欄位名稱,表示為
LabelDetection
-
對應字段的值表示為
ValueDetection
-
所提交文檔中的頁數表示為
Pages
-
檢測到字段、值或行項目的頁碼,表示為
PageNumber
-
幾何,其中包括頁面上各個字段、值或行項目的邊界框和座標位置,表示為
Geometry
-
與文檔上檢測到的每個數據段相關聯的置信度分數,表示為
Confidence
-
購買的單個行項目的整行,表示為
EXPENSE_ROW
以下是由分析費用處理的收據的 API 輸出的一部分,顯示合計:55.64 在文檔中提取為標準字段TOTAL
, 文檔上的實際文本為「總」, 置信度分為「97.1」, 頁碼「1」, 總值為「$55.64」和邊界框和多邊形座標:
{ "Type": { "Text": "TOTAL", "Confidence": 99.94717407226562 }, "LabelDetection": { "Text": "Total:", "Geometry": { "BoundingBox": { "Width": 0.09809663146734238, "Height": 0.0234375, "Left": 0.36822840571403503, "Top": 0.8017578125 }, "Polygon": [ { "X": 0.36822840571403503, "Y": 0.8017578125 }, { "X": 0.466325044631958, "Y": 0.8017578125 }, { "X": 0.466325044631958, "Y": 0.8251953125 }, { "X": 0.36822840571403503, "Y": 0.8251953125 } ] }, "Confidence": 97.10792541503906 }, "ValueDetection": { "Text": "$55.64", "Geometry": { "BoundingBox": { "Width": 0.10395314544439316, "Height": 0.0244140625, "Left": 0.66837477684021, "Top": 0.802734375 }, "Polygon": [ { "X": 0.66837477684021, "Y": 0.802734375 }, { "X": 0.7723279595375061, "Y": 0.802734375 }, { "X": 0.7723279595375061, "Y": 0.8271484375 }, { "X": 0.66837477684021, "Y": 0.8271484375 } ] }, "Confidence": 99.85165405273438 }, "PageNumber": 1 }
您可以使用同步操作來分析發票或收據。若要分析這些單據,您可以使用 AnalyzeFesments 操作並將收據或發票傳遞給它。AnalyzeExpense
返回整組結果。如需詳細資訊,請參閱 使用 Amazon Textract 分析發票和收據。
若要異步分析發票和收據,請使用StartExpenseAnalysis開始處理輸入文檔文件。若要獲取結果,請調用GetExpenseAnalysis。給定調用的結果StartExpenseAnalysis返回的GetExpenseAnalysis
。如需詳細資訊和範例,請參閱 使用異步操作處理文檔。