輸入文檔 - Amazon Textract

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

輸入文檔

Amazon Textract 操作的合適輸入是單頁或多頁文檔。一些示例包括法律文件、表單、ID 或信件。表單是一個帶有問題或提示用户提供答案的文檔。一些示例包括患者登記表、税務表或保險索賠表。

文檔可以採用 JPEG、PNG、PDF 格式或 TIFF 格式。使用 PDF 和 TIFF 格式文件,您可以處理多頁文檔。有關 Amazon Textract 如何將文檔表示為Block對象,請參閲文本檢測和文檔分析響應對象

以下為可接受的輸入文件範例。

帶有標題就業申請的白紙的圖像。下一行顯示應用程序信息,下一個全名:簡·多伊,下一個電話號碼:555-0100,下一個家庭地址:123 任何街道, 安城美國, 下一個郵寄地址:同上. 下面是一個標題為「以往僱傭歷史」的表格。它有五列和四行。列標題包括起始日期、終止日期、僱主姓名、保留職位和離職原因。下一行列出了 2009 年 1 月 15 日、2011 年 6 月 30 日、任何公司、助理麪包師和搬遷。接下來的 7/1/2011, 8 月 10 日, 例如公司貝克, 更好的 OPP. 接下來的 8/15/2013, 現在, AnyCompany, 負責麪包師, 和 N/A, 當前.

如需文件限制的資訊,請參亞馬遜文字中的硬性限制

對於 Amazon Textract 同步操作,您可以使用存儲在 Amazon S3 存儲桶中的輸入文檔,也可以傳遞 base64 編碼的圖像字節。如需詳細資訊,請參閱 調用 Amazon Textract 同步操作。對於異步操作,您需要在 Amazon S3 存儲桶中提供輸入文檔。如需詳細資訊,請參閱 調用 Amazon Textract 異步操作