文件處理 - Amazon Comprehend

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

文件處理

Amazon Comprehend 支援自訂分類和自訂實體辨識的單一步驟文件處理。例如,您可以混合輸入純文字文件和半結構化文件 (例如 PDF 文件、Microsoft Word 文件和影像) 至自訂分析工作。

對於需要文字擷取的輸入檔案,Amazon Comprehend 會在執行分析之前自動執行文字擷取。為了擷取文字內容,Amazon Comprehend 會針對原生半結構化文件使用內部剖析器,並針對影像和掃描的文件使用 Amazon Textract API。

除了亞太區域 (東京) 和 AWS GovCloud (美國西部) 僅支援自訂分類的純文字模型外支援地區,每個 Amazon Comprehend 都提供 Amazon Comprehend 文件處理功能。

下列主題提供 Amazon Comprehend 支援用於自訂分析之輸入文件類型的詳細資訊。