文档处理

Amazon Comprehend 支持一步完成自定义分类和自定义实体识别的文档处理。例如，您可以将纯文本文档和半结构化文档（例如 PDF 文档、Microsoft Word 文档和图像）混合输入到自定义分析任务中。

对于需要提取文本的输入文件，Amazon Comprehend 会在运行分析之前自动执行文本提取。为了提取文本内容，Amazon Comprehend 使用内部解析器来处理原生半结构化文档，并使用 Amazon Textract API 来处理图像和扫描文档。

Amazon Comprehend 文档处理功能适用于除亚太地区（东京）以外的每个 Amazon Compreh 支持的区域： end，并且仅支持纯文本模型进行自定义分类。 AWS GovCloud (US-West)

以下主题详细介绍了 Amazon Comprehend 支持进行自定义分析的输入文档类型。

Javascript 在您的浏览器中被禁用或不可用。

要使用 Amazon Web Services 文档，必须启用 Javascript。请参阅浏览器的帮助页面以了解相关说明。

正在编辑 PII 实体

实时分析输入