选择您的 Cookie 首选项

我们使用必要 Cookie 和类似工具提供我们的网站和服务。我们使用性能 Cookie 收集匿名统计数据,以便我们可以了解客户如何使用我们的网站并进行改进。必要 Cookie 无法停用,但您可以单击“自定义”或“拒绝”来拒绝性能 Cookie。

如果您同意,AWS 和经批准的第三方还将使用 Cookie 提供有用的网站功能、记住您的首选项并显示相关内容,包括相关广告。要接受或拒绝所有非必要 Cookie,请单击“接受”或“拒绝”。要做出更详细的选择,请单击“自定义”。

运行分析任务以识别自定义实体

聚焦模式
运行分析任务以识别自定义实体 - Amazon Comprehend

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

您可以运行异步分析任务来检测一组或多个文档中的自定义实体。

开始前的准备工作

在检测自定义实体之前,您需要使用自定义实体识别模型(也称为识别器)。有关这些模型的更多信息,请参阅 训练自定义实体识别器模型

使用纯文本注释训练的识别器仅支持纯文本文档的实体检测。使用 PDF 文档注释训练的识别器支持纯文本文档、图像、PDF 文件和 Word 文档的实体检测。对于文本文件以外的文件,Amazon Comprehend 会在运行分析之前执行文本提取。有关输入文件的信息,请参阅 异步自定义分析的输入

如果您计划分析图像文件或扫描的 PDF 文档,则您的 IAM 策略必须授予使用两种 Amazon Textract API 方法(DetectDocumentText 和 AnalyzeDocument)的权限。Amazon Comprehend 在文本提取过程中会调用这些方法。有关策略示例,请参阅 执行文档分析操作所需的权

要运行异步分析任务,请执行以下总体步骤:

  1. 将这些文档存储在 Amazon S3 存储桶中。

  2. 使用 API 或控制台启动分析任务。

  3. 监控分析任务的进度。

  4. 任务运行完成后,从启动任务时指定的 S3 存储桶中检索分析结果。

隐私网站条款Cookie 首选项
© 2025, Amazon Web Services, Inc. 或其附属公司。保留所有权利。