使用控制台运行分析作业 - Amazon Comprehend

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

使用控制台运行分析作业

您可以使用 Amazon Comprehend 控制台创建和管理异步分析作业。您的作业会分析存储在 Amazon S3 中的文档,以查找事件、短语、主要语言、情绪或个人身份信息 (PII) 等实体。

创建分析作业
  1. 登录 AWS Management Console 并打开亚马逊 Comprehend 控制台,网址为 https://console.aws.amazon.com/comprehend/

  2. 从左侧菜单中选择分析作业,然后选择创建作业

  3. 作业设置下,为分析作业指定一个唯一的名称。

  4. 对于分析类型,请选择内置分析类型之一。

    如果选择 “主要语言” 或主题建模”,则可以跳过下一步。

  5. 根据您选择的分析类型,控制台会显示以下一个或多个附加字段:

    • 初级语言主题建模外,所有内置分析类型都需要语言

      选择输入文档的语言。

    • 事件分析类型需要使用目标事件类型

      选择要在输入文档中检测的事件类型。有关支持的事件类型的更多信息,请参阅 事件类型

    • PII 分析类型需要 PII 检测设置

      选择输出模式。有关 PII 检测设置的更多信息,请参阅 检测PII实体

  6. 输入数据下,指定输入文档在 Amazon S3 中的位置:

    • 要分析您自己的文档,请选择我的文档,然后选择浏览 S3 提供包含您的文件的存储桶或文件夹的路径。

    • 要分析 Amazon Comprehend 提供的示例,请选择示例文档。在这种情况下,Amazon Comprehend 使用由 AWS管理的存储桶,而您无需指定存储位置。

  7. (可选)对于输入格式,请为输入文件指定以下格式之一:

    • 每个文件一个文档:每个文件包含一个输入文档。这最适合大型文档的集合。

    • 每行一个文档:输入一个或多个文件。文件中的每一行都被视为一个文档。这最适合简短的文档,例如社交媒体帖子。每行必须以换行符 (LF, \n)、回车符 (CR, \r) 或两者兼有 (CRLF, \r\n) 结尾。您不能使用 UTF-8 行分隔符 (u+2028) 来结束一行。

  8. 输出数据下,选择浏览 S3。选择 Amazon S3 存储桶或文件夹,以便 Amazon Comprehend 将分析生成的输出数据写入其中。

  9. (可选)要加密作业的输出结果,请选择加密。然后选择是使用与当前账户关联的 KMS 密钥,还是使用来自其他账户的 KMS 密钥:

    • 如果您使用的是与当前账户关联的密钥,请为 KMS 密钥 ID 选择密钥别名或 ID。

    • 如果您使用与其他账户关联的密钥,请在 KMS 密钥 ID 下输入密钥别名或 ID 的 ARN。

      注意

      有关创建和使用 KMS 密钥以及相关加密的更多信息,请参阅密钥管理服务 (KMS)

  10. 访问权限下,提供一个 IAM 角色:

    • 授予对 Amazon S3 输入文档位置的读取访问权限。

    • 授予对 Amazon S3 输出文档位置的写入访问权限。

    • 包括允许 comprehend.amazonaws.com 服务委托人担任角色并获得其权限的信任策略。

    如果您还没有具有这些权限和适当信任策略的 IAM 角色,请选择创建 IAM 角色来创建一个。

  11. 填完表单后,选择创建作业以创建并启动主题检测作业。

新作业出现在作业列表中,状态字段会显示该作业的状态。该字段可以用于 IN_PROGRESS 正在处理的作业、 COMPLETED 已成功完成的作业以及 FAILED 存在错误的作业。您可以单击作业以获取有关该作业的更多信息,包括任何错误消息。

作业完成后,Amazon Comprehend 会将分析结果存储在您为作业指定的输出 Amazon S3 位置。有关每种见解类型的分析结果的描述,请参阅 洞察