Amazon Comprehend 是什么? - Amazon Comprehend

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

Amazon Comprehend 是什么?

Amazon Comprehend 使用自然语言处理 (NLP) 来提取有关文档内容的见解。它可以通过识别文档中的实体、关键短语、语言、情绪和其他常见元素生成见解。使用 Amazon Comprehend 在了解文档结构的基础上创建新产品。例如,使用 Amazon Comprehend,您可以在社交网络提要中搜索提及产品的内容,或者在整个文档存储库中扫描关键短语。

您可以使用 Amazon Comprehend 控制台或 Amazon Comprehend API 访问 Amazon Comprehend 文档分析功能。您可以对小型工作负载运行实时分析,也可以为大型文档集启动异步分析作业。您可以使用 Amazon Comprehend 提供的预训练模型,也可以训练自己的自定义模型进行分类和实体识别。

Amazon Comprehend 可能会存储您的内容以持续改进其分析模型的质量。要了解更多信息,请参阅 Amazon Comprehend 常见问题解答

所有 Amazon Comprehend 特征都接受 UTF-8 文本文档作为输入。此外,自定义分类和自定义实体识别还接受图像文件、PDF 文件和 Word 文件作为输入。

Amazon Comprehend 可以根据具体特征检查和分析各种语言的文档。有关更多信息,请参阅Amazon Comprehend 支持的语言。Amazon Comprehend 的 主要语言 功能可以检查文档并为更广泛的语言选择确定主要语言。

Amazon Comprehend 见解

Amazon Comprehend 使用预先训练的模型来检查和分析一个或一组文档,以收集有关它的见解。该模型在大量文本上持续训练,因此您无需提供训练数据。

Amazon Comprehend 分析了以下类型的见解:

  • 实体:对文档中包含的人物、地点、项目和位置的引用。

  • 关键短语:出现在文档中的短语。例如,关于篮球比赛的文档可能会返回球队的名称、场地名称和最终比分。

  • 个人身份信息 (PII):可以识别个人身份的个人数据,例如地址、银行账号或电话号码。

  • 语言:文档的主要语言。

  • 情绪:文档的主导情绪,可以是积极的、中性的、消极的,也可以是混合的。

  • 目标情绪:与文档中特定实体相关的情绪。每个实体的情绪可以是积极、中性、消极或混合的。

  • 语法:文档中每个单词的词性。

有关更多信息,请参阅洞察

Amazon Comprehend 自定义

您可以根据自己的特定要求自定义 Amazon Comprehend,而无需具备构建基于机器学习的 NLP 解决方案所需的技能。使用自动机器学习或 AutoML,Amazon Comprehend 自定义使用您已有的数据为您构建自定义 NLP 模型。

自定义分类:创建自定义分类模型(分类器),将您的文档整理到您自己的类别中。

自定义实体识别:创建自定义实体识别模型(识别器),该模型可以根据您的特定术语和名词短语分析文本。

有关更多信息,请参阅Amazon Comprehend 自定义

飞轮

随着时间的推移,使用飞轮可以简化训练和管理自定义模型版本的过程。飞轮有助于编排与训练和评估新的模型版本相关的任务。飞轮支持纯文本自定义模型,用于自定义分类和自定义实体识别。有关更多信息,请参阅飞轮

文档集群(主题建模)

您也可以使用 Amazon Comprehend 检查文档语料库,以便根据文档中的相似关键字对它们进行整理。文档集群(主题建模)可用于将大型文档语料库组织成基于词频相似的主题或集群。有关更多信息,请参阅主题建模

示例

以下示例展示了如何在应用程序中使用 Amazon Comprehend 操作。

例 1:查找有关某个主题的文档

使用 Amazon Comprehend 主题建模查找有关特定主题的文档。扫描一组文档以确定所讨论的主题,并找到与每个主题相关的文档。您可以指定 Amazon Comprehend 应从文档集中返回的主题数量。

例 2:了解客户对产品的感受

如果您的公司发布了目录,请让 Amazon Comprehend 告诉您顾客对您的产品的看法。将每位客户评论发送给 DetectSentiment 运营部门,它将告诉您客户对产品的评价是积极、消极、中性还是混合的。

例 3:发现客户最关心的问题

使用 Amazon Comprehend 主题建模来发现客户在论坛和留言板上谈论的主题,然后使用实体检测来确定他们与该主题关联的人物、地点和事物。使用情绪分析来确定客户对某个话题的看法。

优势

使用 Amazon Comprehend 的优点包括:

  • 将强大的自然语言处理功能集成到您的应用程序中:Amazon Comprehend 通过简单的 API 提供强大且准确的自然语言处理功能,消除了在应用程序中构建文本分析功能的复杂性。您不需要文本分析专业知识就能充分利用 Amazon Comprehend 生成的见解。

  • 基于深度学习的自然语言处理:Amazon Comprehend 使用深度学习技术来准确分析文本。我们的模型不断使用跨多个领域的新数据进行训练,以提高准确性。

  • 可扩展的自然语言处理:Amazon Comprehend 使您能够分析数百万份文档,从而发现其中包含的见解。

  • 与其他 AWS 服务集成 — Amazon Comprehend 旨在与其他 AWS 服务无缝协作,例如亚马逊 S3、和。 AWS KMS AWS Lambda将您的文档存储在亚马逊 S3 中,或者使用 Firehose 分析实时数据。Support for AWS Identity and Access Management (IAM) 可以轻松安全地控制对 Amazon Comprehend 运营的访问权限。借助 IAM,您可以创建和管理用户和组,以便向开发人员和最终用户授予适当的访问权限。

  • 输出结果和卷数据的加密:Amazon S3 已经允许您加密输入文档,而 Amazon Comprehend 将这一功能进一步扩展。通过使用您自己的 KMS 密钥,您可以加密作业的输出结果以及附加到处理分析作业的计算实例的存储卷上的数据。结果是显著增强了安全性。

  • 低成本:Amazon Comprehend 不收取最低费用或预付款。您需要为分析的文档和训练的自定义模型付费。

Amazon Comprehend 定价

使用 Amazon Comprehend 时,您仅需为实际使用的资源付费。如果您是 AWS 新客户,还可以免费试用 Amazon Comprehend。有关更多信息,请参阅 AWS 免费使用套餐

运行实时或异步分析作业需要支付费用。您需要为训练自定义模型付费,并为自定义模型管理付费。对于使用自定义模型的实时请求,从启动终端节点开始计费,直到删除终端节点为止。使用飞轮不收取任何额外费用。但是,当您运行飞轮迭代时,训练新模型版本和存储模型数据会产生标准费用。

有关费率和其他详细信息,请参阅 Amazon Comprehend 定价

您是否是首次接触 Amazon Comprehend 的用户?

如果您是首次接触 Amazon Comprehend 的用户,我们建议您按顺序阅读以下章节:

  1. 工作方式:本节介绍 Amazon Comprehend 的概念。

  2. 设置:在本节中,您将创建一个帐户并设置 AWS CLI。

  3. Amazon Comprehend 入门:在本节中,您将运行 Amazon Comprehend 分析作业。

  4. 教程:使用 Amazon Comprehend 分析来自客户评论的见解:在本节中,您将进行情绪和实体分析并将结果可视化。

  5. Amazon Comprehend API 参考:Amazon Comprehend 操作的参考文档。

AWS 提供了以下资源供您了解 Amazon Comprehend 服务: