什么是 AWS Entity Resolution 数据匹配服务? - AWS Entity Resolution 数据匹配服务

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

什么是 AWS Entity Resolution 数据匹配服务?

AWS Entity Resolution 数据匹配服务 是一项服务,可帮助您匹配、链接和增强存储在多个应用程序、渠道和数据存储中的相关记录。您可以开始使用灵活且可扩展的实体解析工作流程,并且可以连接到您现有的应用程序和数据服务提供商。

AWS Entity Resolution 数据匹配服务 提供高级匹配技术,例如基于规则的匹配、基于机器学习的匹配(机器学习匹配)和数据服务提供商主导的匹配。这些技术可以帮助您更准确地关联和增强客户信息、产品代码或业务数据代码的相关记录。

通过将最近发生的事件(例如广告点击、购物车放弃和购买)与来自数据服务提供商的匿名化信号关联到唯一的实体 ID,您可以使用 AWS Entity Resolution 数据匹配服务 创建统一的客户互动视图。您还可以更好地跟踪商店中使用不同代码(例如SKU,UPC)的产品。您可以使用 AWS Entity Resolution 数据匹配服务 来控制匹配精度,更好地保护数据安全,同时最大限度地减少数据移动。

你是首次 AWS Entity Resolution 数据匹配服务 使用吗?

如果您是首次使用 AWS Entity Resolution 数据匹配服务,我们建议您先阅读以下章节:

的特点 AWS Entity Resolution 数据匹配服务

AWS Entity Resolution 数据匹配服务 包括以下功能:

  • 灵活且可定制的数据准备

    AWS Entity Resolution 数据匹配服务 从中读取您的数据 AWS Glue ,用作匹配处理的输入。您最多可以指定 20 个数据输入。 AWS Entity Resolution 数据匹配服务 将数据输入表的每一行作为记录处理,并使用唯一的实体作为主键。 AWS Entity Resolution 数据匹配服务 可以对加密的数据集进行操作。首先定义架构映射 AWS Entity Resolution 数据匹配服务 ,以了解要在匹配工作流程中使用哪些输入字段。您可以从现有的数据输入中引入自己的 AWS Glue 数据架构或蓝图。或者,您可以使用交互式用户界面或JSON编辑器来构建自定义架构。默认情况下, AWS Entity Resolution 数据匹配服务 还会在匹配之前对数据输入进行标准化以改进匹配处理,例如删除特殊字符和多余空格,以及将文本格式化为小写。如果您的数据输入已经过标准化,则可以关闭标准化。我们还提供一个GitHub 库,您可以使用该库进一步自定义数据标准化过程以满足您的需求。

  • 可配置的实体匹配工作流程

    实体匹配工作流程是您设置的一系列步骤,用于说明 AWS Entity Resolution 数据匹配服务 如何匹配数据输入以及将合并数据输出写入何处。您可以设置一个或多个匹配工作流程来比较不同的数据输入,并使用不同的匹配技术,例如基于规则的匹配、机器学习匹配或数据服务提供商主导的匹配,无需实体解析或机器学习经验。您还可以查看现有匹配工作流程和指标的任务状态,例如资源编号、已处理的记录数和找到的匹配项数。

    • 基于 R eady-to-use 规则的匹配

      这种匹配方法在 o AWS Management Console r AWS Command Line Interface (AWS CLI) 中包含一组 ready-to-use 规则。您可以使用这些规则根据您的输入字段查找相关记录。您还可以通过添加或删除每条规则的输入字段、删除规则、重新排列规则优先级以及创建新规则来自定义规则。您也可以重置规则,使其恢复到其原始配置。您的亚马逊简单存储服务 (Amazon S3) Simple Service 存储桶中输出的数据包含使用基于规则的匹配技术生成的匹配组 AWS Entity Resolution 数据匹配服务 。每个匹配组都有用于生成与之关联的匹配项的规则编号,以帮助您了解匹配项。例如,规则编号可以证明每个匹配组的精度,从而使规则一比规则二更精确。

    • 预先配置的基于机器学习的匹配(机器学习匹配)

      这种匹配技术包括预先配置的机器学习模型,用于在所有数据输入中查找匹配项,尤其是基于消费者的记录。该模型使用与姓名、电子邮件地址、电话号码、地址和出生日期数据类型关联的所有输入字段。该模型生成由相关记录组成的匹配组,每个组中都有一个置信度分数,解释了与其他比赛组相比的比赛质量。该模型会考虑缺失的输入字段,并一起分析整个记录以表示实体。您的 Amazon S3 存储桶中的数据输出包含使用机器学习匹配 AWS Entity Resolution 数据匹配服务 生成的匹配组。在这里,每个匹配组的相关置信度分数为 0.0—1.0,这表示匹配的精度。

    • 将记录与数据服务提供商进行匹配

      借助, AWS Entity Resolution 数据匹配服务 您可以与领先的数据服务供应商和许可数据集进行匹配、关联和增强记录,从而扩大您了解、接触和服务客户的能力。例如,您可以为数据附加属性以增强记录,也可以提高所使用的系统和平台的互操作性以实现业务目标。您只需点击几下即可使用此匹配的工作流程,无需构建和维护复杂的专有集成。您必须与这些数据服务提供商签订许可协议才能利用这种匹配技术。

  • 手动批量处理和自动增量处理

    您可以使用数据处理来帮助将您的数据输入或输入转换为合并的数据输出表,该表包含使用实体匹配工作流配置生成的公共匹配 ID 的类似记录。使用 and AWS Management Console 或 AWS CLI,您可以根据现有提取、转换API和 load (ETL) 数据管道按需运行手动批量处理,该管道会重新处理所有新匹配项的数据,并更新现有匹配项。此外,对于基于规则的匹配方案,您可以启动自动增量处理,这样,只要您的 Amazon S3 存储桶中有新数据,该服务就会读取这些新记录并将其与现有记录进行比较。这样可以使您的匹配项与 Amazon S3 数据的任何变化保持同步。

  • 近乎实时的查询

    通过该AWS Entity Resolution 数据匹配服务 GetMatchId API操作查找任何实体字段可帮助您同步检索现有的匹配 ID。您可以使用通过不同来源和渠道获得的个人身份信息 (PII) 属性致电 AWS Entity Resolution 数据匹配服务 。 AWS Entity Resolution 数据匹配服务 对这些属性进行哈希处理以保护数据,并检索相应的匹配 ID 以关联和匹配客户。例如,您可以使用关联的姓名、电子邮件和邮寄地址进行网络注册。使用该 AWS Entity Resolution 数据匹配服务 GetMatchId API操作来确定存储在 S3 存储桶中的匹配结果中是否已存在该客户或实体,以及与之关联的相应实体匹配 ID。获得实体匹配 ID 后,您可以在源应用程序(例如客户关系管理 (CRM) 或客户数据平台 () 系统()中找到与之相关的交易信息。CDP

  • 通过设计实现数据保护和区域化

    AWS Entity Resolution 数据匹配服务 提供默认加密功能,可帮助您保护数据,并为输入到服务的每个数据提供加密密钥。例如, AWS Entity Resolution 数据匹配服务 允许您灵活地使用服务器端加密和哈希处理的数据来运行基于规则的匹配工作流程。 AWS Entity Resolution 数据匹配服务 支持区域化,这意味着您的匹配工作流程以与您使用服务相同的位置 AWS 区域 来处理数据。在其他应用程序中使用已解析的数据之前,您还可以对 Amazon S3 中的数据输出进行加密和哈希处理。

  • 多方转码

    AWS Entity Resolution 数据匹配服务 帮助您定义数据源,并在想要使用数据协作的多方之间进行匹配配置,例如在 AWS Clean Rooms。

以下内容与 AWS 服务 以下内容有关 AWS Entity Resolution 数据匹配服务:

  • Amazon S3

    将您导入的数据存储 AWS Entity Resolution 数据匹配服务 在 Amazon S3 中。

    有关更多信息,请参阅什么是 Amazon S3?Amazon 简单存储服务用户指南中。

  • AWS Glue

    根据您在 Amazon S3 中的数据创建 AWS Glue 表以供在中使用 AWS Entity Resolution 数据匹配服务。

    有关更多信息,请参阅什么是 AWS Glue? 在《AWS Glue 开发人员指南》中。

  • AWS CloudTrail

    AWS Entity Resolution 数据匹配服务 与 CloudTrail 日志配合使用可增强对 AWS 服务 活动的分析。

    有关更多信息,请参阅 使用记录 AWS Entity Resolution 数据匹配服务 API 调用 AWS CloudTrail

  • AWS CloudFormation

    在中创建以下资源 AWS CloudFormation: AWS::EntityResolution::MatchingWorkflow, AWS::EntityResolution::SchemaMapping, AWS::EntityResolution:IdMappingWorkflow, AWS::EntityResolution::IdNamespace 和 AWS::EntityResolution::PolicyStatement

    有关更多信息,请参阅 使用创建AWS实体解析资源 AWS CloudFormation

正在访问 AWS Entity Resolution 数据匹配服务

您可以 AWS Entity Resolution 数据匹配服务 通过以下选项进行访问:

的定价 AWS Entity Resolution 数据匹配服务

有关定价信息,请参阅 AWS Entity Resolution 数据匹配服务 定价