

本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。

# 使用匹配流程匹配输入数据
<a name="create-matching-workflow"></a>

*匹配工作流*是一种数据处理作业，它合并和比较来自不同输入源的数据，并根据不同的匹配技术确定哪些记录匹配。 AWS Entity Resolution 数据匹配服务 从您指定的位置读取您的数据，查找记录之间的匹配项，并为每组[匹配的数据分配一个匹配 ID](glossary.md#match-id-defin)。

下图总结了如何创建匹配的工作流程。

![\[A summary of the four steps to create a matching workflow in AWS Entity Resolution 数据匹配服务\]](http://docs.aws.amazon.com/zh_cn/entityresolution/latest/userguide/images/HIW-Matching-Workflow.png)

**Topics**
+ [匹配工作流程类型](#matching-workflow-types)
+ [数据输出选项](#data-output-options)
+ [匹配工作流程结果](#matching-workflow-results)
+ [创建基于规则的匹配工作流程](creating-matching-workflow-rule-based.md)
+ [创建基于机器学习的匹配工作流程](create-matching-workflow-ml.md)
+ [创建基于提供商服务的匹配工作流程](create-matching-workflow-provider.md)
+ [编辑匹配的工作流程](edit-matching-workflow.md)
+ [删除匹配的工作流程](delete-matching-workflow.md)
+ [为基于规则的匹配工作流程修改或生成匹配 ID](generate-match-id.md)
+ [为基于规则的匹配工作流程查找匹配 ID](find-match-id.md)
+ [从基于规则或基于 ML 的匹配工作流程中删除记录](delete-records.md)
+ [匹配工作流程疑难解答](troubleshooting.md)

## 匹配工作流程类型
<a name="matching-workflow-types"></a>

AWS Entity Resolution 数据匹配服务 支持三种类型的匹配工作流程：

基于规则的匹配  
使用可配置的规则，根据指定字段的精确匹配或模糊匹配来识别匹配的记录。您可以定义匹配条件，例如拼写相似的匹配名称或格式不同的地址。

基于机器学习的匹配  
使用机器学习模型识别相似的记录，即使数据存在差异、错误或缺失字段也是如此。这种方法可以检测比基于规则的匹配更复杂的匹配项。

基于提供商服务的匹配  
在匹配之前，使用第三方数据提供商来丰富和验证您的数据。这种匹配类型与 Amazon Connect 客户档案输出不兼容。

## 数据输出选项
<a name="data-output-options"></a>

AWS Entity Resolution 数据匹配服务 可以将数据输出文件写入: 
+ 您指定的 Amazon S3 地点 
+ Amazon Connect 客户档案（用于客户重复数据删除） 

**重要**  
导出到 Amazon Connect 客户资料与基于提供商的匹配不兼容。要导出到 Amazon Connect 客户档案，您必须使用基于规则的匹配或基于机器学习的匹配。

如果需要 AWS Entity Resolution 数据匹配服务 ，您可以使用对输出数据进行哈希处理，从而帮助您保持对数据的控制。

下表显示了三种类型的匹配工作流及其支持的输出目标。


| 匹配类型 | S3 输出 | 客户档案输出 | 
| --- | --- | --- | 
| [基于规则](creating-matching-workflow-rule-based.md) | ![\[alt text not found\]](http://docs.aws.amazon.com/zh_cn/entityresolution/latest/userguide/images/success_icon.svg) 是 | ![\[alt text not found\]](http://docs.aws.amazon.com/zh_cn/entityresolution/latest/userguide/images/success_icon.svg) 是 | 
| [基于机器学习](create-matching-workflow-ml.md) | ![\[alt text not found\]](http://docs.aws.amazon.com/zh_cn/entityresolution/latest/userguide/images/success_icon.svg) 是 | ![\[alt text not found\]](http://docs.aws.amazon.com/zh_cn/entityresolution/latest/userguide/images/success_icon.svg) 是 | 
| [基于提供商的服务](create-matching-workflow-provider.md) | ![\[alt text not found\]](http://docs.aws.amazon.com/zh_cn/entityresolution/latest/userguide/images/success_icon.svg) 是 | ![\[alt text not found\]](http://docs.aws.amazon.com/zh_cn/entityresolution/latest/userguide/images/negative_icon.svg)否 | 

## 匹配工作流程结果
<a name="matching-workflow-results"></a>

创建并运行匹配的工作流程后，您可以在指定的 S3 位置或 Amazon Connect 客户档案中查看结果。对数据进行索引 IDs 后会生成匹配的工作流程。

匹配的工作流程可以有多次运行，结果（成功或错误）将写入名称`jobId`为的文件夹。

对于 S3 输出目标的每次运行：
+ 数据输出既包含成功匹配的文件又包含错误文件
+ 成功的结果将写入包含多个文件的文件`success`夹
+ 错误被写入包含多个字段`error`的文件夹

每次运行 Amazon Connect 客户档案时，输出目的地：
+ 经过重复数据删除的客户记录将直接发送到您的 Amazon Connect 实例
+ 你可以在 AWS Entity Resolution 数据匹配服务 控制台中查看你最近的任务历史记录
+ 重复数据删除流程中不包括 Amazon Connect 中的现有配置文件

创建并运行匹配工作流程后，您可以使用[基于规则的匹配或机器学习 (ML) 匹配的输出作为基于](creating-matching-workflow-rule-based.md)[[提供商服务的](create-matching-workflow-provider.md)匹配](create-matching-workflow-ml.md)的输入，或者反过来满足您的业务需求。

例如，为了节省提供商订阅成本，您可以先运行[基于规则的匹配](creating-matching-workflow-rule-based.md)来查找数据上的匹配项。然后，您可以将不匹配记录的子集发送给[基于提供商服务的匹配](create-matching-workflow-provider.md)。请注意，如果您计划导出到客户档案，则应仅使用基于规则或基于机器学习的匹配。

有关故障排除的更多信息，请参阅[匹配工作流程疑难解答](troubleshooting.md)。

# 创建基于规则的匹配工作流程
<a name="creating-matching-workflow-rule-based"></a>

*[基于规则的匹配](glossary.md#rule-based-matching-defn)*是一组分层的瀑布匹配规则 AWS Entity Resolution 数据匹配服务，由您根据输入的数据推荐，并且完全可以由您配置。基于规则的匹配工作流程使您可以比较明文数据或哈希数据，以根据您自定义的条件找到精确的匹配项。

在您的数据中 AWS Entity Resolution 数据匹配服务 发现两条或多条记录之间存在匹配项时，它会分配：
+ 与[匹配数据集中的记录的匹配 ID](glossary.md#match-id-defin)
+ 生成[匹配项的匹配规则](glossary.md#match-rule-defn)。

在中创建基于规则的匹配工作流程时 AWS Entity Resolution 数据匹配服务，必须选择 “**简单**” 或 “**高级” 规则类型**。规则类型决定了您可以创建的规则条件的复杂性。创建工作流程后，您无法更改规则类型。

您可以使用下表来比较两种**规则类型**，并确定哪一种适合您的用例。


**规则类型对比图**  

| 使用案例 | 高级规则类型 | 简单规则类型 | 
| --- |--- |--- |
|  one-to-one使用输入类型映射的架构映射 | ![\[alt text not found\]](http://docs.aws.amazon.com/zh_cn/entityresolution/latest/userguide/images/success_icon.svg) 是 | 否 | 
| --- |--- |--- |
| 将多个数据列映射到相同输入类型的架构映射 | ![\[alt text not found\]](http://docs.aws.amazon.com/zh_cn/entityresolution/latest/userguide/images/negative_icon.svg)没有 | 是 | 
| --- |--- |--- |
| 支持精确匹配和模糊匹配 | ![\[alt text not found\]](http://docs.aws.amazon.com/zh_cn/entityresolution/latest/userguide/images/success_icon.svg) 是 | 否（仅限精确匹配） | 
| --- |--- |--- |
| 支持 AND、OR 和圆括号运算符 | ![\[alt text not found\]](http://docs.aws.amazon.com/zh_cn/entityresolution/latest/userguide/images/success_icon.svg) 是 | 否（仅限 AND 运算符） | 
| --- |--- |--- |
| 支持批处理工作流程 | ![\[alt text not found\]](http://docs.aws.amazon.com/zh_cn/entityresolution/latest/userguide/images/success_icon.svg) 是 | 是 | 
| --- |--- |--- |
| 支持增量工作流程 | ![\[alt text not found\]](http://docs.aws.amazon.com/zh_cn/entityresolution/latest/userguide/images/success_icon.svg) 是 | 是 | 
| --- |--- |--- |
| 支持实时工作流程 | ![\[alt text not found\]](http://docs.aws.amazon.com/zh_cn/entityresolution/latest/userguide/images/negative_icon.svg)否 | 是 | 
| --- |--- |--- |
| 支持 ID 映射工作流程 | ![\[alt text not found\]](http://docs.aws.amazon.com/zh_cn/entityresolution/latest/userguide/images/negative_icon.svg)没有 | 是 | 
| --- |--- |--- |

确定要使用哪种规则类型后，请使用以下主题创建基于规则的匹配工作流程，其中包括 “**高级**” 或 “**简单**” 规则类型。

**Topics**
+ [使用高级规则类型创建基于规则的匹配工作流](rule-based-mw-advanced.md)
+ [使用 “简单” 规则类型创建基于规则的匹配工作流程](rule-based-mw-simple.md)

# 使用高级规则类型创建基于规则的匹配工作流
<a name="rule-based-mw-advanced"></a>

**先决条件**

在创建基于规则的匹配工作流程之前，您必须：

1. 创建架构映射。有关更多信息，请参阅 [创建架构映射](create-schema-mapping.md)。

1. 如果使用 Amazon Connect 客户档案作为输出目标，请确保配置了相应的权限。

以下过程演示如何使用 AWS Entity Resolution 数据匹配服务 控制台或 API 创建具有**高级**规则类型的基于规则的匹配工作流。`CreateMatchingWorkflow`

------
#### [ Console ]

**使用控制台创建具有**高级**规则类型的基于规则的匹配工作流**

1. 登录 AWS 管理控制台 并打开 AWS Entity Resolution 数据匹配服务 控制台，网址为[https://console.aws.amazon.com/entityresolution/](https://console.aws.amazon.com/entityresolution/)。

1. 在左侧导航窗格的 “**工作流程**” 下，选择 “**匹配**”。

1. 在**匹配工作流程**页面的右上角，选择**创建匹配工作流程**。

1. 对于 “**步骤 1：指定匹配的工作流程详细信息**”，请执行以下操作：

   1. 输入**匹配的工作流程名称**和可选的**描述**。

   1. 对于**数据输入 **AWS 区域****，选择**AWS Glue 数据库**、**AWS Glue 表**，然后选择相应的**架构映射**。

      您最多可以添加 19 个数据输入。
**注意**  
要使用**高级**规则，您的架构映射必须满足以下要求：  
除非字段组合在一起，否则每个输入字段都必须映射到唯一的匹配键。
如果将输入字段组合在一起，则它们可以共享相同的匹配键。  
例如，以下架构映射对**高级**规则有效：  
`firstName: { matchKey: 'name', groupName: 'name' }`  
`lastName: { matchKey: 'name', groupName: 'name' }`  
在这种情况下，`firstName`和`lastName`字段组合在一起并共享相同的名称匹配密钥，这是允许的。  
检查您的架构映射并更新它们以遵循此 one-to-one匹配规则，除非字段已正确分组，否则才能使用**高级**规则。
如果您的数据表有 DELETE 列，则架构映射的类型必须为，`String`并且不能使用`matchKey`和`groupName`。

   1. 默认情况下，“**标准化数据**” 选项处于选中状态，以便在匹配之前对数据输入进行标准化。如果您不想对数据进行标准化处理，请取消选择 “**标准化**数据” 选项。
**注意**  
**创建架构映射**中仅支持以下场景的标准化：  
如果将以下 “**名称**” 子类型分组：**名字**、**中间名、姓****氏**。
如果将以下**地址**子类型分组：**街道地址 1**、**街道地址 2**、**街道地址 3**、**城市**、**州**、**国家**、**邮政编码**。
如果将以下**电话**子类型分组：**电话号码**、**电话国家/地区代码**。

   1. 要指定**服务访问**权限，请选择一个选项并采取建议的操作。    
[\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/zh_cn/entityresolution/latest/userguide/rule-based-mw-advanced.html)

   1. （可选）要为资源启用**标签**，请选择**添加新标签**，然后输入**密钥**和**值**对。

   1. 选择**下一步**。

1. 对于**步骤 2：选择匹配技术**：

   1. 在 “**匹配方法**” 中，选择 “**基于规则的**匹配”。

   1. 对于 “**规则类型**”，选择 “**高级**”。  
![\[选择匹配技术屏幕，并选择基于规则的高级匹配选项。\]](http://docs.aws.amazon.com/zh_cn/entityresolution/latest/userguide/images/choose-matching-method-rule-based-advanced.PNG)

   1. 在 “**处理节奏**” 中，选择以下选项之一。
      + 选择 “**手动**”，按需运行工作流以进行批量更新 
      + 选择 “**自动**” 以在 S3 存储桶中有新数据后立即运行工作流程 
**注意**  
如果您选择 “**自动**”，请确保您的 S3 存储桶已启用 Amazon EventBridge 通知。有关 EventBridge 使用 S3 控制台启用亚马逊的说明，请参阅 [Amazon S3 用户指南 EventBridge中的启用](https://docs.aws.amazon.com/AmazonS3/latest/userguide/enable-event-notifications-eventbridge.html)*亚马逊*。

   1. 对于**匹配规则**，输入**规则名称**，然后根据您的目标从下拉列表中选择相应的匹配函数和运算符来构建**规则条件**。

      您最多可以创建 25 条规则。

      ****必须使用 AND 运算符将模糊匹配函数（**Cosine**、**Levenshtein** 或 **Soundex**）与精确匹配函数（Exact、**ExactManyToMany**）组合在一起。****

      根据您的目标，您可以使用下表来帮助决定要使用哪种类型的函数或运算符。    
[\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/zh_cn/entityresolution/latest/userguide/rule-based-mw-advanced.html)  
**Example 与电话号码和电子邮件相匹配的规则条件**  

      以下是匹配电话号码（**电话**匹配密钥）和电子邮件地址（**电子邮件地址**匹配密钥）记录的规则条件示例：

      `Exact(Phone,EmptyValues=Process) AND Levenshtein("Email address",2)`  
![\[匹配电话号码和电子邮件地址记录的规则条件示例。\]](http://docs.aws.amazon.com/zh_cn/entityresolution/latest/userguide/images/matching-rule-condition-example.png)

      **电话**匹配键使用**精确**匹配功能来匹配相同的字符串。**电话**匹配键使用 **EmptyValues=Process 修饰符处理**匹配中的空值。

      **电子邮件地址**匹配键使用 **Levenshtein** 匹配功能使用默认的 Levenshtein 距离算法阈值 2 来匹配拼写错误的数据。**电子邮件**匹配键不使用任何可选修饰符。

      **AND 运算符结合了**精确**匹配函数和 **Levenshtein** 匹配函数。**  
**Example 用于执行火柴键匹配 ExactManyToMany 的规则条件**  

      以下是一个规则条件示例，该规则条件用于匹配三个地址字段（**HomeAddress**匹配键、**BillingAddress**匹配键和**ShippingAddress**匹配键）上的记录，通过检查其中是否有相同值来查找潜在的匹配项。

      `ExactManyToMany`运算符会评估指定地址字段的所有可能组合，以确定任意两个或多个地址之间的精确匹配项。例如，它将检测是否与或`HomeAddress`匹配`ShippingAddress`，`BillingAddress`或者所有三个地址是否完全匹配。

      ```
      ExactManyToMany(HomeAddress, BillingAddress, ShippingAddress)
      ```  
**Example 使用聚类的规则条件**  

      在具有模糊条件的基于规则的高级匹配中，系统首先根据精确匹配将记录分组为聚类。形成这些初始聚类后，系统会应用模糊匹配过滤器来识别每个聚类中的其他匹配项。为了获得最佳性能，您应该根据自己的数据模式选择精确匹配条件来创建定义明确的初始群集。

      以下是将多个精确匹配与模糊匹配要求相结合的规则条件示例。它使用`AND`运算符来检查三个字段 — `FullName`、出生日期 (`DOB`) 和 `Address` — 在记录之间是否完全匹配。使用 Levenshtein 的距离，它还允许在`InternalID`场上进行细微的变化。`1`Levenshtein 距离测量将一个字符串更改为另一个字符串所需的最小单字符编辑次数。距离为 1 表示它将匹配仅`InternalIDs`相差一个字符（例如单个错字、删除或插入）。这种条件组合有助于识别极有可能代表同一实体的记录，即使标识符之间存在细微差异。

      ```
      Exact(FullName) AND Exact(DOB) AND Exact(Address) and Levenshtein(InternalID, 1)
      ```

   1. 选择**下一步**。

1. 对于**步骤 3：指定数据输出和格式**：

   1. 对于**数据输出目标和格式**，选择数据输出的 **Amazon S3 位置**，以及**数据格式**是**标准化数据**还是**原始数据**。

   1. 对于**加密**，如果您选择**自定义加密设置**，请输入**AWS KMS 密钥** ARN。

   1. 查看**系统生成的输出**。

   1. 对于**数据输出**，请决定要包含、隐藏或掩盖哪些字段，然后根据目标采取建议的操作。    
[\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/zh_cn/entityresolution/latest/userguide/rule-based-mw-advanced.html)

   1. 选择**下一步**。

1. 对于**步骤 4：查看并创建**：

   1. 查看您在之前的步骤中所做的选择，并在必要时进行编辑。

   1. 选择**创建并运行**。

      将出现一条消息，表示匹配的工作流程已创建且作业已启动。

1. 在匹配的工作流程详细信息页面的**指标**选项卡上，在 “**上次作业指标**” 下查看以下内容：
   + 作**业 ID**。
   + **匹配工作流作业的**状态**：已**排队**、进行**中**、**已完成、失**败** 
   + 工作流作业的**完成时间**。
   + 已**处理的记录**数。
   + **未处理的记录**数。
   + ** IDs 生成的唯一匹配项**。
   + **输入记录**的数量。

   您还可以查看任务**历史记录下先前运行过的匹配工作流程作业的作业**指标。

1. 匹配的工作流程任务完成（**状态**为**已完成**）后，您可以转到**数据输出**选项卡，然后选择您的 **Amazon S3 位置**以查看结果。

1. （仅限**手动**处理类型）如果您创建了**手动**处理类型的**基于规则的匹配**工作流，则可以在匹配工作流详细信息页面上选择 “运行工作流”，随时**运行匹配工作流**。

1. （仅限**自动**处理类型）如果您的数据表有 DELETE 列，则：
   + 删除列*true*中设置为的记录。
   + 在 “删除” 列*false*中设置为的记录将提取到 S3 中。

   有关更多信息，请参阅 [步骤 1：准备第一方数据表](prepare-input-data.md#prepare-first-party-tables)。

------
#### [ API ]

**使用 API 创建具有**高级**规则类型的基于规则的匹配工作流程**
**注意**  
默认情况下，工作流使用标准（批处理）处理。要使用增量（自动）处理，必须对其进行明确配置。

1. 打开终端或命令提示符发出 API 请求。

1. 向以下端点创建 POST 请求：

   ```
   /matchingworkflows
   ```

1. 在请求标头中，将内容类型设置为 application/json。
**注意**  
有关支持的编程语言的完整列表，请参阅 *[AWS Entity Resolution 数据匹配服务 API 参考](https://docs.aws.amazon.com/entityresolution/latest/apireference/Welcome.html)*。

1. 对于请求正文，请提供以下必需的 JSON 参数：

   ```
   {
      "description": "string",
      "incrementalRunConfig": { 
         "incrementalRunType": "string"
      },
      "inputSourceConfig": [ 
         { 
            "applyNormalization": boolean,
            "inputSourceARN": "string",
            "schemaName": "string"
         }
      ],
      "outputSourceConfig": [ 
         { 
            "applyNormalization": boolean,
            "KMSArn": "string",
            "output": [ 
               { 
                  "hashed": boolean,
                  "name": "string"
               }
            ],
            "outputS3Path": "string"
         }
      ],
      "resolutionTechniques": { 
         "providerProperties": { 
            "intermediateSourceConfiguration": { 
               "intermediateS3Path": "string"
            },
            "providerConfiguration": JSON value,
            "providerServiceArn": "string"
         },
         "resolutionType": "RULE_MATCHING",
         "ruleBasedProperties": { 
            "attributeMatchingModel": "string",
            "matchPurpose": "string",
            "rules": [ 
               { 
                  "matchingKeys": [ "string" ],
                  "ruleName": "string"
               }
            ]
         },
         "ruleConditionProperties": { 
            "rules": [ 
               { 
                  "condition": "string",
                  "ruleName": "string"
               }
            ]
         }
      },
      "roleArn": "string",
      "tags": { 
         "string" : "string" 
      },
      "workflowName": "string"
   }
   ```

   其中：
   + `workflowName`（必填）— 必须是唯一的，并且必须介于 1—255 个字符之间，匹配模式 [a-za-z\$10-9-] \$1
   + `inputSourceConfig`（必填）— 1—20 个输入源配置列表
   + `outputSourceConfig`（必填）— 只有一个输出源配置
   + `resolutionTechniques`（必填）— 设置为 “RULE\$1MATCHING” 作为基于规则的匹配的分辨率类型
   + `roleArn`（必填）— 用于执行工作流程的 IAM 角色 ARN
   + `ruleConditionProperties`（必填）-规则条件列表和匹配规则的名称。

   可选参数包括：
   + `description`— 最多 255 个字符
   + `incrementalRunConfig`— 增量运行类型配置
   + `tags`— 最多 200 个键值对

1. （可选）要使用增量处理而不是默认的标准（批处理）处理，请在请求正文中添加以下参数：

   ```
   "incrementalRunConfig": {
      "incrementalRunType": "AUTOMATIC"
   }
   ```

1. 发送 请求。

1. 如果成功，您将收到状态码 200 的响应和包含以下内容的 JSON 正文：

   ```
   {
      "workflowArn": "string",
      "workflowName": "string",
      // Plus all configured workflow details
   }
   ```

1. 如果呼叫失败，您可能会收到以下错误之一：
   + 400- ConflictException 如果工作流程名称已经存在
   + 400 — ValidationException 如果输入未通过验证
   + 402- ExceedsLimitException 如果超过账户限额
   + 403 — AccessDeniedException 如果你没有足够的访问权限
   + 429 — ThrottlingException 如果请求被限制
   + 500 — InternalServerException 如果内部服务出现故障

------

# 使用 “简单” 规则类型创建基于规则的匹配工作流程
<a name="rule-based-mw-simple"></a>

**先决条件**

在创建基于规则的匹配工作流程之前，您必须：

1. 创建架构映射。有关更多信息，请参阅 [创建架构映射](create-schema-mapping.md)。

1. 如果使用 Amazon Connect 客户档案作为输出目标，请确保配置了相应的权限。

以下过程演示如何使用 AWS Entity Resolution 数据匹配服务 控制台或 API 创建具有**简单**规则类型的基于规则的匹配工作流程。`CreateMatchingWorkflow`

------
#### [ Console ]

**使用控制台创建具有**简单**规则类型的基于规则的匹配工作流**

1. 登录 AWS 管理控制台 并打开 AWS Entity Resolution 数据匹配服务 控制台，网址为[https://console.aws.amazon.com/entityresolution/](https://console.aws.amazon.com/entityresolution/)。

1. 在左侧导航窗格的 “**工作流程**” 下，选择 “**匹配**”。

1. 在**匹配工作流程**页面的右上角，选择**创建匹配工作流程**。

1. 对于 “**步骤 1：指定匹配的工作流程详细信息**”，请执行以下操作：

   1. 输入**匹配的工作流程名称**和可选的**描述**。

   1. 对于**数据输入 **AWS 区域****，选择**AWS Glue 数据库**、**AWS Glue 表**，然后选择相应的**架构映射**。

      您最多可以添加 19 个数据输入。

   1. 默认情况下，“**标准化数据**” 选项处于选中状态，以便在匹配之前对数据输入进行标准化。如果您不想对数据进行标准化处理，请取消选择 “**标准化**数据” 选项。
**注意**  
**创建架构映射**中仅支持以下场景的标准化：  
如果将以下 “**名称**” 子类型分组：**名字**、**中间名、姓****氏**。
如果将以下**地址**子类型分组：**街道地址 1**、**街道地址 2**、**街道地址 3**、**城市**、**州**、**国家**、**邮政编码**。
如果将以下**电话**子类型分组：**电话号码**、**电话国家/地区代码**。

   1. 要指定**服务访问**权限，请选择一个选项并采取建议的操作。    
[\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/zh_cn/entityresolution/latest/userguide/rule-based-mw-simple.html)

   1. （可选）要为资源启用**标签**，请选择**添加新标签**，然后输入**密钥**和**值**对。

   1. 选择**下一步**。

1. 对于**步骤 2：选择匹配技术**：

   1. 在 “**匹配方法**” 中，选择 “**基于规则的**匹配”。

   1. 对于 “**规则类型**”，选择 “**简单**”。  
![\[选择 “基于规则的简单匹配” 选项的匹配技术屏幕。\]](http://docs.aws.amazon.com/zh_cn/entityresolution/latest/userguide/images/choose-matching-method-rule-based-simple.PNG)

   1. 在 “**处理节奏**” 中，选择以下选项之一。
      + 选择 “**手动**”，按需运行工作流以进行批量更新 
      + 选择 “**自动**” 以在 S3 存储桶中有新数据后立即运行工作流程 
**注意**  
如果您选择 “**自动**”，请确保您的 S3 存储桶已启用 Amazon EventBridge 通知。有关 EventBridge 使用 S3 控制台启用亚马逊的说明，请参阅 [Amazon S3 用户指南 EventBridge中的启用](https://docs.aws.amazon.com/AmazonS3/latest/userguide/enable-event-notifications-eventbridge.html)*亚马逊*。

   1. （可选）**对于仅适用于 ID 映射的索**引，您可以选择**启用**仅索引数据而不生成数据的功能 IDs。

      默认情况下，匹配的工作流程会在数据编制索引 IDs 后生成。

   1. 在**匹配规则**中，输入**规则名称**，然后为该规则选择**匹配密钥**。

      您最多可以创建 15 个规则，并且可以在规则中应用最多 15 个不同的匹配密钥来定义匹配条件。  
![\[匹配规则界面包含用于输入规则名称和选择匹配密钥的字段。\]](http://docs.aws.amazon.com/zh_cn/entityresolution/latest/userguide/images/matching-rules.PNG)

   1. 对于 “**比较类型**”，请根据您的目标选择以下选项之一。    
[\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/zh_cn/entityresolution/latest/userguide/rule-based-mw-simple.html)  
![\[比较类型选项：多个输入字段用于查找存储在多个字段中的数据的匹配项，或者使用单个输入字段来限制在一个字段内进行比较。\]](http://docs.aws.amazon.com/zh_cn/entityresolution/latest/userguide/images/comparison-type.PNG)

   1. 选择**下一步**。

1. 对于**步骤 3：指定数据输出和格式**：

   1. 对于**数据输出目标和格式**，选择数据输出的 **Amazon S3 位置**，以及**数据格式**是**标准化数据**还是**原始数据**。

   1. 对于**加密**，如果您选择**自定义加密设置**，请输入**AWS KMS 密钥** ARN。

   1. 查看**系统生成的输出**。

   1. 对于**数据输出**，请决定要包含、隐藏或掩盖哪些字段，然后根据目标采取建议的操作。    
[\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/zh_cn/entityresolution/latest/userguide/rule-based-mw-simple.html)

   1. 选择**下一步**。

1. 对于**步骤 4：查看并创建**：

   1. 查看您在之前的步骤中所做的选择，并在必要时进行编辑。

   1. 选择**创建并运行**。

      将出现一条消息，表示匹配的工作流程已创建且作业已启动。

1. 在匹配的工作流程详细信息页面的**指标**选项卡上，在 “**上次作业指标**” 下查看以下内容：
   + 作**业 ID**。
   + **匹配工作流作业的**状态**：已**排队**、进行**中**、**已完成、失**败** 
   + 工作流作业的**完成时间**。
   + 已**处理的记录**数。
   + **未处理的记录**数。
   + ** IDs 生成的唯一匹配项**。
   + **输入记录**的数量。

   您还可以查看任务**历史记录下先前运行过的匹配工作流程作业的作业**指标。

1. 匹配的工作流程任务完成（**状态**为**已完成**）后，您可以转到**数据输出**选项卡，然后选择您的 **Amazon S3 位置**以查看结果。

1. （仅限**手动**处理类型）如果您创建了**手动**处理类型的**基于规则的匹配**工作流，则可以在匹配工作流详细信息页面上选择 “运行工作**流”，随时运行**匹配工作流。

------
#### [ API ]

**使用 API 创建规则类型为 “**简单**” 的基于规则的匹配工作流程**
**注意**  
默认情况下，工作流使用标准（批处理）处理。要使用增量（自动）处理，必须对其进行明确配置。

1. 打开终端或命令提示符发出 API 请求。

1. 向以下端点创建 POST 请求：

   ```
   /matchingworkflows
   ```

1. 在请求标头中，将内容类型设置为 application/json。
**注意**  
有关支持的编程语言的完整列表，请参阅 *[AWS Entity Resolution 数据匹配服务 API 参考](https://docs.aws.amazon.com/entityresolution/latest/apireference/Welcome.html)*。

1. 对于请求正文，请提供以下必需的 JSON 参数：

   ```
   {
      "description": "string",
      "incrementalRunConfig": { 
         "incrementalRunType": "string"
      },
      "inputSourceConfig": [ 
         { 
            "applyNormalization": boolean,
            "inputSourceARN": "string",
            "schemaName": "string"
         }
      ],
      "outputSourceConfig": [ 
         { 
            "applyNormalization": boolean,
            "KMSArn": "string",
            "output": [ 
               { 
                  "hashed": boolean,
                  "name": "string"
               }
            ],
            "outputS3Path": "string"
         }
      ],
      "resolutionTechniques": { 
         "providerProperties": { 
            "intermediateSourceConfiguration": { 
               "intermediateS3Path": "string"
            },
            "providerConfiguration": JSON value,
            "providerServiceArn": "string"
         },
         "resolutionType": "RULE_MATCHING",
         "ruleBasedProperties": { 
            "attributeMatchingModel": "string",
            "matchPurpose": "string",
            "rules": [ 
               { 
                  "matchingKeys": [ "string" ],
                  "ruleName": "string"
               }
            ]
         },
         "ruleConditionProperties": { 
            "rules": [ 
               { 
                  "condition": "string",
                  "ruleName": "string"
               }
            ]
         }
      },
      "roleArn": "string",
      "tags": { 
         "string" : "string" 
      },
      "workflowName": "string"
   }
   ```

   其中：
   + `workflowName`（必填）— 必须是唯一的，并且必须介于 1—255 个字符之间，匹配模式 [a-za-z\$10-9-] \$1
   + `inputSourceConfig`（必填）— 1—20 个输入源配置列表
   + `outputSourceConfig`（必填）— 只有一个输出源配置
   + `resolutionTechniques`（必需）-设置为 “规则匹配” 以进行基于规则的匹配
   + `roleArn`（必填）— 用于执行工作流程的 IAM 角色 ARN
   + `ruleConditionProperties`（必填）-规则条件列表和匹配规则的名称。

   可选参数包括：
   + `description`— 最多 255 个字符
   + `incrementalRunConfig`— 增量运行类型配置
   + `tags`— 最多 200 个键值对

1. （可选）要使用增量处理而不是默认的标准（批处理）处理，请在请求正文中添加以下参数：

   ```
   "incrementalRunConfig": {
      "incrementalRunType": "AUTOMATIC"
   }
   ```

1. 发送 请求。

1. 如果成功，您将收到状态码 200 的响应和包含以下内容的 JSON 正文：

   ```
   {
      "workflowArn": "string",
      "workflowName": "string",
      // Plus all configured workflow details
   }
   ```

1. 如果呼叫失败，您可能会收到以下错误之一：
   + 400- ConflictException 如果工作流程名称已经存在
   + 400 — ValidationException 如果输入未通过验证
   + 402- ExceedsLimitException 如果超过账户限额
   + 403 — AccessDeniedException 如果你没有足够的访问权限
   + 429 — ThrottlingException 如果请求被限制
   + 500 — InternalServerException 如果内部服务出现故障

------

# 创建基于机器学习的匹配工作流程
<a name="create-matching-workflow-ml"></a>

*[基于机器学习的匹配](glossary.md#ml-matching-defn)*是一个预设过程，它会尝试匹配您输入的所有数据的记录。基于机器学习的匹配工作流程使您能够使用机器学习模型比较明文数据以找到广泛的匹配项。

**注意**  
机器学习模型不支持哈希数据的比较。

在您的数据中 AWS Entity Resolution 数据匹配服务 发现两条或多条记录之间存在匹配项时，它会分配：
+ 与[匹配数据集中的记录的匹配 ID](glossary.md#match-id-defin)
+ 匹配置[信度](glossary.md#confidence-level-defn)百分比。

您可以使用基于 ML 的匹配工作流程的输出作为数据服务提供商匹配的输入，反之亦然，以实现您的特定目标。例如，您可以运行基于 ML 的匹配，先在自己的记录中查找数据源的匹配项。如果子集未匹配，则可以运行[基于提供商服务的匹配](create-matching-workflow-provider.md)来查找其他匹配项。

**先决条件**

在创建基于 ML 的匹配工作流程之前，您必须：

1. 创建架构映射。有关更多信息，请参阅 [创建架构映射](create-schema-mapping.md)。

1. 如果使用 Amazon Connect 客户档案作为输出目标，请确保配置了相应的权限。

**要创建基于 ML 的匹配工作流程，请执行以下操作：**

1. 登录 AWS 管理控制台 并打开 AWS Entity Resolution 数据匹配服务 控制台，网址为[https://console.aws.amazon.com/entityresolution/](https://console.aws.amazon.com/entityresolution/)。

1. 在左侧导航窗格的 “**工作流程**” 下，选择 “**匹配**”。

1. 在**匹配工作流程**页面的右上角，选择**创建匹配工作流程**。

1. 对于 “**步骤 1：指定匹配的工作流程详细信息**”，请执行以下操作：

   1. 输入**匹配的工作流程名称**和可选的**描述**。

   1. 对于**数据输入 **AWS 区域****，选择**AWS Glue 数据库**、**AWS Glue 表**，然后选择相应的**架构映射**。

      您最多可以添加 20 个数据输入。

   1. 默认情况下，“**标准化数据**” 选项处于选中状态，以便在匹配之前对数据输入进行标准化。如果您不想对数据进行标准化处理，请取消选择 “**标准化**数据” 选项。

      基于机器学习的匹配仅对[Name](glossary.md#normalization-ML-defn-name)、[Phone](glossary.md#normalization-ML-defn-phone)和进行标准化。[电子邮件](glossary.md#normalization-ML-defn-email)

   1. 要指定**服务访问**权限，请选择一个选项并采取建议的操作。    
[\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/zh_cn/entityresolution/latest/userguide/create-matching-workflow-ml.html)

   1. （可选）要为资源启用**标签**，请选择**添加新标签**，然后输入**密钥**和**值**对。

   1. 选择**下一步**。

1. 对于**步骤 2：选择匹配技术**：

   1. 对于**匹配方法**，选择**基于机器学习的**匹配。  
![\[AWS Entity Resolution 数据匹配服务 将工作流程创建界面与基于规则的匹配或机器学习匹配选项相匹配。\]](http://docs.aws.amazon.com/zh_cn/entityresolution/latest/userguide/images/choose-matching-method-machine-learning.PNG)

   1. 对于**处理节奏**，选择了 “**手动**” 选项。

      此选项允许您按需运行工作流程以进行批量更新。
**注意**  
基于机器学习的匹配工作流程不支持自动（增量）处理。

   1. 选择**下一步**。

1. 对于**步骤 3：指定数据输出和格式**：

   1. 对于**数据输出目标和格式**，选择数据输出的 **Amazon S3 位置**，以及**数据格式**是**标准化数据**还是**原始数据**。

   1. 对于**加密**，如果您选择**自定义加密设置**，请输入**AWS KMS 密钥** ARN。

   1. 查看**系统生成的输出**。

   1. 对于**数据输出**，请决定要包含、隐藏或掩盖哪些字段，然后根据目标采取建议的操作。    
[\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/zh_cn/entityresolution/latest/userguide/create-matching-workflow-ml.html)

   1. 选择**下一步**。

1. 对于**步骤 4：查看并创建**：

   1. 查看您在之前的步骤中所做的选择，并在必要时进行编辑。

   1. 选择**创建并运行**。

      将出现一条消息，表示匹配的工作流程已创建且作业已启动。

1. 在匹配的工作流程详细信息页面的**指标**选项卡上，在 “**上次作业指标**” 下查看以下内容：
   + 作**业 ID**。
   + **匹配工作流作业的**状态**：已**排队**、进行**中**、**已完成、失**败** 
   + 工作流作业的**完成时间**。
   + 已**处理的记录**数。
   + **未处理的记录**数。
   + ** IDs 生成的唯一匹配项**。
   + **输入记录**的数量。

   您还可以查看任务**历史记录下先前运行过的匹配工作流程作业的作业**指标。

1. 匹配的工作流程任务完成（**状态**为**已完成**）后，您可以转到**数据输出**选项卡，然后选择您的 **Amazon S3 位置**以查看结果。

1. （仅限**手动**处理类型）如果您创建了**手动**处理类型的**基于机器学习的匹配**工作流，则可以在匹配工作流详细信息页面上选择 “运行工作**流”，随时运行**匹配工作流。

# 创建基于提供商服务的匹配工作流程
<a name="create-matching-workflow-provider"></a>

*[基于提供商服务的匹配](glossary.md#provider-service-matching)*使您能够将已知标识符与首选数据服务提供商进行匹配。

AWS Entity Resolution 数据匹配服务 目前支持以下数据提供商服务：
+ LiveRamp
+ TransUnion
+ 统一身份证 2.0

有关支持的提供商服务的更多信息，请参阅[准备第三方输入数据](prepare-third-party-input-data.md)。

您可以对这些提供商使用公开订阅， AWS Data Exchange 也可以直接与数据提供商协商私人报价。有关创建新订阅或重复使用提供商服务的现有订阅的更多信息，请参阅[步骤 1：在上订阅提供商服务 AWS Data Exchange](prepare-third-party-input-data.md#subscribe-provider-service)。

以下各节介绍如何创建基于提供者的匹配工作流程。

**Topics**
+ [使用创建匹配的工作流程 LiveRamp](#create-mw-liveramp)
+ [使用创建匹配的工作流程 TransUnion](#create-mw-transunion)
+ [使用 UID 2.0 创建匹配的工作流程](#create-mw-uid)

## 使用创建匹配的工作流程 LiveRamp
<a name="create-mw-liveramp"></a>

该 LiveRamp 服务提供了一个名为 rampID 的标识符。RamPid是需求方平台 IDs 中最常用于为广告活动吸引受众的平台之一。使用与匹配的工作流程 LiveRamp，您可以将经过哈希处理的电子邮件地址解析为。 RAMPIDs

**注意**  
AWS Entity Resolution 数据匹配服务 支持基于 PII 的 rampID 分配。

**先决条件**

在使用创建匹配的工作流程之前 LiveRamp，您必须：

1. 创建架构映射。有关更多信息，请参阅 [创建架构映射](create-schema-mapping.md)。

1. 订阅该 LiveRamp 服务

1. 为 Amazon S3 数据暂存存储桶配置适当的权限，以便在其中临时写入匹配的工作流程输出

在使用创建 ID 映射工作流程之前 LiveRamp，请向 S3 数据暂存存储桶添加以下权限。

------
#### [ JSON ]

****  

```
{
    "Version":"2012-10-17",		 	 	 
    "Statement": [
        {
            "Effect": "Allow",
            "Principal": {
                "AWS": "arn:aws:iam::715724997226:root"
      
            },
            "Action": [
                "s3:PutObject",
                "s3:GetObject",
                "s3:GetObjectVersion",
                "s3:DeleteObject"
            ],
            "Resource": [
                "arn:aws:s3:::<staging-bucket>",
                "arn:aws:s3:::<staging-bucket>/*"
            ]
        },
        {
            "Effect": "Allow",
            "Principal": {
                "AWS": "arn:aws:iam::715724997226:root"
            },
            "Action": [
                "s3:ListBucket",
                "s3:GetBucketLocation",
                "s3:GetBucketPolicy",
                "s3:ListBucketVersions",
                "s3:GetBucketAcl"
            ],
            "Resource": [
                "arn:aws:s3:::<staging-bucket>",
                "arn:aws:s3:::<staging-bucket>/*"
            ]
        }
    ]
}
```

------

将每个 *<user input placeholder>* 替换为您自己的信息。


|  |  | 
| --- |--- |
| staging-bucket | Amazon S3 存储桶，用于在运行基于提供商服务的工作流程时临时存储您的数据。 | 

**要创建匹配的工作流程，请执行 LiveRamp以下操作：**

1. 登录 AWS 管理控制台 并打开 AWS Entity Resolution 数据匹配服务 控制台，网址为[https://console.aws.amazon.com/entityresolution/](https://console.aws.amazon.com/entityresolution/)。

1. 在左侧导航窗格的 “**工作流程**” 下，选择 “**匹配**”。

1. 在**匹配工作流程**页面的右上角，选择**创建匹配工作流程**。

1. 对于 “**步骤 1：指定匹配的工作流程详细信息**”，请执行以下操作：

   1. 输入**匹配的工作流程名称**和可选的**描述**。

   1. 对于**数据输入 **AWS 区域****，选择**AWS Glue 数据库**、**AWS Glue 表**，然后选择相应的**架构映射**。

      您最多可以添加 20 个数据输入。

   1. 默认情况下，“**标准化数据**” 选项处于选中状态，以便在匹配之前对数据输入进行标准化。
**注意**  
**创建架构映射**中仅支持以下场景的标准化：  
如果将以下 “**名称**” 子类型分组：**名字**、**中间名、姓****氏**。
如果将以下**地址**子类型分组：**街道地址 1**、**街道地址 2**：**街道地址 3 名称**、**城市名称**、**州**、**国家**、**邮政编码**。
如果将以下**电话**子类型分组：**电话号码**、**电话国家/地区代码**。

      如果您使用的是仅限电子邮件的解析流程，请取消选择 “**标准化数据**” 选项，因为只有经过哈希处理的电子邮件才用于输入数据。

   1. 要指定**服务访问**权限，请选择一个选项并采取建议的操作。    
[\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/zh_cn/entityresolution/latest/userguide/create-matching-workflow-provider.html)

   1. （可选）要为资源启用**标签**，请选择**添加新标签**，然后输入**密钥**和**值**对。

   1. 选择**下一步**。

1. 对于**步骤 2：选择匹配技术**：

   1. 在 “**匹配方法**” 中，选择 “**提供者服务**”。

   1. 对于**提供商服务**，请选择**LiveRamp**。
**注意**  
确保您的数据输入文件格式和标准化符合提供商服务的指南。  
有关匹配工作流程的输入文件格式指南的更多信息，请参阅 LiveRamp 文档中的[通过 ADX 执行身份解析](https://docs.liveramp.com/identity/en/perform-identity-resolution-through-adx.html)。

   1. 对于**LiveRamp 产品**，请从下拉列表中选择产品。  
![\[选择提供者服务的 LiveRamp 提供者服务选项。\]](http://docs.aws.amazon.com/zh_cn/entityresolution/latest/userguide/images/choose-matching-method-liveramp.png)
**注意**  
如果您选择**赋值 PII，**则在执行实体解析时必须至少提供一个非标识符列。例如，性别。

   1. 要进行**LiveRamp 配置**，请输入**客户端 ID 管理器 ARN** 和**客户机密管理器 AR** N。  
![\[LiveRamp 配置表单，其中包含客户端 ID 管理器 ARN 和客户机密管理器 ARN 字段。\]](http://docs.aws.amazon.com/zh_cn/entityresolution/latest/userguide/images/choose-matching-method-liveramp-config.png)

   1. 对于**数据暂**存，请选择 **Amazon S3 位置**，以便在处理数据时临时存储数据。

      您必须拥有访问 **Amazon S3 数据暂存位置**的权限。有关更多信息，请参阅 [为创建工作流程工作角色 AWS Entity Resolution 数据匹配服务](create-workflow-job-role.md)。

   1. 选择**下一步**。

1. 对于**步骤 3：指定数据输出**：

   1. 对于**数据输出目标和格式**，选择数据输出的 **Amazon S3 位置**，以及**数据格式**是**标准化数据**还是**原始数据**。

   1. 对于**加密**，如果您选择**自定义加密设置**，请输入**AWS KMS 密钥** ARN。

   1. 查看**LiveRamp 生成的输出**。

      这是由生成的其他信息 LiveRamp。

   1. 对于**数据输出**，请决定要包含、隐藏或掩盖哪些字段，然后根据目标采取建议的操作。
**注意**  
如果您已选择 **LiveRamp**，则由于 LiveRamp 隐私过滤器会删除个人身份信息 (PII)，某些字段将显示 “**不可用**” 的**输出**状态。    
[\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/zh_cn/entityresolution/latest/userguide/create-matching-workflow-provider.html)  
![\[AWS Entity Resolution 数据匹配服务 ID 映射工作流程创建界面，带有用于指定数据输出位置的选项。\]](http://docs.aws.amazon.com/zh_cn/entityresolution/latest/userguide/images/specify-data-output.PNG)

   1. 选择**下一步**。

1. 对于**步骤 4：查看并创建**：

   1. 查看您在之前的步骤中所做的选择，并在必要时进行编辑。

   1. 选择**创建并运行**。

      将出现一条消息，表示匹配的工作流程已创建且作业已启动。

1. 在匹配的工作流程详细信息页面的**指标**选项卡上，在 “**上次作业指标**” 下查看以下内容：
   + 作**业 ID**。
   + **匹配工作流作业的**状态**：已**排队**、进行**中**、**已完成、失**败** 
   + 工作流作业的**完成时间**。
   + 已**处理的记录**数。
   + **未处理的记录**数。
   + ** IDs 生成的唯一匹配项**。
   + **输入记录**的数量。

   您还可以查看任务**历史记录下先前运行过的匹配工作流程作业的作业**指标。

1. 匹配的工作流程任务完成（**状态**为**已完成**）后，您可以转到**数据输出**选项卡，然后选择您的 **Amazon S3 位置**以查看结果。

## 使用创建匹配的工作流程 TransUnion
<a name="create-mw-transunion"></a>

如果您订阅了该 TransUnion 服务，则可以通过使用 TransUnion 个人和家庭电子密钥以及200多个数据属性链接、匹配和增强存储在不同渠道上的客户相关记录来提高对客户的理解。

该 TransUnion 服务提供名为 “ TransUnion 个人和家庭” 的标识符 IDs。 TransUnion 提供已知标识符（例如姓名、地址、电话号码和电子邮件地址）的 ID 分配（也称为编码）。

**先决条件**

在使用创建匹配的工作流程之前 LiveRamp，您必须：

1. 创建架构映射。有关更多信息，请参阅 [创建架构映射](create-schema-mapping.md)。

1. 订阅该 TransUnion 服务

1. 为 Amazon S3 数据暂存存储桶配置适当的权限，以便在其中临时写入匹配的工作流程输出

在使用创建匹配的工作流程之前 TransUnion，请向 S3 数据暂存存储桶添加以下权限。

------
#### [ JSON ]

****  

```
{
    "Version":"2012-10-17",		 	 	 
    "Statement": [
        {
            "Effect": "Allow",
            "Principal": {
                "AWS": "arn:aws:iam::381491956555:root"
      
            },
            "Action": [
                "s3:PutObject",
                "s3:GetObject",
                "s3:GetObjectVersion",
                "s3:DeleteObject"
            ],
            "Resource": [
                "arn:aws:s3:::<staging-bucket>",
                "arn:aws:s3:::<staging-bucket>/*"
            ]
        },
        {
            "Effect": "Allow",
            "Principal": {
                "AWS": "arn:aws:iam::381491956555:root"
            },
            "Action": [
                "s3:ListBucket",
                "s3:GetBucketLocation",
                "s3:GetBucketPolicy",
                "s3:ListBucketVersions",
                "s3:GetBucketAcl"
            ],
            "Resource": [
                "arn:aws:s3:::<staging-bucket>",
                "arn:aws:s3:::<staging-bucket>/*"
            ]
        }
    ]
}
```

------

将每个 *<user input placeholder>* 替换为您自己的信息。


|  |  | 
| --- |--- |
| staging-bucket | Amazon S3 存储桶，用于在运行基于提供商服务的工作流程时临时存储您的数据。 | 

**要创建匹配的工作流程，请执行 TransUnion以下操作：**

1. 登录 AWS 管理控制台 并打开 AWS Entity Resolution 数据匹配服务 控制台，网址为[https://console.aws.amazon.com/entityresolution/](https://console.aws.amazon.com/entityresolution/)。

1. 在左侧导航窗格的 “**工作流程**” 下，选择 “**匹配**”。

1. 在**匹配工作流程**页面的右上角，选择**创建匹配工作流程**。

1. 对于 “**步骤 1：指定匹配的工作流程详细信息**”，请执行以下操作：

   1. 输入**匹配的工作流程名称**和可选的**描述**。

   1. 对于**数据输入 **AWS 区域****，选择**AWS Glue 数据库**、**AWS Glue 表**，然后选择相应的**架构映射**。

      您最多可以添加 20 个数据输入。

   1. 默认情况下，“**标准化数据**” 选项处于选中状态，以便在匹配之前对数据输入进行标准化。如果您不想对数据进行标准化处理，请取消选择 “**标准化**数据” 选项。
**注意**  
**创建架构映射**中仅支持以下场景的标准化：  
如果将以下 “**名称**” 子类型分组：**名字**、**中间名、姓****氏**。
如果将以下**地址**子类型分组：**街道地址 1**、**街道地址 2**：**街道地址 3 名称**、**城市名称**、**州**、**国家**、**邮政编码**。
如果将以下**电话**子类型分组：**电话号码**、**电话国家/地区代码**。

   1. 要指定**服务访问**权限，请选择一个选项并采取建议的操作。    
[\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/zh_cn/entityresolution/latest/userguide/create-matching-workflow-provider.html)

   1. （可选）要为资源启用**标签**，请选择**添加新标签**，然后输入**密钥**和**值**对。

   1. 选择**下一步**。

1. 对于**步骤 2：选择匹配技术**：

   1. 在 “**匹配方法**” 中，选择 “**提供者服务**”。

   1. 对于**提供商服务**，请选择**TransUnion**。
**注意**  
确保您的数据输入文件格式和标准化符合提供商服务的指南。  
![\[选择提供者服务的 TransUnion 提供者服务选项。\]](http://docs.aws.amazon.com/zh_cn/entityresolution/latest/userguide/images/choose-matching-method-transunion.PNG)

   1. 对于**数据暂**存，请选择 **Amazon S3 位置**，以便在处理数据时临时存储数据。

      您必须拥有访问 **Amazon S3 数据暂存位置**的权限。有关更多信息，请参阅 [为创建工作流程工作角色 AWS Entity Resolution 数据匹配服务](create-workflow-job-role.md)。

1. 选择**下一步**。

1. 对于**步骤 3：指定数据输出**：

   1. 对于**数据输出目标和格式**，选择数据输出的 **Amazon S3 位置**，以及**数据格式**是**标准化数据**还是**原始数据**。

   1. 对于**加密**，如果您选择**自定义加密设置**，请输入**AWS KMS 密钥** ARN。

   1. 查看**TransUnion 生成的输出**。

      这是由生成的其他信息 TransUnion。

   1. 对于**数据输出**，请决定要包含、隐藏或掩盖哪些字段，然后根据目标采取建议的操作。    
[\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/zh_cn/entityresolution/latest/userguide/create-matching-workflow-provider.html)

   1. 对于**系统生成的输出**，请查看包含的所有字段。

   1. 选择**下一步**。

1. 对于**步骤 4：查看并创建**：

   1. 查看您在之前的步骤中所做的选择，并在必要时进行编辑。

   1. 选择**创建并运行**。

      将出现一条消息，表示匹配的工作流程已创建且作业已启动。

1. 在匹配的工作流程详细信息页面的**指标**选项卡上，在 “**上次作业指标**” 下查看以下内容：
   + 作**业 ID**。
   + **匹配工作流作业的**状态**：已**排队**、进行**中**、**已完成、失**败** 
   + 工作流作业的**完成时间**。
   + 已**处理的记录**数。
   + **未处理的记录**数。
   + ** IDs 生成的唯一匹配项**。
   + **输入记录**的数量。

   您还可以查看任务**历史记录下先前运行过的匹配工作流程作业的作业**指标。

1. 匹配的工作流程任务完成（**状态**为**已完成**）后，您可以转到**数据输出**选项卡，然后选择您的 **Amazon S3 位置**以查看结果。

## 使用 UID 2.0 创建匹配的工作流程
<a name="create-mw-uid"></a>

如果您订阅了 Unified ID 2.0 服务，则可以激活具有确定性身份的广告活动，并依靠与广告生态系统中许多 UID2支持参与者的互操作性。有关更多信息，请参阅 [Unified ID 2.0 概述]( https://unifiedid.com/docs/intro)。

Unified ID 2.0 服务提供原始的 UID 2，用于在 The Trade Desk 平台中制作广告活动。UID 2.0 是使用开源框架生成的。

在一个工作流程中，您可以将其中一个**Email Address**或**Phone number**用于原始生 UID2 成，但不能同时使用两者。如果两者都存在于架构映射中，则工作流将选择，**Email Address**然后**Phone number**将是直通字段。要同时支持这两者，请创建一个新的架构映射**Phone number**，其中已映射但**Email Address**未映射。然后，使用这个新的架构映射创建第二个工作流程。

**注意**  
生盐 UID2s 是通过添加盐桶中的盐来制成的，这些盐桶大约每年轮换一次，这样生的盐也会 UID2 随之旋转。因此，建议您 UID2s 每天刷新 raw。有关更多信息，请参阅 [https://unifiedid.com/docs/getting-started/gs-faqs\$1 2-incremental-how-often-should-uid](https://unifiedid.com/docs/getting-started/gs-faqs#how-often-should-uid2s-be-refreshed-for-incremental-updates) updates。s-be-refreshed-for

**先决条件**

在使用 UID 2.0 创建匹配的工作流程之前，您必须：

1. 创建架构映射。有关更多信息，请参阅 [创建架构映射](create-schema-mapping.md)。

1. 订阅 UID 2.0 服务

**要使用 UID 2.0 创建匹配的工作流程，请执行以下操作：**

1. 登录 AWS 管理控制台 并打开 AWS Entity Resolution 数据匹配服务 控制台，网址为[https://console.aws.amazon.com/entityresolution/](https://console.aws.amazon.com/entityresolution/)。

1. 在左侧导航窗格的 “**工作流程**” 下，选择 “**匹配**”。

1. 在**匹配工作流程**页面的右上角，选择**创建匹配工作流程**。

1. 对于 “**步骤 1：指定匹配的工作流程详细信息**”，请执行以下操作：

   1. 输入**匹配的工作流程名称**和可选的**描述**。

   1. 对于**数据输入 **AWS 区域****，选择**AWS Glue 数据库**、**AWS Glue 表**，然后选择相应的**架构映射**。

      您最多可以添加 20 个数据输入。

   1. 保持 “**标准化数据**” 选项处于选中状态，以便在匹配之前对数据输入（**Email Address**或**Phone number**）进行标准化。

      有关**Email Address**标准化的更多信息，请参阅 UID 2.0 文档中的[电子邮件地址标准化](https://unifiedid.com/docs/getting-started/gs-normalization-encoding#email-address-normalization)。

      有关**Phone number**标准化的更多信息，请参阅 UID 2.0 文档中的[电话号码标准化](https://unifiedid.com/docs/getting-started/gs-normalization-encoding#phone-number-normalization)。

   1. 要指定**服务访问**权限，请选择一个选项并采取建议的操作。    
[\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/zh_cn/entityresolution/latest/userguide/create-matching-workflow-provider.html)

   1. （可选）要为资源启用**标签**，请选择**添加新标签**，然后输入**密钥**和**值**对。

   1. 选择**下一步**。

1. 对于**步骤 2：选择匹配技术**：

   1. 在 “**匹配方法**” 中，选择 “**提供者服务**”。

   1. 对于**提供商服务**，请选择**统一 ID 2.0**。  
![\[选择了 Unified ID 提供商服务的提供商服务选项。\]](http://docs.aws.amazon.com/zh_cn/entityresolution/latest/userguide/images/choose-matching-method-uid.PNG)

   1. 选择**下一步**。

1. 对于**步骤 3：指定数据输出**：

   1. 对于**数据输出目标和格式**，选择数据输出的 **Amazon S3 位置**，以及**数据格式**是**标准化数据**还是**原始数据**。

   1. 对于**加密**，如果您选择**自定义加密设置**，请输入**AWS KMS 密钥** ARN。

   1. 查看 **Unified ID 2.0 生成的输出**。

      这是 UID 2.0 生成的所有其他信息的列表

   1. 对于**数据输出**，请决定要包含、隐藏或掩盖哪些字段，然后根据目标采取建议的操作。    
[\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/zh_cn/entityresolution/latest/userguide/create-matching-workflow-provider.html)

   1. 对于**系统生成的输出**，请查看包含的所有字段。

   1. 选择**下一步**。

1. 对于**步骤 4：查看并创建**：

   1. 查看您在之前的步骤中所做的选择，并在必要时进行编辑。

   1. 选择**创建并运行**。

      将出现一条消息，表示匹配的工作流程已创建且作业已启动。

1. 在匹配的工作流程详细信息页面的**指标**选项卡上，在 “**上次作业指标**” 下查看以下内容：
   + 作**业 ID**。
   + **匹配工作流作业的**状态**：已**排队**、进行**中**、**已完成、失**败** 
   + 工作流作业的**完成时间**。
   + 已**处理的记录**数。
   + **未处理的记录**数。
   + ** IDs 生成的唯一匹配项**。
   + **输入记录**的数量。

   您还可以查看任务**历史记录下先前运行过的匹配工作流程作业的作业**指标。

1. 匹配的工作流程任务完成（**状态**为**已完成**）后，您可以转到**数据输出**选项卡，然后选择您的 **Amazon S3 位置**以查看结果。

# 编辑匹配的工作流程
<a name="edit-matching-workflow"></a>

编辑匹配的工作流程使您可以保持实体解析流程 up-to-date并响应组织随着时间的推移而不断变化的需求。您可能需要调整匹配标准、技术或数据输出，以提高实体解析过程的准确性和效率。如果您发现当前工作流程的结果存在问题或错误，则对其进行编辑可以帮助您诊断和解决这些问题。

**要编辑匹配的工作流程，请执行以下操作：**

1. 登录 AWS 管理控制台 并打开 AWS Entity Resolution 数据匹配服务 控制台，网址为[https://console.aws.amazon.com/entityresolution/](https://console.aws.amazon.com/entityresolution/)。

1. 在左侧导航窗格的 “**工作流程**” 下，选择 “**匹配**”。

1. 选择匹配的工作流程。

1. 在匹配的工作流程详细信息页面的右上角，选择**编辑工作流程**。

1. 在 “**指定匹配的工作流程详细信息**” 页面上，进行任何必要的更改，然后选择 “**下一步**”。

1. **在 “选择匹配技术**” 页面上，进行必要的更改，然后选择 “**下一步**”。
**重要**  
您可以将**处理节奏**从 “**手动**” 更改为 “**自动**”，但在将其更改为 “**自动**” 之后，则无法将其更改回 “**手动**”。  
如果 “**处理节奏**” 已设置为 “**自动**”，则无法将其更改为 “**手动**”。

1. **在 “指定数据输出**” 页面上，进行任何必要的更改，然后选择 “**下一步**”。

1. 在 “**查看并保存**” 页面上，进行必要的更改，然后选择 “**保存**”。

# 删除匹配的工作流程
<a name="delete-matching-workflow"></a>

如果不再使用匹配的工作流程或已过时，删除它可以帮助您的工作空间保持井井有条和整洁。如果你开发了一个新的、经过改进的工作流程来取代旧的工作流程，那么删除旧的工作流程可以帮助确保你只使用最多的 up-to-date流程。

**要删除匹配的工作流程，请执行以下操作：**

1. 登录 AWS 管理控制台 并打开 AWS Entity Resolution 数据匹配服务 控制台，网址为[https://console.aws.amazon.com/entityresolution/](https://console.aws.amazon.com/entityresolution/)。

1. 在左侧导航窗格的 “**工作流程**” 下，选择 “**匹配**”。

1. 选择匹配的工作流程。

1. 在匹配的工作流程详细信息页面的右上角，选择**删除**。

1. 确认删除，然后选择**删除**。

# 为基于规则的匹配工作流程修改或生成匹配 ID
<a name="generate-match-id"></a>

*匹配 ID* 是在运行匹配工作流程后，由每个匹配的记录集生成 AWS Entity Resolution 数据匹配服务 并应用于这些记录集的标识符。这是输出中包含的匹配工作流程元数据的一部分。

当您需要更新现有客户的记录或向数据集中添加新客户时，可以使用 AWS Entity Resolution 数据匹配服务 控制台或 `GenerateMatchID` API。修改现有的匹配 ID 有助于在更新客户信息时保持一致性，而在向系统中添加以前未识别的客户时，则需要生成新的匹配 ID。

**注意**  
无论您使用控制台还是 API，都需要支付额外费用。您选择的处理类型会影响操作的准确性和响应时间。

**重要**  
如果您在任务进行期间撤消了对 S3 存储桶的 AWS Entity Resolution 数据匹配服务 权限，则仍 AWS Entity Resolution 数据匹配服务 会处理向 S3 输出结果并收取费用，但无法将结果传送到您的存储桶。为避免出现此问题，请确保在开始任务之前 AWS Entity Resolution 数据匹配服务 具有写入您的 S3 存储桶的正确权限。如果在处理过程中权限被撤销，则在您恢复正确的存储桶权限后，会在任务完成后最长 30 天内 AWS Entity Resolution 数据匹配服务 尝试重新交付结果。

以下步骤将指导您完成查找或生成匹配 ID、选择处理类型以及查看结果的过程。

------
#### [ Console ]

**使用控制台修改或生成匹配 ID**

1. 登录 AWS 管理控制台 并打开 AWS Entity Resolution 数据匹配服务 控制台，网址为[https://console.aws.amazon.com/entityresolution/](https://console.aws.amazon.com/entityresolution/)。

1. 在左侧导航窗格的 “**工作流程**” 下，选择 “**匹配**”。

1. 选择已处理的基于规则的匹配工作流（Job **状态为 “**已**完成**”）。

1. 在匹配的工作流程详细信息页面上，选择**匹配 IDs**选项卡。

1. 选择 “**修改” 或 “生成匹配 ID**”。
**注意**  
“**修改或生成匹配 ID**” 选项仅适用于使用**自动**处理节奏的匹配工作流程。如果您选择了**手动**处理节奏，则此选项将显示为非活动状态。要使用此选项，请编辑您的工作流程以使用**自动**处理节奏。有关编辑工作流程的更多信息，请参阅[编辑匹配的工作流程](edit-matching-workflow.md)。

1. **从下拉列表中选择表。AWS Glue **

   如果工作流程中只有一个 AWS Glue 表，则默认情况下会将其选中。

1. 选择**处理类型**。
   + **一致** — 您可以查找现有的匹配 ID 或立即生成并保存新的匹配 ID。此选项具有最高的精度和较慢的响应时间。
   + **背景**（如API `EVENTUAL` 所示）— 您可以查找现有的匹配ID或立即生成新的匹配ID。更新的记录保存在后台。此选项具有快速的初始响应，以后将在 S3 中提供完整的结果。
   + **快速生成 ID**（如API `EVENTUAL_NO_LOOKUP` 所示）— 您可以创建新的匹配ID，而无需查找现有匹配 ID。更新的记录保存在后台。此选项的响应速度最快。建议仅用于唯一记录。

1. 对于 **“记录” 属性**，

   1. 输入**唯一 ID** 的**值**。

   1. 根据工作流程中配置的规则，为每个**匹配键**输入一个**值**，该值将与现有记录相匹配。

1. 选择 “**查找匹配 ID” 并保存记录**。

   将显示一条成功消息，说明已找到匹配 ID 或生成了新的匹配 ID 并保存了记录。

1. 在成功消息中查看相应的匹配 ID 和保存到匹配工作流程的关联规则。

1. （可选）要复制匹配 ID，请选择 “**复制**”。

------
#### [ API ]

**使用 API 修改或生成匹配 ID**
**注意**  
[要成功调用此 API，您必须先使用该 API 成功运行基于规则的匹配工作流程。StartMatchingJob ](https://docs.aws.amazon.com/entityresolution/latest/apireference/API_StartMatchingJob.html)  
有关支持的编程语言的完整列表，请参阅 [GenerateMatchID](https://docs.aws.amazon.com/entityresolution/latest/apireference/API_GenerateMatchId.html) 的 “[另请参阅](https://docs.aws.amazon.com/entityresolution/latest/apireference/API_GenerateMatchId.html#API_GenerateMatchId_SeeAlso)” 部分。

1. 打开终端或命令提示符发出 API 请求。

1. 向以下端点创建 POST 请求：

   ```
   /matchingworkflows/workflowName/generateMatches
   ```

1. 在请求标头中，将内容类型设置为 application/json。

1. 在请求 URI 中，指定您的`workflowName`。

   必`workflowName`须：
   + 长度介于 1 到 255 个字符之间 
   + 匹配模式 [a-za-z\$10-9-] \$1

1. 对于请求正文，请提供以下 JSON：

   ```
   {
      "processingType": "string",
      "records": [ 
         { 
            "inputSourceARN": "string",
            "recordAttributeMap": { 
               "string" : "string" 
            },
            "uniqueId": "string"
         }
      ]
   }
   ```

   其中：
   + `processingType`（可选）-默认为`CONSISTENT`。选择以下值之一：
     + `CONSISTENT`-以较慢的响应时间获得最高的精度 
     + `EVENTUAL`-通过后台处理实现更快的初始响应 
     + `EVENTUAL_NO_LOOKUP`-当已知记录是唯一时，可实现最快的响应 
   + `records`（必填）-仅包含一个记录对象的数组

1. 发送 请求。

   如果成功，您将收到状态码 200 的响应和包含以下内容的 JSON 正文：

   ```
   {
      "failedRecords": [ 
         { 
            "errorMessage": "string",
            "inputSourceARN": "string",
            "uniqueId": "string"
         }
      ],
      "matchGroups": [ 
         { 
            "matchId": "string",
            "matchRule": "string",
            "records": [ 
               { 
                  "inputSourceARN": "string",
                  "recordId": "string"
               }
            ]
         }
      ]
   }
   ```

   如果呼叫失败，您可能会收到以下错误之一：
   + 403- AccessDeniedException 如果你没有足够的访问权限
   + 404- ResourceNotFoundException 如果找不到资源
   + 429- ThrottlingException 如果请求被限制
   + 400- ValidationException 如果输入未通过验证
   + 500- InternalServerException 如果内部服务出现故障

------

# 为基于规则的匹配工作流程查找匹配 ID
<a name="find-match-id"></a>

完成基于规则的匹配工作流程后，您可以检索每条已处理记录的匹配 ID 和关联规则。此信息可帮助您了解记录是如何匹配的，以及应用了哪些规则。以下过程演示如何使用 AWS Entity Resolution 数据匹配服务 控制台或 `GetMatchID` API 访问这些数据。

------
#### [ Console ]

**使用控制台查找比赛 ID**

1. 登录 AWS 管理控制台 并打开 AWS Entity Resolution 数据匹配服务 控制台，网址为[https://console.aws.amazon.com/entityresolution/](https://console.aws.amazon.com/entityresolution/)。

1. 在左侧导航窗格的 “**工作流程**” 下，选择 “**匹配**”。

1. 选择已处理的基于规则的匹配工作流（Job **状态为 “**已**完成**”）。

1. 在匹配的工作流程详细信息页面上，选择**匹配 IDs**选项卡。

1. 选择 “**查找匹配 ID**”。
**注意**  
“**查找匹配 ID**” 选项仅适用于使用**自动**处理节奏的匹配工作流程。如果您选择了**手动**处理节奏，则此选项将显示为非活动状态。要使用此选项，请编辑您的工作流程以使用**自动**处理节奏。有关编辑工作流程的更多信息，请参阅[编辑匹配的工作流程](edit-matching-workflow.md)。

1. 请执行以下操作之一：    
[\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/zh_cn/entityresolution/latest/userguide/find-match-id.html)

1. 在 **“记录属性”** 中，输入现有**匹配键**的**值**，以查找每条现有记录。
**提示**  
输入尽可能多的值以帮助找到匹配 ID。

1. 默认情况下，“**标准化数据**” 选项处于选中状态，以便在匹配之前对数据输入进行标准化。如果您不想对数据进行标准化处理，请取消选择 “**标准化**数据” 选项。

1. 如果要查看匹配规则，请展开**查看匹配规则**。

1. 选择**查找**。

   将显示一条成功消息，说明已找到匹配ID。

1. 查看相应的匹配 ID 和找到的关联规则。

------
#### [ API ]

**使用 API 查找匹配 ID**
**注意**  
[要成功调用此 API，您必须先使用该 API 成功运行基于规则的匹配工作流程。StartMatchingJob ](https://docs.aws.amazon.com/entityresolution/latest/apireference/API_StartMatchingJob.html)  
有关支持的编程语言的完整列表，请参阅 [GetMatchID API](https://docs.aws.amazon.com/entityresolution/latest/apireference/API_GetMatchId.html) 的 “[另](https://docs.aws.amazon.com/entityresolution/latest/apireference/API_GetMatchId.html#API_GetMatchId_SeeAlso)请参阅” 部分。

1. 打开终端或命令提示符发出 API 请求。

1. 向以下端点创建 POST 请求：

   ```
   /matchingworkflows/workflowName/matches
   ```

1. 在请求标头中，将内容类型设置为 application/json。

1. 在请求 URI 中，指定您的`workflowName`。

   必`workflowName`须：
   + 长度介于 1 到 255 个字符之间 
   + 匹配模式 [a-za-z\$10-9-] \$1

1. 对于请求正文，请提供以下 JSON：

   ```
   {
      "applyNormalization": boolean,
      "record": { 
         "string" : "string" 
      }
   }
   ```

   其中：

   `applyNormalization`（可选）-设置为`true`以标准化架构中定义的属性 

   `record`（必填）-要获取匹配 ID 的记录

1. 发送 请求。

   如果成功，您将收到状态码 200 的响应和包含以下内容的 JSON 正文：

   ```
   {
      "matchId": "string",
      "matchRule": "string"
   }
   ```

   `matchId`是这组匹配记录的唯一标识符，它`matchRule`表示该记录与哪条规则匹配。

   如果呼叫失败，您可能会收到以下错误之一：
   + 403- AccessDeniedException 如果你没有足够的访问权限
   + 404- ResourceNotFoundException 如果找不到资源
   + 429- ThrottlingException 如果请求被限制
   + 400- ValidationException 如果输入未通过验证
   + 500- InternalServerException 如果内部服务出现故障

------

# 从基于规则或基于 ML 的匹配工作流程中删除记录
<a name="delete-records"></a>

如果您需要遵守数据管理法规，则可以从基于规则或基于机器学习的匹配工作流程中删除记录。

**从基于规则或基于 ML 的匹配工作流程中删除记录**

1. 登录 AWS 管理控制台 并打开 AWS Entity Resolution 数据匹配服务 控制台，网址为[https://console.aws.amazon.com/entityresolution/](https://console.aws.amazon.com/entityresolution/)。

1. 在左侧导航窗格的 “**工作流程**” 下，选择 “**匹配**”。

1. 选择基于规则或基于 ML 的匹配工作流程。

1. 在匹配的工作流程详细信息页面上， IDs从 “**操作**” 下拉列表中选择 “**删除唯一**”。

1. 在 “唯一” IDs 部分输入要删除的**唯一** ID。

   您最多可以输入 10 个独一无二的 IDs。

1. 指定要从中删除唯一值的**输入源** IDs。

   如果工作流程只有一个**输入源**，则默认情况下会列出**输入源**。

   如果您只指定一个**输入源**，则其他输入源 IDs 中的唯一输入源不会受到影响。

1. 选择 “**删除唯一” IDs**。

# 匹配工作流程疑难解答
<a name="troubleshooting"></a>

使用以下信息来帮助您诊断和修复运行匹配工作流程时可能遇到的常见问题。

## 我在运行匹配的工作流程后收到了错误文件
<a name="troubleshooting_error_code_1"></a>

### 常见原因
<a name="troubleshooting_common_cause"></a>

匹配的工作流程可以有多次运行，结果（成功或错误）将写入名称`jobId`为的文件夹。

匹配工作流程的成功结果将写入包含多个文件的文件`success`夹，每个文件都包含成功记录的子集。

匹配工作流程的错误将写入包含多个字段`error`的文件夹，每个字段都包含错误记录的子集。

创建错误文件的原因如下：
+ [唯一 ID](glossary.md#unique-id-defn) 是：
  + null
  + 一行数据中缺失
  + 数据表中的一条记录中缺失
  + 在数据表的另一行数据中重复
  + 未指定
  + 在同一个来源中不是唯一的
  + 在多个来源中不是唯一的
  + 跨源重叠
  + 超过 38 个字符（仅限基于规则的匹配工作流程）
+ [架构映射](glossary.md#schema-mapping-definition)中的一个字段包含一个保留名称：
  + EmailAddress
  + InputSourceARN
  + MatchRule
  + matchID
  + HashingProtocol
  + ConfidenceLevel
  + 来源

**注意**  
如果错误文件中的记录是由于前面列出的原因而创建的，则需要向您收费，因为这会产生服务的处理成本。如果错误文件中的记录是由于内部服务器错误造成的，则无需向您收费。

### 解决方案
<a name="troubleshooting_resolution"></a>

**要解决此问题**

1. 检查[唯一 ID](glossary.md#unique-id-defn) 是否有效。

   如果[唯一 ID 无](glossary.md#unique-id-defn)效，请更新数据表中的唯一 ID，保存新的数据表，创建新的架构映射，然后再次运行匹配的工作流程。

1. 检查[架构映射](glossary.md#schema-mapping-definition)中的一个字段是否包含保留名称。

   如果其中一个字段包含保留名称，请使用新名称创建新的架构映射，然后再次运行匹配的工作流程。