

本文為英文版的機器翻譯版本，如內容有任何歧義或不一致之處，概以英文版為準。

# 建立以機器學習為基礎的比對工作流程
<a name="create-matching-workflow-ml"></a>

*[機器學習型比對](glossary.md#ml-matching-defn)*是一種預設程序，會嘗試比對您輸入所有資料的記錄。機器學習型比對工作流程可讓您比較純文字資料，以使用機器學習模型尋找廣泛的比對。

**注意**  
機器學習模型不支援雜湊資料的比較。

當 AWS Entity Resolution 在資料中找到兩個或多個記錄之間的相符項目時，它會指派：
+ 與相符資料集中記錄相符的 [ID](glossary.md#match-id-defin) 
+ 配對[可信度層級](glossary.md#confidence-level-defn)百分比。

您可以使用 ML 型比對工作流程的輸出做為資料服務提供者比對的輸入，反之亦然，以符合您的特定目標。例如，您可以執行 ML 型比對，先在您自己的記錄上尋找跨資料來源的比對。如果子集不相符，您可以執行[提供者服務型比對](create-matching-workflow-provider.md)來尋找其他比對。

**先決條件**

建立 ML 型比對工作流程之前，您必須：

1. 建立結構描述映射。如需詳細資訊，請參閱[建立結構描述映射](create-schema-mapping.md)。

1. 如果使用 Amazon Connect Customer Profiles 做為輸出目的地，請確定您已設定適當的許可。

**若要建立 ML 型比對工作流程：**

1. 登入 AWS 管理主控台 ，並在 https：//[https://console.aws.amazon.com/entityresolution/](https://console.aws.amazon.com/entityresolution/) 開啟 AWS Entity Resolution 主控台。

1. 在左側導覽窗格中的**工作流程**下，選擇**相符**。

1. 在**相符工作流程**頁面上的右上角，選擇**建立相符工作流程**。

1. 對於**步驟 1：指定相符的工作流程詳細資訊**，請執行下列動作：

   1. 輸入**相符工作流程名稱**和選用**的描述**。

   1. 針對**資料輸入**，選擇 **AWS 區域**、**AWS Glue 資料庫**、**AWS Glue 資料表**，然後選擇對應的**結構描述映射**。

      您最多可以新增 20 個資料輸入。

   1. 預設會選取**標準化資料**選項，以便在比對之前標準化資料輸入。如果您不想標準化資料，請取消選取**標準化資料**選項。

      以機器學習為基礎的比對只會標準化 [名稱](glossary.md#normalization-ML-defn-name)、 [Phone](glossary.md#normalization-ML-defn-phone)和 [Email](glossary.md#normalization-ML-defn-email)。

   1. 若要指定**服務存取**許可，請選擇 選項並採取建議的動作。    
[\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/zh_tw/entityresolution/latest/userguide/create-matching-workflow-ml.html)

   1. （選用） 若要為資源啟用**標籤**，請選擇**新增標籤**，然後輸入**金鑰**和**值**對。

   1. 選擇**下一步**。

1. 針對**步驟 2：選擇相符的技術**：

   1. 針對**比對方法**，選擇**以機器學習為基礎的比對**。  
![\[AWS Entity Resolution 搭配規則型或機器學習比對選項的相符工作流程建立界面。\]](http://docs.aws.amazon.com/zh_tw/entityresolution/latest/userguide/images/choose-matching-method-machine-learning.PNG)

   1. 對於**處理節奏**，會選取**手動**選項。

      此選項可讓您隨需執行工作流程以進行大量更新。
**注意**  
機器學習型比對工作流程不支援自動 （增量） 處理。

   1. 選擇**下一步**。

1. 針對**步驟 3：指定資料輸出和格式**：

   1. 針對**資料輸出目的地和格式**，選擇資料輸出的 **Amazon S3 位置**，以及**資料格式**是**標準化資料**還是**原始資料**。

   1. 對於**加密**，如果您選擇**自訂加密設定**，請輸入**AWS KMS 金鑰** ARN。

   1. 檢視**系統產生的輸出**。

   1. 對於**資料輸出**，決定您要包含、隱藏或遮罩哪些欄位，然後根據您的目標採取建議的動作。    
[\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/zh_tw/entityresolution/latest/userguide/create-matching-workflow-ml.html)

   1. 選擇**下一步**。

1. 針對**步驟 4：檢閱並建立**：

   1. 檢閱您針對先前步驟所做的選擇，並視需要編輯。

   1. 選擇 **Create and run (建立並執行)**。

      訊息隨即出現，指出已建立相符的工作流程，且任務已開始。

1. 在相符的工作流程詳細資訊頁面上的**指標**索引標籤上，檢視**最後一個任務指標**下的下列項目：
   + **任務 ID**。
   + 相符工作流程任務**的狀態**：**已佇列**、**進行中**、**已完成**、**失敗** 
   + 工作流程任務的**完成時間**。
   + **處理的記錄**數量。
   + **未處理的記錄**數目。
   + **產生的唯一比對 IDs**。
   + **輸入記錄**的數量。

   您也可以檢視先前已在任務**歷史記錄**下執行之相符工作流程任務的任務指標。

1. 比對工作流程任務完成後 (**狀態**為**已完成**)，您可以前往**資料輸出**索引標籤，然後選取您的 **Amazon S3 位置**以檢視結果。

1. （僅限**手動**處理類型） 如果您已使用**手動**處理類型建立**機器學習型相符**工作流程，您可以在相符工作流程詳細資訊頁面上選擇**執行工作流程**，隨時執行相符的工作流程。