

本文為英文版的機器翻譯版本，如內容有任何歧義或不一致之處，概以英文版為準。

# 建立結構描述映射
<a name="create-schema-mapping"></a>

此程序說明使用 [AWS Entity Resolution 主控台](https://console.aws.amazon.com/entityresolution/home)建立結構描述映射的程序。

建立結構描述映射的方法有三種：
+ 使用**從 匯入 AWS Glue**選項匯入現有輸入資料 – 使用此建立方法，透過引導流程，從 AWS Glue 資料表中預先填入的資料欄開始定義輸入欄位。
+ 使用**建置自訂結構描述**選項手動定義輸入資料 – 使用此建立方法來使用引導流程手動定義輸入欄位。
+ 使用**使用 JSON 編輯器**選項手動建立 - 使用 JSON 編輯器手動建立、使用範例或匯入現有的輸入資料。
**注意**  
**唯一 ID** 和**輸入欄位**不適用於此選項。

------
#### [ Import from AWS Glue ]

**從 匯入現有的輸入資料以建立結構描述映射 AWS Glue**

1. 登入 AWS 管理主控台 並在 https：//[https://console.aws.amazon.com/entityresolution/](https://console.aws.amazon.com/entityresolution/) 開啟 AWS Entity Resolution 主控台。

1. 在左側導覽窗格中的資料**準備**下，選擇**結構描述映射**。

1. 在**結構描述映射**頁面的右上角，選擇**建立結構描述映射**。

1. 針對**步驟 1：指定結構描述詳細資訊**，執行下列動作：

   1. 針對**名稱和建立方法**，輸入**結構描述映射名稱**和選用**的描述**。

   1. 針對**建立方法**，選擇**從 匯入 AWS Glue**。

   1. 選擇 **AWS 區域**。

   1. 選擇**AWS Glue 資料庫**。

   1. 選擇 **AWS Glue 資料表**。

      若要建立新的資料表，請前往 AWS Glue 主控台 https：//[https://console.aws.amazon.com/glue/](https://console.aws.amazon.com/glue/)。如需詳細資訊，請參閱*AWS Glue 《 使用者指南*》中的[AWS Glue 資料表](https://docs.aws.amazon.com/glue/latest/dg/tables-described.html)。

   1. 針對**唯一 ID**，指定可明確參考資料每一列的資料欄。  
**Example**  

      例如，**Primary\$1key**、**Row\$1ID** 或 **Record\$1ID**。
**注意**  
**唯一 ID** 欄為必要欄位。**唯一 ID** 必須是單一資料表內的唯一識別符。不過，在不同資料表中，**唯一 ID** 可以有重複的值。如果未指定**唯一 ID**、在相同來源中不是唯一的，或在跨來源的屬性名稱上重疊，則 會在執行相符的工作流程時 AWS Entity Resolution 拒絕記錄。如果您在規則型比對工作流程中使用此結構描述映射，則**唯一 ID** 不得超過 38 個字元。

   1. 針對**輸入欄位**，選擇您要用於比對的資料欄，以及選擇性傳遞的資料欄。

      您可以為相符和通過選擇總計最多 34 個資料欄。

      1. 在**相符**項下，選擇要用作相符項輸入欄位的資料欄。

         您最多可以選擇總計 24 個資料欄進行比對。

      1. 如果您想要指定不用於比對**的資料欄，請選取新增資料欄以進行傳遞**。

      1. （選用） 在**傳遞**下，選擇要包含為傳遞資料欄的資料欄。
**注意**  
執行以機器學習為基礎的比對工作流程時，請勿使用下列任何預留名稱做為資料欄名稱："`MatchId`"、"`MatchRule`"、`RecordId`"、`SourceId`"、" 和 `TargetId`"。使用這些預留名稱將導致命名衝突和 ML 型相符工作流程失敗。

   1. （選用） 如果您想要為資源啟用**標籤**，請選擇**新增標籤**，然後輸入**金鑰**和**值**對。

   1. 選擇**下一步**。

1. 對於**步驟 2：映射輸入欄位**，定義您要用於比對和選用傳遞的輸入欄位。

   1. 對於**相符的輸入欄位**，對於每個**輸入欄位**，
      + 指定**屬性類型**來分類資料。
      + 指定**相符金鑰名稱**，以啟用與相符工作流程的輸入欄位比較。根據預設，某些相符金鑰名稱會自動與特定屬性類型建立關聯。
      + 如果該輸入欄位的資料欄值為雜湊，請選取**雜湊**核取方塊，如果值為純文字，則將核取方塊保留空白。
**注意**  
如果您要建立結構描述映射以搭配 LiveRamp 提供者服務型比對技術使用，則可以：  
將提供者 ID 的**屬性類型**指定為 **LiveRamp ID**。
將**名稱**欄位的**屬性類型**指定為多個欄位 （例如**名字**、**姓氏**) 或在一個欄位中。
將**街道地址**欄位的**屬性類型**指定為多個欄位 （例如**街道地址 1**、**街道地址 2**、) 或一個欄位 (**完整地址**)。  
如果與地址相符，則需要郵遞區號 **（郵遞區號**)。
如果您使用名稱包含電子郵件 (**電子郵件地址**) 或電話 (**電話號碼**)，這些欄位可以比對街道地址。
**注意**  
如果您要建立結構描述映射以搭配 TransUnion 提供者服務型比對技術使用，則可以指定下列任一**屬性類型**：  
**全名**、**名字**、**姓氏**
**完整地址**、**街道地址 1**、**城市**、**州**、**國家**、**郵遞區號**
**電話號碼**
**電子郵件地址**
**日期**
**數位識別符**：**IPV4**、**IPV6** 或 **MAID**
**注意**  
如果您要建立結構描述映射以搭配機器學習型比對工作流程使用，您的資料集必須至少包含下列其中一種**屬性類型**：  
**全名**
**完整地址**
**完整電話**
**電子郵件地址**
**** 具有**相符金鑰名稱****的出生日期**
請勿將任何這些屬性的屬性**類型**指定為**自訂字串**。

   1. （選用） 對於**傳遞的輸入欄位**，新增不相符的輸入欄位及其對應的**雜湊狀態**。

      **雜湊狀態**指出該輸入欄位的資料欄值是雜湊還是純文字。

   1. 選擇**下一步**。

1. 對於**步驟 3：群組資料**，如果**名稱**、**地址**和**電話號碼**輸入欄位已分成多個欄位，則可以將其分組。

   此步驟會將相關的輸入欄位串連成一個欄位，可讓您在相符的工作流程中將這些欄位做為一個欄位進行比較。

   如果您沒有任何資料映射到**名稱**、**地址**或**電話號碼**輸入欄位，則此區段將為空白。

   如果您有更多類型的資料，也可以新增更多群組。

   1. 如果您想要將**名稱**輸入資料分組：

      針對**全名**，選擇您要分組的兩個或多個**輸入欄位**。

      **群組名稱**和**相符金鑰**會自動與 資料類型建立關聯。

      您可以使用自訂相符**金鑰**更新**群組名稱**和相符金鑰，最多可包含 255 個字元，包括字母、數字、底線 (\$1) 或連字號 (-)。

      選擇**新增群組**以新增另一個群組。
**注意**  
只有**全名**才支援標準化。  
如果您想要標準化**全名**子類型，請將下列子類型指派給**全名**群組：**名字**、**中間名**和**姓氏**。

   1. 如果您想要將**地址**輸入資料分組：

      針對**完整地址**，選擇您要分組的兩個或多個**輸入欄位**。

      **群組名稱**和**相符金鑰**。 會自動與 資料類型建立關聯。

      您可以使用自訂相符**金鑰**更新**群組名稱**和相符金鑰，最多可包含 255 個字元，包括字母、數字、底線 (\$1) 或連字號 (-)。

      選擇**新增群組**以新增另一個群組。
**注意**  
只有**完整地址**才支援標準化。  
如果您想要標準化**完整地址**子類型，請將下列子類型指派給**完整地址**群組：**街道地址 1**、**街道地址 2**：**街道地址 3 名稱**、**城市名稱**、**州**、**國家**/地區和**郵遞區號**。

   1. 如果您想要將**電話**輸入資料分組：

      針對**完整電話**，選擇您要分組的兩個或多個**輸入欄位**。

      **群組名稱**和**相符金鑰**。 會自動與 資料類型建立關聯。

      您可以使用自訂相符**金鑰**更新**群組名稱**和相符金鑰，最多可包含 255 個字元，包括字母、數字、底線 (\$1) 或連字號 (-)。

      選擇**新增群組**以新增另一個群組。
**注意**  
只有**完整電話**才支援標準化。  
如果您想要標準化**完整電話**子類型，請將下列子類型指派給**完整電話**群組：**電話號碼**和**電話國家/地區代碼**。

   1. 選擇**下一步**。

1. 針對**步驟 4：檢閱和建立**，執行下列動作：

   1. 檢閱您針對先前步驟所做的選擇，並視需要編輯。

   1. 選擇**建立結構描述映射**。
**注意**  
在將結構描述映射與工作流程建立關聯之後，您無法修改結構描述映射。如果您想要使用現有組態建立新的結構描述映射，您可以複製結構描述映射。

建立結構描述映射之後，您就可以[建立相符的工作流程](create-matching-workflow.md)或[建立 ID 命名空間](id-namespace.md)。

------
#### [ Build custom schema ]

**使用**建置自訂結構描述選項建立結構描述**映射**

1. 登入 AWS 管理主控台 ，並在 https：//[https://console.aws.amazon.com/entityresolution/](https://console.aws.amazon.com/entityresolution/) 開啟 AWS Entity Resolution 主控台。

1. 在左側導覽窗格中的資料**準備**下，選擇**結構描述映射**。

1. 在**結構描述映射**頁面的右上角，選擇**建立結構描述映射**。

1. 對於**步驟 1：指定結構描述詳細資訊**，請執行下列動作：

   1. 針對名稱和建立方法，輸入**結構描述映射名稱**和選用的**描述**。

   1. 針對**建立方法**，選擇**建置自訂結構描述**。

   1. 針對**唯一 ID**，輸入唯一 ID 來識別資料的每一列。  
**Example**  

      例如，**Primary\$1key**、**Row\$1ID** 或 **Record\$1ID**。
**注意**  
**唯一 ID** 欄為必要欄位。**唯一 ID** 必須是單一資料表內的唯一識別符。不過，在不同資料表中，**唯一 ID** 可以有重複的值。如果未指定**唯一 ID**、在相同來源中不是唯一的，或在跨來源的屬性名稱上重疊，則 會在執行相符工作流程時 AWS Entity Resolution 拒絕記錄。如果您在規則型比對工作流程中使用此結構描述映射，則**唯一 ID** 不得超過 38 個字元。

   1. （選用） 如果您想要為資源啟用**標籤**，請選擇**新增標籤**，然後輸入**金鑰**和**值**對。

   1. 選擇**下一步**。

1. 對於**步驟 2：映射輸入欄位**，定義您要用於比對和選用傳遞的輸入欄位。

   您可以為相符和通過定義最多總共 34 個資料欄。

   1. 針對**相符的輸入欄位**，輸入**欄位**。
**注意**  
執行以機器學習為基礎的比對工作流程時，請勿使用下列任何預留名稱做為資料欄名稱："`MatchId`"、"`MatchRule`"、`RecordId`"、`SourceId`"、" 和 `TargetId`"。使用這些預留名稱將導致命名衝突和 ML 型相符工作流程失敗。

   1. 選取**屬性類型**來分類資料。
**注意**  
如果您要建立結構描述映射以搭配 [LiveRamp 提供者服務型比對技術](create-matching-workflow-provider.md#create-mw-liveramp)使用，則可以將 providerID **屬性類型**指定為 **LiveRamp ID**。如果您想要在輸出中包含 PII 資料，則必須將**屬性類型**指定為**自訂字串**。
**注意**  
如果您要建立結構描述映射以搭配 TransUnion 提供者服務型比對技術使用，則可以指定下列任一**屬性類型**：  
**全名**、**名字**、**姓氏**
**完整地址**、**街道地址 1**、**城市**、**州**、**國家**、**郵遞區號**
**電話號碼**
**電子郵件地址**
**日期**
**數位識別符**：**IPV4**、**IPV6** 或 **MAID**
**注意**  
如果您要建立結構描述映射以搭配[機器學習型比對工作流程](create-matching-workflow-ml.md)使用，您的資料集必須至少包含下列其中一種**屬性類型**：  
**全名**
**完整地址**
**完整電話**
**電子郵件地址**
**** 具有**相符金鑰名稱**的**出生日期的日期**
請勿將任何這些屬性的**屬性類型**指定為**自訂字串**。

   1. 選取**相符金鑰名稱**，以啟用與相符工作流程的輸入欄位比較。

      根據預設，某些相符金鑰名稱會自動與特定屬性類型建立關聯。

   1. 如果該輸入欄位的資料欄值為雜湊，請選取**雜湊**核取方塊，如果值為純文字，則將核取方塊保留空白。

   1. 選擇**新增輸入欄位**以新增更多輸入欄位。

      您最多可以新增總計 24 個輸入欄位以進行比對。

   1. （選用） 對於**傳遞的輸入欄位**，新增不相符的輸入欄位及其對應的**雜湊狀態**。

   1. 選擇**下一步**。

1. 對於**步驟 3：群組資料**，如果已將**名稱**、**地址**、**電話號碼**輸入欄位分成多個欄位，則可以將其分組。

   此步驟會將相關的輸入欄位串連成一個欄位，可讓您在相符的工作流程中將這些欄位做為一個欄位進行比較。

   如果您沒有任何資料對應至**名稱**、**地址**、**電話號碼**輸入欄位，則此區段將為空白。

   如果您有更多類型的資料，也可以新增更多群組。

   1. 如果您想要將**名稱**輸入資料分組：

      針對**全名**，選擇您要分組的兩個或多個**輸入欄位**。

      **群組名稱**和**相符金鑰**會自動與 資料類型建立關聯。

      您可以使用自訂相符**金鑰**更新**群組名稱**和相符金鑰，最多可包含 255 個字元，包括字母、數字、底線 (\$1) 或連字號 (-)。

      選擇**新增群組**以新增另一個群組。
**注意**  
只有**全名**才支援標準化。  
如果您想要標準化**全名**子類型，請將下列子類型指派給**全名**群組：**名字**、**中間名**和**姓氏**。

   1. 如果您想要將**地址**輸入資料分組：

      針對**完整地址**，選擇您要分組的兩個或多個**輸入欄位**。

      **群組名稱**和**相符金鑰**。 會自動與 資料類型建立關聯。

      您可以使用自訂相符**金鑰**更新**群組名稱**和相符金鑰，最多可包含 255 個字元，包括字母、數字、底線 (\$1) 或連字號 (-)。

      選擇**新增群組**以新增另一個群組。
**注意**  
只有**完整地址**才支援標準化。  
如果您想要標準化**完整地址**子類型，請將下列子類型指派給**完整地址**群組：**街道地址 1**、**街道地址 2**：**街道地址 3 名稱**、**城市名稱**、**州**、**國家**/地區和**郵遞區號**。

   1. 如果您想要將**電話**輸入資料分組：

      針對**完整電話**，選擇您要分組的兩個或多個**輸入欄位**。

      **群組名稱**和**相符金鑰**。 會自動與 資料類型建立關聯。

      您可以使用自訂相符**金鑰**更新**群組名稱**和相符金鑰，最多可包含 255 個字元，包括字母、數字、底線 (\$1) 或連字號 (-)。

      選擇**新增群組**以新增另一個群組。
**注意**  
只有**完整電話**才支援標準化。  
如果您想要標準化**完整電話**子類型，請將下列子類型指派給**完整電話**群組：**電話號碼**和**電話國家/地區代碼**。

   1. 選擇**下一步**。

1. 針對**步驟 4：檢閱和建立**，執行下列動作：

   1. 檢閱您針對先前步驟所做的選擇，並視需要編輯。

   1. 選擇**建立結構描述映射**。
**注意**  
在將結構描述映射與工作流程建立關聯之後，您無法修改結構描述映射。如果您想要使用現有組態建立新的結構描述映射，您可以複製結構描述映射。

建立結構描述映射之後，您就可以[建立相符的工作流程](create-matching-workflow.md)或[建立 ID 命名空間](id-namespace.md)。

------
#### [ Use JSON editor ]

**使用 JSON 編輯器建立結構描述映射**

1. 登入 AWS 管理主控台 ，並在 https：//[https://console.aws.amazon.com/entityresolution/](https://console.aws.amazon.com/entityresolution/) 開啟 AWS Entity Resolution 主控台。

1. 在左側導覽窗格中的資料**準備**下，選擇**結構描述映射**。

1. 在**結構描述映射**頁面的右上角，選擇**建立結構描述映射**。

1. 對於**步驟 1：指定結構描述詳細資訊**，請執行下列動作：

   1. 針對名稱和建立方法，輸入**結構描述映射名稱**和選用的**描述**。

   1. 針對**建立方法**，選擇**使用 JSON 編輯器**。

   1. （選用） 如果您想要為資源啟用**標籤**，請選擇**新增標籤**，然後輸入**金鑰**和**值**對。

   1. 選擇**下一步**。

1. 對於**步驟 2：指定映射**：

   1. 在 JSON 編輯器中開始建置結構描述，或根據您的目標選擇下列其中一個選項：    
[\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/zh_tw/entityresolution/latest/userguide/create-schema-mapping.html)
**注意**  
只有下列**類型**支援標準化：`NAME`、`PHONE`、 `ADDRESS`和 `EMAIL_ADRESS`。  
如果您想要標準化`NAME`子類型，請將下列子類型指派給 `NAME` **groupName**：`NAME_FIRST`、 `NAME_MIDDLE`和 `NAME_LAST`  
如果您想要標準化`ADDRESS`子類型，請將下列子類型指派給 `ADDRESS` **groupName**：`ADDRESS_STREET1`、、`ADDRESS_STREET2``ADDRESS_STREET3`、`ADDRESS_CITY``ADDRESS_STATE`、、 `ADDRESS_COUNTRY`和 `ADDRESS_POSTALCODE`。  
如果您想要標準化`PHONE`子類型，請將下列子類型指派給 `PHONE` **groupName**： `PHONE_NUMBER`和 `PHONE_COUNTRYCODE`。

   1. 選擇**下一步**。

1. 針對**步驟 3：檢閱並建立**：

   1. 檢閱您針對先前步驟所做的選擇，並視需要編輯。

   1. 選擇**建立結構描述映射**。
**注意**  
在將結構描述映射與工作流程建立關聯之後，您無法修改結構描述映射。如果您想要使用現有組態建立新的結構描述映射，您可以複製結構描述映射。

建立結構描述映射之後，您就可以[建立相符的工作流程](create-matching-workflow.md)或[建立 ID 命名空間](id-namespace.md)。

------