

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

# Criação de um fluxo de trabalho de correspondência baseado em aprendizado de máquina
<a name="create-matching-workflow-ml"></a>

A *[correspondência baseada em aprendizado de máquina](glossary.md#ml-matching-defn)* é um processo predefinido que tenta combinar registros em todos os dados que você insere. O fluxo de trabalho de correspondência baseado em aprendizado de máquina permite comparar dados de texto não criptografado para encontrar uma ampla variedade de correspondências usando um modelo de aprendizado de máquina.

**nota**  
O modelo de aprendizado de máquina não suporta a comparação de dados com hash.

Quando AWS Entity Resolution encontra uma correspondência entre dois ou mais registros em seus dados, ele atribui:
+ Um [ID de correspondência](glossary.md#match-id-defin) para os registros no conjunto de dados correspondente
+ A porcentagem do [nível de confiança](glossary.md#confidence-level-defn) da partida.

Você pode usar a saída de um fluxo de trabalho de correspondência baseado em ML como entrada para a correspondência de provedores de serviços de dados ou vice-versa para atingir suas metas específicas. Por exemplo, você pode executar uma correspondência baseada em ML para encontrar correspondências em suas fontes de dados em seus próprios registros primeiro. Se um subconjunto não corresponder, você poderá executar a [correspondência baseada no serviço do provedor para encontrar correspondências](create-matching-workflow-provider.md) adicionais.

**Pré-requisitos**

Antes de criar um fluxo de trabalho de correspondência baseado em ML, você deve:

1. Crie um mapeamento de esquema. Para obter mais informações, consulte [Criação de um mapeamento de esquema](create-schema-mapping.md).

1. Se estiver usando o Amazon Connect Customer Profiles como seu destino de saída, certifique-se de ter as permissões apropriadas configuradas.

**Para criar um fluxo de trabalho de correspondência baseado em ML:**

1. Faça login no Console de gerenciamento da AWS e abra o AWS Entity Resolution console em [https://console.aws.amazon.com/entityresolution/](https://console.aws.amazon.com/entityresolution/).

1. **No painel de navegação esquerdo, em **Fluxos de trabalho**, escolha Correspondência.**

1. Na página **Fluxos de trabalho correspondentes**, no canto superior direito, escolha **Criar fluxo de trabalho correspondente**.

1. Para a **Etapa 1: Especificar os detalhes correspondentes do fluxo** de trabalho, faça o seguinte: 

   1. Insira um **nome de fluxo de trabalho correspondente** e uma **Descrição** opcional.

   1. Em **Entrada de dados**, escolha um **AWS Glue banco de dados **Região da AWS****, a **AWS Glue tabela** e, em seguida, o **mapeamento do esquema** correspondente.

      Você pode adicionar até 20 entradas de dados.

   1. A opção **Normalizar dados** é selecionada por padrão, para que as entradas de dados sejam normalizadas antes da correspondência. Se você não quiser normalizar os dados, desmarque a opção **Normalizar** dados.

      A correspondência baseada em aprendizado de máquina apenas normaliza[Nome](glossary.md#normalization-ML-defn-name), e. [Telefone](glossary.md#normalization-ML-defn-phone) [E-mail](glossary.md#normalization-ML-defn-email)

   1. Para especificar as permissões **de acesso ao serviço**, escolha uma opção e execute a ação recomendada.    
[\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/pt_br/entityresolution/latest/userguide/create-matching-workflow-ml.html)

   1. (Opcional) Para ativar **tags** para o recurso, escolha **Adicionar nova tag** e insira o par de **chave** e **valor**.

   1. Escolha **Próximo**.

1. Para a **Etapa 2: Escolha a técnica de correspondência**:

   1. Em **Método de correspondência**, escolha **Correspondência baseada em aprendizado de máquina**.  
![\[AWS Entity Resolution interface de criação de fluxo de trabalho correspondente com opções para correspondência baseada em regras ou de aprendizado de máquina.\]](http://docs.aws.amazon.com/pt_br/entityresolution/latest/userguide/images/choose-matching-method-machine-learning.PNG)

   1. Em **Cadência de processamento**, a opção **Manual** é selecionada.

      Essa opção permite que você execute um fluxo de trabalho sob demanda para uma atualização em massa.
**nota**  
O processamento automático (incremental) não é suportado para fluxos de trabalho de correspondência baseados em aprendizado de máquina.

   1. Escolha **Próximo**.

1. Para a **Etapa 3: Especifique a saída e o formato dos dados**:

   1. **Em **Destino e formato de saída de dados**, escolha a **localização do Amazon S3** para a saída de dados e se o **formato dos dados** será dados **normalizados ou dados originais**.**

   1. Em **Criptografia**, se você optar por **Personalizar as configurações de criptografia**, insira o ARN da **AWS KMS chave**.

   1. Visualize a **saída gerada pelo sistema**.

   1. Para **Saída de dados**, decida quais campos você deseja incluir, ocultar ou mascarar e, em seguida, execute as ações recomendadas com base em suas metas.     
[\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/pt_br/entityresolution/latest/userguide/create-matching-workflow-ml.html)

   1. Escolha **Próximo**.

1. Para a **Etapa 4: Revise e crie**:

   1. Revise as seleções feitas nas etapas anteriores e edite, se necessário.

   1. Escolha **Criar e executar**.

      Uma mensagem aparece indicando que o fluxo de trabalho correspondente foi criado e que o trabalho foi iniciado.

1. Na página de detalhes do fluxo de trabalho correspondente, na guia **Métricas**, veja o seguinte em **Métricas do último trabalho**:
   + O **Job ID**. 
   + **O **status** da tarefa de fluxo de trabalho correspondente: Em **fila**, **em andamento**, **concluída**, com falha** 
   + O **tempo concluído** para o trabalho do fluxo de trabalho.
   + O número de **registros processados**. 
   + O número de **registros não processados**. 
   + A **partida única IDs gerada**.
   + O número de **registros de entrada**.

   Você também pode visualizar as métricas de trabalho para trabalhos de fluxo de trabalho correspondentes que foram executados anteriormente no **Histórico de trabalhos**.

1. Após a conclusão do trabalho de fluxo de trabalho correspondente (o **status** é **concluído**), você pode acessar a guia **Saída de dados** e selecionar sua localização no **Amazon S3** para visualizar os resultados.

1. (Somente tipo de processamento **manual**) Se você criou um fluxo de trabalho de **correspondência baseado em aprendizado de máquina** com o tipo de processamento **Manual**, você pode executar o fluxo de trabalho correspondente a qualquer momento escolhendo **Executar fluxo de trabalho na página de detalhes do fluxo** de trabalho correspondente.