Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

# Crear un flujo de trabajo de emparejamiento basado en el aprendizaje automático
<a name="create-matching-workflow-ml"></a>

La búsqueda de *[coincidencias basada en el aprendizaje automático](glossary.md#ml-matching-defn)* es un proceso preestablecido que intenta hacer coincidir los registros de todos los datos que ingresas. El flujo de trabajo de búsqueda de coincidencias basado en el aprendizaje automático le permite comparar datos de texto claro para encontrar una amplia gama de coincidencias mediante un modelo de aprendizaje automático.

**nota**  
El modelo de aprendizaje automático no admite la comparación de datos cifrados.

Cuando AWS Entity Resolution encuentra una coincidencia entre dos o más registros de sus datos, asigna:
+ Un [identificador de coincidencia](glossary.md#match-id-defin) para los registros del conjunto de datos coincidente
+ El porcentaje del [nivel de confianza de](glossary.md#confidence-level-defn) las coincidencias.

Puede utilizar el resultado de un flujo de trabajo de coincidencia basado en ML como entrada para la búsqueda de proveedores de servicios de datos, o viceversa, para cumplir sus objetivos específicos. Por ejemplo, puede ejecutar una búsqueda basada en ML para buscar primero coincidencias entre sus fuentes de datos en sus propios registros. Si un subconjunto no coincide, puede ejecutar la búsqueda de [coincidencias basada en los servicios del proveedor para buscar más coincidencias](create-matching-workflow-provider.md).

**Requisitos previos**

Antes de crear un flujo de trabajo coincidente basado en ML, debe:

1. Cree un mapeo de esquemas. Para obtener más información, consulte [Crear un esquema de mapeo](create-schema-mapping.md).

1. Si utiliza los perfiles de clientes de Amazon Connect como destino de salida, asegúrese de tener configurados los permisos adecuados.

**Para crear un flujo de trabajo coincidente basado en ML:**

1. Inicie sesión en Consola de administración de AWS y abra la AWS Entity Resolution consola en [https://console.aws.amazon.com/entityresolution/](https://console.aws.amazon.com/entityresolution/).

1. En el panel de navegación izquierdo, en **Flujos de trabajo**, selecciona **Matching**.

1. En la página **Flujos de trabajo coincidentes**, en la esquina superior derecha, selecciona **Crear flujo de trabajo coincidente**.

1. Para el **paso 1: especificar los detalles del flujo de trabajo coincidentes**, haga lo siguiente: 

   1. Introduzca un **nombre de flujo de trabajo coincidente** y una **descripción** opcional.

   1. Para la **entrada de datos**, elija una **AWS Glue base de datos **Región de AWS****, la **AWS Glue tabla** y, a continuación, el **mapeo de esquema** correspondiente.

      Puede añadir hasta 20 entradas de datos.

   1. La opción **Normalizar datos** está seleccionada de forma predeterminada, de modo que las entradas de datos se normalizan antes de que coincidan. Si no desea normalizar los datos, deseleccione la opción **Normalizar datos**.

      La coincidencia basada en el aprendizaje automático solo normaliza[Name](glossary.md#normalization-ML-defn-name), y. [Teléfono](glossary.md#normalization-ML-defn-phone) [Correo electrónico](glossary.md#normalization-ML-defn-email)

   1. Para especificar los permisos **de acceso al servicio**, elija una opción y tome las medidas recomendadas.    
[\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/es_es/entityresolution/latest/userguide/create-matching-workflow-ml.html)

   1. (Opcional) Para habilitar las **etiquetas** para el recurso, selecciona **Añadir nueva etiqueta** y, a continuación, introduce el par **clave** y **valor**.

   1. Elija **Siguiente**.

1. Para el **paso 2: elija una técnica de coincidencia**:

   1. Para el **método de emparejamiento**, elija el emparejamiento **basado en el aprendizaje automático**.  
![\[AWS Entity Resolution hacer coincidir la interfaz de creación de flujos de trabajo con opciones para la combinación basada en reglas o mediante aprendizaje automático.\]](http://docs.aws.amazon.com/es_es/entityresolution/latest/userguide/images/choose-matching-method-machine-learning.PNG)

   1. En **Cadencia de procesamiento**, se selecciona la opción **Manual**.

      Esta opción le permite ejecutar un flujo de trabajo bajo demanda para realizar una actualización masiva.
**nota**  
El procesamiento automático (incremental) no es compatible con los flujos de trabajo coincidentes basados en el aprendizaje automático.

   1. Elija **Siguiente**.

1. Para el **paso 3: especifique la salida y el formato de los datos**:

   1. En **Destino y formato de salida de datos**, elija la **ubicación de Amazon S3** para la salida de datos y si el **formato de datos** será Datos **normalizados o Datos** **originales**.

   1. Para el **cifrado**, si elige **personalizar la configuración de cifrado**, introduzca la **AWS KMS clave** ARN.

   1. Vea la **salida generada por el sistema**.

   1. En el caso de la **salida de datos**, decide qué campos quieres incluir, ocultar o enmascarar y, a continuación, realiza las acciones recomendadas en función de tus objetivos.     
[\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/es_es/entityresolution/latest/userguide/create-matching-workflow-ml.html)

   1. Elija **Siguiente**.

1. Para el **paso 4: Revisa y crea**:

   1. Revise las selecciones que realizó en los pasos anteriores y edítelas si es necesario.

   1. Elija **Create and run**.

      Aparece un mensaje que indica que se ha creado el flujo de trabajo correspondiente y que el trabajo ha comenzado.

1. En la página de detalles del flujo de trabajo coincidente, en la pestaña **Métricas**, consulta lo siguiente en **Métricas del último trabajo**:
   + El **identificador del trabajo**. 
   + **El **estado** del trabajo de flujo de trabajo coincidente: en **cola**, **en curso**, **completado, fallido**** 
   + El **tiempo de finalización** del trabajo de flujo de trabajo.
   + El número de **registros procesados**. 
   + El número de **registros no procesados**. 
   + La **coincidencia única IDs generada**.
   + El número de **registros de entrada**.

   También puede ver las métricas de trabajo para hacer coincidir los trabajos de flujo de trabajo que se han ejecutado anteriormente en el **historial de trabajos**.

1. Cuando se complete el trabajo del flujo de trabajo correspondiente (el **estado** es **Completado**), puede ir a la pestaña **Salida de datos** y, a continuación, seleccionar su **ubicación de Amazon S3** para ver los resultados.

1. (Solo tipo de procesamiento **manual**) Si ha creado un flujo de trabajo **coincidente basado en el aprendizaje automático** con el tipo de procesamiento **manual**, puede ejecutar el flujo de trabajo coincidente en cualquier momento seleccionando **Ejecutar flujo de trabajo en la página de detalles del flujo** de trabajo coincidente.