

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

# Création d'un flux de travail de correspondance basé sur le machine learning
<a name="create-matching-workflow-ml"></a>

La mise en *[correspondance basée sur l'apprentissage automatique](glossary.md#ml-matching-defn)* est un processus prédéfini qui tente de faire correspondre les enregistrements à toutes les données que vous saisissez. Le flux de travail de correspondance basé sur l'apprentissage automatique vous permet de comparer des données en texte clair pour trouver un large éventail de correspondances à l'aide d'un modèle d'apprentissage automatique.

**Note**  
Le modèle d'apprentissage automatique ne prend pas en charge la comparaison de données hachées.

Lorsqu'il Résolution des entités AWS trouve une correspondance entre deux ou plusieurs enregistrements de vos données, il attribue :
+ Un [identifiant de correspondance](glossary.md#match-id-defin) avec les enregistrements de l'ensemble de données correspondant
+ Le pourcentage du [niveau de confiance](glossary.md#confidence-level-defn) du match.

Vous pouvez utiliser le résultat d'un flux de travail de correspondance basé sur le ML comme entrée pour le rapprochement des fournisseurs de services de données, ou vice-versa pour atteindre vos objectifs spécifiques. Par exemple, vous pouvez exécuter une correspondance basée sur le ML pour trouver d'abord des correspondances entre vos sources de données sur vos propres enregistrements. Si un sous-ensemble n'a pas été mis en correspondance, vous pouvez ensuite exécuter une [correspondance basée sur le service du fournisseur](create-matching-workflow-provider.md) pour trouver des correspondances supplémentaires.

**Conditions préalables**

Avant de créer un flux de travail de correspondance basé sur le ML, vous devez :

1. Créez un mappage de schéma. Pour de plus amples informations, veuillez consulter [Création d'un mappage de schéma](create-schema-mapping.md).

1. Si vous utilisez les profils clients Amazon Connect comme destination de sortie, assurez-vous que les autorisations appropriées sont configurées.

**Pour créer un flux de travail de correspondance basé sur le ML :**

1. Connectez-vous à la Résolution des entités AWS console AWS Management Console et ouvrez-la à l'adresse [https://console.aws.amazon.com/entityresolution/](https://console.aws.amazon.com/entityresolution/).

1. Dans le volet de navigation de gauche, sous **Workflows**, choisissez **Matching**.

1. Sur la page **des flux de travail correspondants**, dans le coin supérieur droit, choisissez **Créer un flux de travail correspondant**.

1. Pour **l'étape 1 : Spécifier les détails du flux de travail correspondants**, procédez comme suit : 

   1. Entrez un **nom de flux de travail correspondant** et une **description** facultative.

   1. Pour la **saisie de données**, choisissez une **Région AWSAWS Glue ****base de données**, la **AWS Glue table**, puis le **mappage de schéma** correspondant.

      Vous pouvez ajouter jusqu'à 20 entrées de données.

   1. L'option **Normaliser les données** est sélectionnée par défaut afin que les entrées de données soient normalisées avant la mise en correspondance. Si vous ne souhaitez pas normaliser les données, désélectionnez l'option **Normaliser les données**.

      La correspondance basée sur l'apprentissage automatique ne fait que normaliser[Nom](glossary.md#normalization-ML-defn-name), [Téléphone](glossary.md#normalization-ML-defn-phone) et. [E-mail](glossary.md#normalization-ML-defn-email)

   1. Pour spécifier les autorisations **d'accès au service**, choisissez une option et prenez les mesures recommandées.    
[\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/fr_fr/entityresolution/latest/userguide/create-matching-workflow-ml.html)

   1. (Facultatif) Pour activer les **balises** pour la ressource, choisissez **Ajouter une nouvelle balise**, puis entrez la paire ****clé/valeur****.

   1. Choisissez **Suivant**.

1. Pour **l'étape 2 : Choisissez la technique de correspondance** :

   1. Pour la **méthode de correspondance**, choisissez la correspondance **basée sur l'apprentissage automatique**.  
![\[Résolution des entités AWS interface de création de flux de travail correspondante avec des options de correspondance basée sur des règles ou par apprentissage automatique.\]](http://docs.aws.amazon.com/fr_fr/entityresolution/latest/userguide/images/choose-matching-method-machine-learning.PNG)

   1. Pour **Processing cadence**, l'option **Manuel** est sélectionnée.

      Cette option vous permet d'exécuter un flux de travail à la demande pour une mise à jour groupée.
**Note**  
Le traitement automatique (incrémentiel) n'est pas pris en charge pour les flux de travail de correspondance basés sur l'apprentissage automatique.

   1. Choisissez **Suivant**.

1. Pour l'**étape 3 : Spécifier la sortie et le format des données** :

   1. Pour la **destination et le format de sortie des données**, choisissez l'**emplacement Amazon S3** pour la sortie des données et indiquez si le **format des données** sera des **données normalisées ou des données** **d'origine**.

   1. Pour **le chiffrement**, si vous choisissez de **personnaliser les paramètres de chiffrement**, entrez l'ARN de la **AWS KMS clé**.

   1. Affichez la **sortie générée par le système**.

   1. Pour la **sortie de données**, choisissez les champs que vous souhaitez inclure, masquer ou masquer, puis prenez les mesures recommandées en fonction de vos objectifs.     
[\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/fr_fr/entityresolution/latest/userguide/create-matching-workflow-ml.html)

   1. Choisissez **Suivant**.

1. Pour **l'étape 4 : révision et création** :

   1. Passez en revue les sélections que vous avez effectuées lors des étapes précédentes et modifiez-les si nécessaire.

   1. Choisissez **Créer et exécuter**.

      Un message apparaît, indiquant que le flux de travail correspondant a été créé et que le travail a commencé.

1. Sur la page des détails du flux de travail correspondant, sous l'onglet **Mesures**, consultez les informations suivantes sous **Dernières mesures de travail** :
   + Le **Job ID**. 
   + **État** **de la tâche de flux de travail correspondante : En **file d'attente**, **en cours**, **terminée**, échouée** 
   + **Durée d'exécution de** la tâche de flux de travail.
   + Le nombre d'**enregistrements traités**. 
   + Le nombre d'**enregistrements non traités**. 
   + La **correspondance unique IDs générée**.
   + Le nombre d'**enregistrements en entrée**.

   Vous pouvez également consulter les statistiques des tâches correspondant aux tâches de flux de travail précédemment exécutées dans l'**historique des tâches**.

1. Une fois la tâche de flux de travail correspondante **terminée (le **statut** est terminé**), vous pouvez accéder à l'onglet **Sortie de données**, puis sélectionner votre **site Amazon S3** pour afficher les résultats.

1. (Type de traitement **manuel** uniquement) Si vous avez créé un flux de travail de **correspondance basé sur le machine learning** avec le type de traitement **manuel**, vous pouvez exécuter le flux de travail correspondant à tout moment en choisissant **Exécuter le flux de travail** sur la page des détails du flux de travail correspondant.