Travailler avec AWS Clean Rooms ML - AWS Clean Rooms

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Travailler avec AWS Clean Rooms ML

Un modèle de similarité est un modèle de données d'un fournisseur de données de formation qui permet à un fournisseur de données de départ de créer un segment similaire des données du fournisseur de données de formation qui ressemble le plus à ses données de départ. Pour créer un modèle de similarité utilisable dans une collaboration, vous devez importer vos données de formation, créer un modèle de similarité, configurer ce modèle de similarité, puis l'associer à une collaboration.

Une fois que le fournisseur de données de formation a fini de créer le modèle ML, le fournisseur de données de départ peut créer et exporter le segment de départ.

Utilisation de modèles similaires (fournisseur de données de formation)

Importer des données d'entraînement

Avant de créer un modèle similaire, vous devez spécifier AWS Glue table contenant les données d'entraînement. Clean Rooms ML ne stocke pas de copie de ces données, mais uniquement des métadonnées qui lui permettent d'accéder aux données.

Pour importer des données d'entraînement dans AWS Clean Rooms
  1. Connectez-vous au AWS Management Console et ouvrez le AWS Clean Rooms console avec votre Compte AWS (si vous ne l'avez pas encore fait).

  2. Dans le volet de navigation de gauche, choisissez ML Modeling.

  3. Dans l'onglet Ensembles de données d'entraînement, choisissez Créer un jeu de données d'entraînement.

  4. Sur la page Créer un jeu de données d'entraînement, pour les détails du jeu de données d'entraînement, entrez un nom et une description facultative.

  5. Choisissez la source de données d'entraînement en sélectionnant la base de données et la table que vous souhaitez configurer dans les listes déroulantes.

    Note

    Pour vérifier que ce tableau est correct, effectuez l'une des opérations suivantes :

    • Choisissez Afficher dans AWS Glue.

    • Activez Afficher le schéma pour afficher le schéma.

  6. Pour les détails de la formation, choisissez la colonne Identifiant utilisateur, la colonne Identifiant de l'article et la colonne Horodatage dans les listes déroulantes. Les données d'entraînement doivent contenir ces trois colonnes. Vous pouvez également sélectionner les autres colonnes que vous souhaitez inclure dans les données d'entraînement.

    Les données de la colonne Horodatage doivent être au format Unix Epoch en secondes.

  7. (Facultatif) Si vous avez des colonnes supplémentaires à entraîner, choisissez le nom et le type de colonne dans les listes déroulantes.

  8. Dans Accès aux services, vous devez spécifier un rôle de service qui peut accéder à vos données et fournir une KMS clé si celles-ci sont cryptées. Choisissez Créer et utiliser un nouveau rôle de service et Clean Rooms ML créera automatiquement un rôle de service et ajoutera la politique d'autorisation nécessaire. Choisissez Utiliser un rôle de service existant et saisissez-le dans le champ Nom du rôle de service si vous souhaitez utiliser un rôle de service spécifique.

    Si vos données sont cryptées, entrez votre KMS clé dans le AWS KMS keychamp, ou cliquez sur Créer un AWS KMS keypour générer une nouvelle KMS clé.

  9. Si vous souhaitez activer les balises pour le jeu de données d'entraînement, choisissez Ajouter une nouvelle balise, puis entrez la paire clé/valeur.

  10. Choisissez Créer un jeu de données d'entraînement.

Pour l'APIaction correspondante, voir CreateTrainingDataset.

Création d'un modèle similaire

Après avoir créé un jeu de données d'entraînement, vous êtes prêt à créer un modèle similaire. Vous pouvez créer de nombreux modèles similaires à partir d'un seul jeu de données d'entraînement.

Vous devez créer une base de données par défaut dans votre AWS Glue Data Catalog ou incluez l'glue:createDatabaseautorisation dans le rôle fourni.

Pour créer un modèle similaire dans AWS Clean Rooms
  1. Connectez-vous au AWS Management Console et ouvrez le AWS Clean Rooms console avec votre Compte AWS (si vous ne l'avez pas encore fait).

  2. Dans le volet de navigation de gauche, choisissez ML Modeling.

  3. Dans l'onglet Modèles similaires, choisissez Créer un modèle similaire.

  4. Sur la page Créer un modèle similaire, pour les détails du modèle similaire, entrez un nom et une description facultative.

    1. Choisissez le jeu de données d'entraînement que vous souhaitez modéliser dans la liste déroulante.

      Note

      Pour vérifier qu'il s'agit du jeu de données d'entraînement correct, activez Afficher les détails du jeu de données d'entraînement pour afficher les détails.

      Pour créer un nouveau jeu de données d'entraînement, choisissez Créer un jeu de données d'entraînement.

    2. (Facultatif) Entrez dans une fenêtre d'entraînement.

  5. Si vous souhaitez activer les paramètres de chiffrement personnalisés pour le modèle similaire, choisissez Personnaliser les paramètres de chiffrement, puis entrez la KMS clé.

  6. Si vous souhaitez activer les balises pour le modèle similaire, choisissez Ajouter une nouvelle balise, puis entrez la paire clé/valeur.

  7. Choisissez Créer un modèle similaire.

    Note

    La formation des modèles peut prendre de plusieurs heures à deux jours.

Pour l'APIaction correspondante, voir CreateAudienceModel.

Configuration d'un modèle similaire

Une fois que vous avez créé un modèle similaire, vous êtes prêt à le configurer pour une utilisation dans le cadre d'une collaboration. Vous pouvez créer plusieurs modèles similaires configurés à partir d'un seul modèle similaire.

Pour configurer un modèle similaire dans AWS Clean Rooms
  1. Connectez-vous au AWS Management Console et ouvrez le AWS Clean Rooms console avec votre Compte AWS (si vous ne l'avez pas encore fait).

  2. Dans le volet de navigation de gauche, choisissez ML Modeling.

  3. Dans l'onglet Modèles similaires configurés, choisissez Configurer le modèle similaire.

  4. Sur la page Configurer le modèle similaire, pour les détails du modèle similaire configuré, entrez un nom et une description facultative.

    1. Choisissez le modèle Lookalike que vous souhaitez configurer dans la liste déroulante.

      Note

      Pour vérifier qu'il s'agit du bon modèle similaire, activez Afficher les détails du modèle similaire pour afficher les détails.

      Pour créer un nouveau modèle similaire, choisissez Créer un modèle similaire.

    2. Choisissez la taille de graine minimale correspondante que vous souhaitez. Il s'agit du nombre minimum d'utilisateurs dans les données du fournisseur de données de départ qui se chevauchent avec les utilisateurs dans les données de formation. Cette valeur doit être supérieure à 0.

  5. Pour que les métriques soient partagées avec d'autres membres, choisissez si vous souhaitez que le fournisseur de données de base de votre collaboration reçoive les métriques du modèle, y compris les scores de pertinence.

  6. Pour l'emplacement de destination du segment Lookalike, entrez le compartiment Amazon S3 dans lequel le segment Lookalike est exporté. Ce compartiment doit être situé dans la même région que vos autres ressources.

  7. Pour l'accès au service, choisissez le nom du rôle de service existant qui sera utilisé pour accéder à cette table.

  8. Pour la configuration avancée de la taille des bacs, spécifiez le type de taille de l'audience sous forme de nombre absolu ou de pourcentage.

  9. Si vous souhaitez activer les balises pour la ressource de table configurée, choisissez Ajouter une nouvelle balise, puis entrez la paire clé/valeur.

  10. Choisissez Configurer le modèle similaire.

Pour l'APIaction correspondante, voir CreateConfiguredAudienceModel.

Associer un modèle similaire configuré

Après avoir configuré un modèle similaire, vous pouvez l'associer à une collaboration.

Pour associer un modèle similaire configuré dans AWS Clean Rooms
  1. Connectez-vous au AWS Management Console et ouvrez le AWS Clean Rooms console avec votre Compte AWS (si vous ne l'avez pas encore fait).

  2. Dans le volet de navigation de gauche, sélectionnez Collaborations.

  3. Dans l'onglet Avec adhésion active, choisissez une collaboration.

  4. Dans l'onglet ML Modeling, sous R eady-to-use lookalike models, choisissez Associate lookalike model.

  5. Sur la page Associer un modèle similaire configuré, pour les détails de l'association du modèle similaire configuré :

    1. Entrez un nom pour le modèle d'audience configuré associé.

    2. Entrez une description de la table.

      La description permet de différencier les autres modèles d'audience configurés associés portant des noms similaires.

  6. Pour Modèle similaire configuré, choisissez un modèle similaire configuré dans la liste déroulante.

  7. Choisissez Associer.

Pour l'APIaction correspondante, voir CreateConfiguredAudienceModelAssociation.

Mettre à jour un modèle similaire configuré

Après avoir associé un modèle similaire configuré à une collaboration, vous pouvez le mettre à jour pour modifier des informations telles que le nom, les métriques à partager ou la position Amazon S3 en sortie.

Pour mettre à jour un modèle similaire configuré associé dans AWS Clean Rooms
  1. Connectez-vous au AWS Management Console et ouvrez le AWS Clean Rooms console avec votre Compte AWS (si vous ne l'avez pas encore fait).

  2. Dans le volet de navigation de gauche, choisissez ML modeling.

  3. Dans l'onglet Modèles similaires configurés, sous Modèles eady-to-use similaires R, choisissez un modèle similaire configuré et sélectionnez Modifier.

  4. Sur la page d'édition, pour les détails de l'association de modèles similaires configurés :

    1. Mettez à jour le nom et la description facultative.

    2. Choisissez le modèle Lookalike que vous souhaitez configurer dans la liste déroulante.

    3. Choisissez la taille de graine minimale correspondante que vous souhaitez. Il s'agit du nombre minimum d'utilisateurs dans les données du fournisseur de données de départ qui se chevauchent avec les utilisateurs dans les données de formation. Cette valeur doit être supérieure à 0.

  5. Pour que les métriques soient partagées avec d'autres membres, choisissez si vous souhaitez que le fournisseur de données de base de votre collaboration reçoive les métriques du modèle, y compris les scores de pertinence.

  6. Pour l'emplacement de destination du segment Lookalike, entrez le compartiment Amazon S3 dans lequel le segment Lookalike est exporté. Ce compartiment doit être situé dans la même région que vos autres ressources.

  7. Pour l'accès au service, choisissez le nom du rôle de service existant qui sera utilisé pour accéder à cette table.

  8. Pour la configuration avancée de la taille des bacs, choisissez la manière dont vous souhaitez configurer les tailles des bacs d'audience.

  9. Sélectionnez Enregistrer les modifications.

Pour l'APIaction correspondante, voir UpdateConfiguredAudienceModel.

Utilisation de segments similaires (fournisseur de données de départ)

Création d'un segment similaire

Un segment similaire est un sous-ensemble des données d'apprentissage qui ressemble le plus aux données de départ.

Pour créer un segment similaire dans AWS Clean Rooms
  1. Connectez-vous au AWS Management Console et ouvrez le AWS Clean Rooms console avec votre Compte AWS (si vous ne l'avez pas encore fait).

  2. Dans le volet de navigation de gauche, sélectionnez Collaborations.

  3. Dans l'onglet Avec adhésion active, choisissez une collaboration.

  4. Dans l'onglet ML Modeling, choisissez Create lookalike segment.

  5. Sur la page Créer un segment de similitude, pour Modèle de similitude configuré associé, choisissez le modèle de similitude configuré associé à utiliser pour ce segment de similitude.

  6. Pour les détails du segment Lookalike, entrez un nom et une description facultative.

  7. Pour les profils Seed, choisissez votre méthode Seed en sélectionnant une option, puis en prenant l'action recommandée.

    Option Action recommandée
    Source d'entrée Amazon S3
    1. Sélectionnez un emplacement Amazon S3.

    2. (Facultatif) Choisissez Inclure les profils de départ dans la sortie.

    SQLrequête Rédigez une SQL requête et utilisez ses résultats comme données de départ,
    Modèle d'analyse Choisissez un modèle d'analyse dans la liste déroulante et utilisez les résultats créés par un modèle d'analyse.
  8. Pour l'accès au service, choisissez le nom du rôle de service existant qui sera utilisé pour accéder à cette table.

  9. Si vous souhaitez activer les balises pour le jeu de données d'entraînement, choisissez Ajouter une nouvelle balise, puis entrez la paire clé/valeur.

  10. Choisissez Créer un segment similaire.

Pour l'APIaction correspondante, voir StartAudienceGenerationJob.

Exporter un segment similaire

Après avoir créé un segment similaire, vous pouvez exporter ces données vers un compartiment Amazon S3.

Pour exporter un segment similaire dans AWS Clean Rooms
  1. Connectez-vous au AWS Management Console et ouvrez le AWS Clean Rooms console avec votre Compte AWS (si vous ne l'avez pas encore fait).

  2. Dans le volet de navigation de gauche, sélectionnez Collaborations.

  3. Dans l'onglet Avec adhésion active, choisissez une collaboration.

  4. Dans l'onglet ML Modeling, sous Segments similaires, sélectionnez un segment similaire et choisissez Exporter.

  5. Pour Exporter un modèle similaire, pour Exporter les détails du modèle similaire, entrez un nom et une description facultative.

  6. Pour Taille du segment, choisissez la taille que vous souhaitez pour le segment exporté.

  7. Cliquez sur Exporter.

Pour l'APIaction correspondante, voir StartAudienceExportJob.

Maintenant que vous avez créé un modèle similaire et exporté un segment de départ, vous êtes prêt à visualiser les données exportées dans S3.