AWS Clean Rooms ML - AWS Clean Rooms

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

AWS Clean Rooms ML

AWS Clean Rooms Le ML fournit une méthode préservant la confidentialité permettant à deux parties d'identifier des utilisateurs similaires dans leurs données sans avoir à partager leurs données entre elles. La première partie apporte les données d'entraînement à AWS Clean Rooms afin qu'ils puissent créer et configurer un modèle similaire et l'associer à une collaboration. Les données de départ sont ensuite transmises à la collaboration pour créer un segment similaire aux données d'entraînement.

Pour une explication plus détaillée de son fonctionnement, voirEmplois multi-comptes.

  • Fournisseur de données de formation : partie qui fournit les données de formation, crée et configure un modèle similaire, puis associe ce modèle similaire à une collaboration.

  • Fournisseur de données sur les semences : partie qui fournit les données sur les semences, génère un segment similaire et exporte son segment similaire.

  • Données d'entraînement : données du fournisseur de données de formation, utilisées pour générer un modèle similaire. Les données d'entraînement sont utilisées pour mesurer la similitude des comportements des utilisateurs.

    Les données d'entraînement doivent contenir un ID utilisateur, un ID d'élément et une colonne d'horodatage. Les données d'entraînement peuvent éventuellement contenir d'autres interactions sous forme de caractéristiques numériques ou catégoriques. Des exemples d'interactions sont une liste de vidéos regardées, d'articles achetés ou d'articles lus.

  • Données de départ : données du fournisseur de données de départ, utilisées pour créer un segment similaire. Les données de départ peuvent être fournies directement ou elles peuvent provenir des résultats d'un AWS Clean Rooms requête. Le résultat du segment similaire est un ensemble d'utilisateurs issu des données d'entraînement qui ressemble le plus aux utilisateurs initiaux.

  • Modèle similaire : modèle d'apprentissage automatique des données d'entraînement utilisé pour rechercher des utilisateurs similaires dans d'autres ensembles de données.

    Lorsque vous utilisez leAPI, le terme modèle d'audience est utilisé de la même manière que le modèle similaire. Par exemple, vous utilisez le CreateAudienceModelAPIpour créer un modèle similaire.

  • Segment similaire : sous-ensemble des données d'entraînement qui ressemble le plus aux données de départ.

    Lorsque vous utilisez leAPI, vous créez un segment similaire avec le StartAudienceGenerationJobAPI.

Les données du fournisseur de données de formation ne sont jamais partagées avec le fournisseur de données de départ et les données du fournisseur de données de départ ne sont jamais partagées avec le fournisseur de données de formation. La sortie du segment similaire est partagée avec le fournisseur de données de formation, mais jamais avec le fournisseur de données de départ.

Pour plus d'informations sur les modèles similaires, consultez les rubriques suivantes.

Comment ? AWS Clean Rooms ML fonctionne

Un aperçu de la façon dont AWS Clean Rooms ML fonctionne.

Clean Rooms ML nécessite que deux parties, un fournisseur de données de formation et un fournisseur de données de base, travaillent de manière séquentielle dans AWS Clean Rooms pour intégrer leurs données dans le cadre d'une collaboration. Voici le flux de travail que le fournisseur de données de formation doit effectuer en premier :

  1. Les données du fournisseur de données de formation doivent être stockées dans un AWS Glue tableau du catalogue de données sur les interactions entre les utilisateurs et les éléments. Les données d'entraînement doivent au minimum contenir une colonne d'ID utilisateur, une colonne d'identifiant d'interaction et une colonne d'horodatage.

  2. Le fournisseur de données de formation enregistre les données de formation auprès de AWS Clean Rooms.

  3. Le fournisseur de données de formation crée un modèle similaire qui peut être partagé avec plusieurs fournisseurs de données de départ. Le modèle similaire est un réseau neuronal profond dont l'entraînement peut prendre jusqu'à 24 heures. Il n'est pas automatiquement réentraîné et nous vous recommandons de le réentraîner chaque semaine.

  4. Le fournisseur de données de formation configure le modèle de similarité, notamment en indiquant s'il convient de partager les indicateurs de pertinence et l'emplacement des segments de sortie sur Amazon S3. Le fournisseur de données de formation peut créer plusieurs modèles similaires configurés à partir d'un seul modèle similaire.

  5. Le fournisseur de données de formation associe le modèle d'audience configuré à une collaboration partagée avec un fournisseur de données de départ.

Il s'agit du flux de travail que le fournisseur de données de départ doit ensuite effectuer :

  1. Les données du fournisseur de données de base peuvent être stockées dans un compartiment Amazon S3 et peuvent provenir des résultats d'une requête.

  2. Le fournisseur de données de départ ouvre la collaboration qu'il partage avec le fournisseur de données de formation.

  3. Le fournisseur de données de départ crée un segment similaire à partir de l'onglet Clean Rooms ML de la page de collaboration.

  4. Le fournisseur de données de base peut évaluer les indicateurs de pertinence, s'ils ont été partagés, et exporter le segment similaire pour une utilisation en dehors AWS Clean Rooms.