AWS Clean Rooms ML - AWS Clean Rooms

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

AWS Clean Rooms ML

AWS Clean Rooms ML bietet eine Methode zur Wahrung der Privatsphäre, mit der zwei Parteien ähnliche Benutzer in ihren Daten identifizieren können, ohne ihre Daten miteinander teilen zu müssen. Die erste Partei bringt die Trainingsdaten zu AWS Clean Rooms sodass sie ein Lookalike-Modell erstellen und konfigurieren und es einer Zusammenarbeit zuordnen können. Anschließend werden Ausgangsdaten in die Kollaboration übernommen, um ein Lookalike-Segment zu erstellen, das den Trainingsdaten ähnelt.

Eine detailliertere Erklärung, wie das funktioniert, finden Sie unterKontoübergreifende Jobs.

  • Anbieter von Trainingsdaten — Die Partei, die die Trainingsdaten bereitstellt, ein Lookalike-Modell erstellt und konfiguriert und dieses Lookalike-Modell dann einer Zusammenarbeit zuordnet.

  • Seed-Datenanbieter — Die Partei, die die Ausgangsdaten bereitstellt, generiert ein Lookalike-Segment und exportiert ihr Lookalike-Segment.

  • Trainingsdaten — Die Daten des Trainingsdatenanbieters, die zur Generierung eines Lookalike-Modells verwendet werden. Die Trainingsdaten werden verwendet, um die Ähnlichkeit des Benutzerverhaltens zu messen.

    Die Trainingsdaten müssen eine Benutzer-ID, eine Element-ID und eine Zeitstempelspalte enthalten. Optional können die Trainingsdaten auch andere Interaktionen als numerische oder kategoriale Merkmale enthalten. Beispiele für Interaktionen sind eine Liste von angesehenen Videos, gekauften Artikeln oder gelesenen Artikeln.

  • Seed-Daten — Die Daten des Seed-Datenanbieters, die zur Erstellung eines Lookalike-Segments verwendet werden. Die Seed-Daten können direkt bereitgestellt werden oder sie können aus den Ergebnissen eines AWS Clean Rooms abfragen. Bei der Ausgabe des Lookalike-Segments handelt es sich um eine Gruppe von Benutzern aus den Trainingsdaten, die den Ausgangsbenutzern am ähnlichsten sind.

  • Lookalike-Modell — Ein maschinelles Lernmodell der Trainingsdaten, das verwendet wird, um ähnliche Benutzer in anderen Datensätzen zu finden.

    Bei der Verwendung von wird der API Begriff Zielgruppenmodell gleichbedeutend mit dem Lookalike-Modell verwendet. Beispielsweise verwenden Sie den, um ein CreateAudienceModelAPILookalike-Modell zu erstellen.

  • Lookalike-Segment — Eine Teilmenge der Trainingsdaten, die den Ausgangsdaten am ähnlichsten ist.

    Wenn Sie das verwendenAPI, erstellen Sie ein Lookalike-Segment mit dem. StartAudienceGenerationJobAPI

Die Daten des Trainingsdatenanbieters werden niemals mit dem Startdatenanbieter geteilt, und die Daten des Ausgangsdatenanbieters werden niemals mit dem Trainingsdatenanbieter geteilt. Die Ausgabe des Lookalike-Segments wird mit dem Trainingsdatenanbieter geteilt, aber niemals mit dem Seed-Datenanbieter.

Weitere Informationen zu Lookalike-Modellen finden Sie in den folgenden Themen.

Wie AWS Clean Rooms ML funktioniert

Ein Überblick darüber, wie AWS Clean Rooms ML funktioniert.

Clean Rooms ML setzt voraus, dass zwei Parteien, ein Anbieter von Trainingsdaten und ein Anbieter von Startdaten, nacheinander in AWS Clean Rooms um ihre Daten in eine Zusammenarbeit einzubringen. Dies ist der Workflow, den der Anbieter von Trainingsdaten zuerst abschließen muss:

  1. Die Daten des Trainingsdatenanbieters müssen in einem gespeichert werden AWS Glue Datenkatalogtabelle mit Interaktionen zwischen Benutzern und Objekten. Die Trainingsdaten müssen mindestens eine Benutzer-ID-Spalte, eine Interaktions-ID-Spalte und eine Zeitstempelspalte enthalten.

  2. Der Trainingsdatenanbieter registriert die Trainingsdaten bei AWS Clean Rooms.

  3. Der Trainingsdatenanbieter erstellt ein Lookalike-Modell, das mit mehreren Seed-Datenanbietern gemeinsam genutzt werden kann. Das Lookalike-Modell ist ein tiefes neuronales Netzwerk, dessen Training bis zu 24 Stunden dauern kann. Es wird nicht automatisch neu trainiert und wir empfehlen, dass Sie das Modell wöchentlich neu trainieren.

  4. Der Anbieter von Trainingsdaten konfiguriert das Lookalike-Modell, einschließlich der Frage, ob Relevanzkennzahlen und der Amazon S3 S3-Speicherort der Ausgabesegmente geteilt werden sollen. Der Anbieter von Trainingsdaten kann mehrere konfigurierte Lookalike-Modelle aus einem einzigen Lookalike-Modell erstellen.

  5. Der Anbieter von Trainingsdaten ordnet das konfigurierte Zielgruppenmodell einer Zusammenarbeit zu, die mit einem Startdatenanbieter geteilt wird.

Dies ist der Workflow, den der Seed-Datenanbieter als Nächstes abschließen muss:

  1. Die Daten des Seed-Datenanbieters können in einem Amazon S3 S3-Bucket gespeichert werden und können aus den Ergebnissen der Abfrage stammen.

  2. Der Seed-Datenanbieter eröffnet die Zusammenarbeit, die er mit dem Trainingsdatenanbieter teilt.

  3. Der Seed-Datenanbieter erstellt auf der Registerkarte Clean Rooms ML der Kollaborationsseite ein ähnliches Segment.

  4. Der Seed-Datenanbieter kann die Relevanzkennzahlen auswerten, sofern sie geteilt wurden, und das Lookalike-Segment zur externen Verwendung exportieren AWS Clean Rooms.