Benutzermetadaten für das Training vorbereiten - Amazon Personalize

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Benutzermetadaten für das Training vorbereiten

Zu den Benutzerdaten, die Sie in Amazon Personalize importieren können, gehören numerische Daten wie das Alter des Benutzers und kategorische Metadaten wie Geschlecht oder Treuemitgliedschaft. Sie importieren Metadaten über Ihre Benutzer in einen Amazon Personalize Users-Datensatz.

Abhängig von Ihrem Domain-Anwendungsfall oder Ihrer benutzerdefinierten Rezeptur können Benutzermetadaten Amazon Personalize dabei helfen, Benutzern relevantere Artikel zu empfehlen oder aussagekräftigere Benutzersegmente zu empfehlen. Und nach dem Training kann es Ihrem Modell helfen, Artikel für Benutzer ohne Interaktionsdaten zu empfehlen. Weitere Informationen darüber, welche Anwendungsfälle oder Rezepte Benutzermetadaten verwenden, finden Sie in den Datenanforderungen für Ihren Domain-Anwendungsfall oder Ihr Rezept unterIhren Anwendungsfall mit den Ressourcen von Amazon Personalize abgleichen.

Beim Training verwendet Amazon Personalize keine unkategorischen Zeichenketten-Benutzerdaten wie Benutzernamen, Stichwörter über den Benutzer oder Tags. Der Import dieser Daten kann die Empfehlungen jedoch immer noch verbessern. Weitere Informationen finden Sie unter Nicht kategorische Zeichenkettendaten.

Für alle Domain-Anwendungsfälle und benutzerdefinierten Rezepte müssen sich Ihre Massenbenutzerdaten in einer CSV Datei befinden. Jede Zeile in der Datei sollte für einen eindeutigen Benutzer stehen. Nachdem Sie Ihre Daten vorbereitet haben, können Sie eine JSON Schemadatei erstellen. Diese Datei informiert Amazon Personalize über die Struktur Ihrer Daten. Weitere Informationen finden Sie unter JSONSchemadateien für Amazon Personalize Personalize-Schemas erstellen.

In den folgenden Abschnitten finden Sie weitere Informationen zur Vorbereitung Ihrer Benutzerdaten für Amazon Personalize. Richtlinien für das Massendatenformat für alle Datentypen finden Sie unter Richtlinien für das Massendatenformat

Anforderungen an Benutzerdaten

Im Folgenden sind die Anforderungen an Benutzerdaten für Amazon Personalize aufgeführt. Es steht Ihnen frei, je nach Ihrem Anwendungsfall und Ihren Daten weitere benutzerdefinierte Spalten hinzuzufügen.

  • Ihre Daten müssen über eine USER _ID-Spalte verfügen, in der die eindeutige Kennung für jeden Benutzer gespeichert ist. Jeder Benutzer muss eine Benutzer-ID haben. Es muss eine string mit einer maximalen Länge von 256 Zeichen sein.

  • Ihre Daten müssen mindestens eine kategoriale Zeichenfolge oder eine numerische Metadatenspalte enthalten. Benutzermetadatenspalten können für einige Benutzer leere/Nullwerte enthalten. Wir empfehlen, dass diese Spalten zu mindestens 70 Prozent vollständig sind.

  • Die maximale Anzahl von Metadatenspalten ist 25.

Wenn Sie sich nicht sicher sind, ob Sie über genügend Daten verfügen, oder wenn Sie Fragen zu deren Qualität haben, können Sie Ihre Daten in einen Amazon Personalize-Datensatz importieren und mit Amazon Personalize analysieren. Weitere Informationen finden Sie unter Analysieren von Qualität und Quantität von Daten in Amazon Personalize Personalize-Datensätzen.

Kategorische Metadaten

Bei einigen Rezepten und allen Domain-Anwendungsfällen verwendet Amazon Personalize kategorische Metadaten, wie das Geschlecht, die Interessen oder den Mitgliedschaftsstatus eines Benutzers, um zugrunde liegende Muster zu identifizieren, die die relevantesten Elemente für Ihre Benutzer aufdecken. Sie definieren Ihren eigenen Wertebereich auf der Grundlage Ihres Anwendungsfalls. Kategorische Metadaten können in jeder Sprache vorliegen.

Bei Benutzern mit mehreren Kategorien trennen Sie die einzelnen Werte durch den senkrechten Balken '|' voneinander. Für ein INTERESTS Feld könnten Ihre Daten für einen Benutzer beispielsweise sein. Movies|TV Shows|Music

Bei allen Rezepten und Domänen können Sie kategoriale Metadaten importieren und diese verwenden, um Empfehlungen auf der Grundlage der Attribute eines Benutzers zu filtern. Informationen zum Filtern von Empfehlungen finden Sie unterEmpfehlungen und Benutzersegmente filtern.

Kategorische Werte können maximal 1000 Zeichen lang sein. Wenn Sie einen Benutzer mit einem kategorialen Wert mit mehr als 1000 Zeichen haben, schlägt Ihr Datensatz-Importjob fehl.

Nicht kategorische Zeichenkettendaten

Mit Ausnahme von Benutzern IDs verwendet Amazon Personalize beim Training keine nicht kategorischen Zeichenkettendaten, wie z. B. Benutzernamen, Stichwörter über den Benutzer oder Tags. Amazon Personalize kann es jedoch beim Filtern von Empfehlungen verwenden. Sie können Filter erstellen, um Artikel auf der Grundlage von nicht kategorischen Zeichenkettendaten über den Benutzer, für den Sie Empfehlungen erhalten, in Empfehlungen aufzunehmen oder daraus zu entfernen. CurrentUser Weitere Informationen zu Filtern finden Sie unter Empfehlungen und Benutzersegmente filtern. Nicht kategorische Werte können maximal 1000 Zeichen lang sein.

Beispiel für Benutzermetadaten

Die ersten Zeilen mit Benutzermetadaten in einer CSV Datei könnten wie folgt aussehen.

USER_ID,AGE,GENDER,INTEREST 5,34,Male,hiking 6,56,Female,music 8,65,Male,movies|TV shows|music ... ...

Die USER_ID Spalte ist erforderlich und speichert eindeutige Kennungen für jeden einzelnen Benutzer. Die AGE Spalte besteht aus numerischen Metadaten. In den INTEREST Spalten GENDER und werden kategoriale Metadaten für jeden Benutzer gespeichert.

Nachdem Sie Ihre Daten vorbereitet haben, können Sie eine JSON Schemadatei erstellen. Diese Datei informiert Amazon Personalize über die Struktur Ihrer Daten. Weitere Informationen finden Sie unter JSONSchemadateien für Amazon Personalize Personalize-Schemas erstellen. So würde die JSON Schemadatei für die obigen Beispieldaten aussehen.

{ "type": "record", "name": "Users", "namespace": "com.amazonaws.personalize.schema", "fields": [ { "name": "USER_ID", "type": "string" }, { "name": "AGE", "type": "int" }, { "name": "GENDER", "type": "string", "categorical": true }, { "name": "INTEREST", "type": "string", "categorical": true } ], "version": "1.0" }