Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Vorbereiten von Trainingsdaten für Amazon Personalize
Nachdem Sie einen Anwendungsfall oder ein Rezept für eine Domain ausgewählt und die Datenanforderungen notiert haben, können Sie mit der Vorbereitung Ihrer Daten beginnen. Amazon Personalize kann die folgenden Datentypen verwenden:
-
Artikelinteraktionen — In Amazon Personalize ist eine Artikelinteraktion ein positives Interaktionsereignis zwischen einem Benutzer und einem Artikel in Ihrem Katalog. Zum Beispiel ein Nutzer, der sich einen Film ansieht, sich ein Angebot ansieht oder ein Paar Schuhe kauft.
-
Artikel — Artikelmetadaten können Informationen wie Preis, SKU Typ, Beschreibung oder Verfügbarkeit für jeden Artikel in Ihrem Katalog enthalten.
-
Benutzer — Benutzermetadaten können Informationen wie Alter, Geschlecht, Treuemitgliedschaft und Interessen für jeden Ihrer Benutzer enthalten.
-
Aktionen — Eine Aktion ist eine Interaktionsaktivität, die Sie Ihren Kunden vielleicht empfehlen möchten. Zu den Aktionen können die Installation Ihrer mobilen App, das Ausfüllen eines Mitgliedsprofils, die Teilnahme an Ihrem Treueprogramm oder die Anmeldung für Werbe-E-Mails gehören. Für das Rezept „Next-Best-Action“ ist der Datensatz „Aktionen“ erforderlich. In keinem anderen benutzerdefinierten Rezept- oder Domain-Anwendungsfall werden Actions-Daten verwendet.
-
Aktionsinteraktionen — Eine Aktionsinteraktion ist ein Interaktionsereignis zwischen einem Benutzer und einer Aktion. Das Rezept für die nächste Best-Action verwendet diese Daten und die Daten in Ihrem Actions-Datensatz, um Ihren Benutzern Aktionen zu empfehlen. In keinem anderen benutzerdefinierten Rezept oder Domain-Anwendungsfall werden Action-Interactions-Daten verwendet.
Amazon Personalize speichert Daten in Datensätzen, einen für jeden Datentyp. Jeder Datensatz hat unterschiedliche Anforderungen. Wenn Sie Daten in einen Amazon Personalize importieren, können Sie wählen, ob Sie Datensätze in großen Mengen, einzeln oder beides importieren möchten. Bei Massenimporten wird eine große Anzahl historischer Datensätze importiert, die in einer oder mehreren CSV Dateien in einem Amazon S3 S3-Bucket gespeichert sind.
-
Wenn Sie keine Massendaten haben, können Sie einzelne Importvorgänge verwenden, um Daten zu sammeln und Ereignisse zu streamen, bis Sie die Schulungsanforderungen von Amazon Personalize und die Datenanforderungen Ihres Domain-Anwendungsfalls oder -Rezepts erfüllen. Informationen zum Aufzeichnen von Ereignissen finden Sie unterAufzeichnung von Ereignissen in Echtzeit zur Beeinflussung von Empfehlungen. Informationen zum Importieren einzelner Datensätze finden Sie unterEinzelne Datensätze in einen Amazon Personalize importieren.
-
Wenn Sie sich nicht sicher sind, ob Sie über genügend Daten verfügen, oder wenn Sie Fragen zu deren Qualität haben, können Sie Ihre Daten in einen Amazon Personalize-Datensatz importieren und mit Amazon Personalize analysieren. Weitere Informationen finden Sie unter Analysieren von Qualität und Quantität von Daten in Amazon Personalize Personalize-Datensätzen.
Die folgenden Abschnitte enthalten Datenanforderungen für jeden Amazon Personalize Personalize-Datensatztyp und Richtlinien für die Vorbereitung von Massendaten. Wenn Sie nicht über Massendaten verfügen, lesen Sie sich die Abschnitte durch, um mehr über die erforderlichen und optionalen Daten zu erfahren, die Sie mit einzelnen Importvorgängen importieren können. Wenn Sie zusätzliche Hilfe beim Formatieren Ihrer Daten benötigen, können Sie Amazon SageMaker Data Wrangler (Data Wrangler) verwenden, um Ihre Daten vorzubereiten. Weitere Informationen finden Sie unter Vorbereiten und Importieren von Massendaten mit Amazon SageMaker Data Wrangler.
Nachdem Sie Ihre Daten vorbereitet haben, können Sie eine Schemadatei erstellen. JSON Diese Datei informiert Amazon Personalize über die Struktur Ihrer Daten. Weitere Informationen finden Sie unter JSONSchemadateien für Amazon Personalize Personalize-Schemas erstellen.
Themen
- Richtlinien für das Format von Massendaten für alle Datentypen
- Vorbereiten von Artikelinteraktionsdaten für das Training
- Artikelmetadaten für das Training vorbereiten
- Benutzermetadaten für das Training vorbereiten
- Aktionsmetadaten für das Training vorbereiten
- Vorbereiten von Aktionsinteraktionsdaten für das Training
Richtlinien für das Format von Massendaten für alle Datentypen
Mithilfe der folgenden Richtlinien und Anforderungen können Sie sicherstellen, dass Ihre Massendaten korrekt formatiert sind.
-
Ihre Eingabedaten müssen sich in einer Datei CSV (durch Kommas getrennte Werte) befinden.
-
Die erste Zeile Ihrer CSV Datei muss Ihre Spaltenüberschriften enthalten. Die Überschriften sollten nicht von Anführungszeichen (") umgeben sein.
-
Spalten müssen eindeutige alphanumerische Namen haben. Sie können beispielsweise nicht gleichzeitig ein
GENRES_FIELD_1
Feld und einGENRESFIELD1
Feld hinzufügen. -
Stellen Sie sicher, dass Sie über die erforderlichen Felder für Ihren Datensatztyp verfügen und dass ihre Namen den Anforderungen von Amazon Personalize entsprechen. Beispielsweise könnten Ihre Artikeldaten IDs für jeden Ihrer Artikel eine Spalte
ITEM_IDENTIFICATION_NUMBER
mit dem Namen with haben. Um diese Spalte als ITEM _ID-Feld zu verwenden, benennen Sie die Spalte in umITEM_ID
. Wenn Sie Data Wrangler verwenden, um Ihre Daten zu formatieren, können Sie die Transformation Map columns for Amazon Personalize Data Wrangler verwenden, um sicherzustellen, dass Ihre Spalten korrekt benannt sind.Informationen zur Verwendung von Data Wrangler zur Vorbereitung Ihrer Daten finden Sie unter. Vorbereiten und Importieren von Massendaten mit Amazon SageMaker Data Wrangler
-
Jeder Datensatz in Ihrer CSV Datei muss sich in einer einzigen Zeile befinden.
-
Amazon Personalize unterstützt keine komplexen Datentypen wie Arrays und Maps.
-
Damit Amazon Personalize beim Training oder Filtern boolesche Daten verwendet, verwenden Sie Zeichenkettenwerte
"False"
und/oder"True"
numerische Werte1
für true und0
false. -
Wenn Sie Data Wrangler zum Formatieren Ihrer Daten verwenden, können Sie die Data Wrangler-Transformation „Wert als Typ analysieren“ verwenden, um die Datentypen zu konvertieren.
-
TIMESTAMP
und dieCREATION_TIMESTAMP
Daten müssen im Epochenzeitformat vorliegen. UNIX Weitere Informationen finden Sie unter Daten mit Zeitstempel. -
Vermeiden Sie es,
"
Zeichen oder Sonderzeichen in die Daten der Artikel-ID, Benutzer-ID und Aktions-ID aufzunehmen. -
Wenn Ihre Daten nicht ASCII kodierte Zeichen enthalten, muss Ihre CSV Datei im UTF -8-Format codiert sein.
-
Stellt sicher, dass Sie alle Textdaten wie unter beschrieben formatieren. Unstrukturierte Textmetadaten