Richtlinien für das Format von Massendaten für alle Datentypen

Vorbereiten von Trainingsdaten für Amazon Personalize

Nachdem Sie einen Anwendungsfall oder ein Rezept für eine Domain ausgewählt und die Datenanforderungen notiert haben, können Sie mit der Vorbereitung Ihrer Daten beginnen. Amazon Personalize kann die folgenden Datentypen verwenden:

Artikelinteraktionen — In Amazon Personalize ist eine Artikelinteraktion ein positives Interaktionsereignis zwischen einem Benutzer und einem Artikel in Ihrem Katalog. Zum Beispiel ein Nutzer, der sich einen Film ansieht, sich ein Angebot ansieht oder ein Paar Schuhe kauft.
Artikel — Artikelmetadaten können Informationen wie Preis, SKU-Typ, Beschreibung oder Verfügbarkeit für jeden Artikel in Ihrem Katalog enthalten.
Benutzer — Benutzermetadaten können Informationen wie Alter, Geschlecht, Treuemitgliedschaft und Interessen für jeden Ihrer Benutzer enthalten.
Aktionen — Eine Aktion ist eine Interaktionsaktivität, die Sie Ihren Kunden vielleicht empfehlen möchten. Zu den Aktionen können die Installation Ihrer mobilen App, das Ausfüllen eines Mitgliedsprofils, die Teilnahme an Ihrem Treueprogramm oder die Anmeldung für Werbe-E-Mails gehören. Für das Next-Best-Action Rezept ist der Datensatz Aktionen erforderlich. In keinem anderen benutzerdefinierten Rezept- oder Domain-Anwendungsfall werden Actions-Daten verwendet.
Aktionsinteraktionen — Eine Aktionsinteraktion ist ein Interaktionsereignis zwischen einem Benutzer und einer Aktion. Das Next-Best-Action Rezept verwendet diese Daten und die Daten in Ihrem Aktionen-Datensatz, um Ihren Benutzern Aktionen zu empfehlen. In keinem anderen benutzerdefinierten Rezept- oder Domain-Anwendungsfall werden Action-Interaction-Daten verwendet.

Amazon Personalize speichert Daten in Datensätzen, einen für jeden Datentyp. Jeder Datensatz hat unterschiedliche Anforderungen. Wenn Sie Daten in einen Amazon Personalize importieren, können Sie wählen, ob Sie Datensätze in großen Mengen, einzeln oder beides importieren möchten. Bei Massenimporten wird eine große Anzahl von historischen Datensätzen importiert, die in einer oder mehreren CSV-Dateien in einem Amazon S3 S3-Bucket gespeichert sind.

Wenn Sie keine Massendaten haben, können Sie einzelne Importvorgänge verwenden, um Daten zu sammeln und Ereignisse zu streamen, bis Sie die Schulungsanforderungen von Amazon Personalize und die Datenanforderungen Ihres Domain-Anwendungsfalls oder -Rezepts erfüllen. Informationen zum Aufzeichnen von Ereignissen finden Sie unterAufzeichnung von Ereignissen in Echtzeit zur Beeinflussung von Empfehlungen. Informationen zum Importieren einzelner Datensätze finden Sie unterEinzelne Datensätze in einen Amazon Personalize importieren.
Wenn Sie sich nicht sicher sind, ob Sie über genügend Daten verfügen, oder wenn Sie Fragen zu deren Qualität haben, können Sie Ihre Daten in einen Amazon Personalize-Datensatz importieren und mit Amazon Personalize analysieren. Weitere Informationen finden Sie unter Analysieren von Qualität und Quantität von Daten in Amazon Personalize Personalize-Datensätzen.

Die folgenden Abschnitte enthalten Datenanforderungen für jeden Amazon Personalize Personalize-Datensatztyp und Richtlinien für die Vorbereitung von Massendaten. Wenn Sie nicht über Massendaten verfügen, lesen Sie sich die Abschnitte durch, um mehr über die erforderlichen und optionalen Daten zu erfahren, die Sie mit einzelnen Importvorgängen importieren können. Wenn Sie zusätzliche Hilfe bei der Formatierung Ihrer Daten benötigen, können Sie Amazon SageMaker AI Data Wrangler (Data Wrangler) verwenden, um Ihre Daten vorzubereiten. Weitere Informationen finden Sie unter Vorbereiten und Importieren von Massendaten mit Amazon SageMaker AI Data Wrangler.

Nachdem Sie Ihre Daten vorbereitet haben, können Sie eine Schema-JSON-Datei erstellen. Diese Datei informiert Amazon Personalize über die Struktur Ihrer Daten. Weitere Informationen finden Sie unter JSON-Schema-Dateien für Amazon Personalize Personalize-Schemas erstellen.

Themen

Richtlinien für das Format von Massendaten für alle Datentypen

Mithilfe der folgenden Richtlinien und Anforderungen können Sie sicherstellen, dass Ihre Massendaten korrekt formatiert sind.

Ihre Eingabedaten müssen sich in einer CSV-Datei (durch Kommas getrennte Werte) befinden.
Die erste Zeile Ihrer CSV-Datei muss Ihre Spaltenüberschriften enthalten. Die Überschriften sollten nicht von Anführungszeichen (") umgeben sein.
Spalten müssen eindeutige alphanumerische Namen haben. Sie können beispielsweise nicht gleichzeitig ein GENRES_FIELD_1 Feld und ein GENRESFIELD1 Feld hinzufügen.
Wenn Sie mehrere CSV-Dateien importieren, müssen alle Spaltenüberschriften in allen Dateien übereinstimmen.
Stellen Sie sicher, dass Sie über die erforderlichen Felder für Ihren Datensatztyp verfügen und dass ihre Namen den Anforderungen von Amazon Personalize entsprechen. Beispielsweise könnten Ihre Artikeldaten IDs für jeden Ihrer Artikel eine Spalte ITEM_IDENTIFICATION_NUMBER mit dem Namen with haben. Um diese Spalte als ITEM_ID-Feld zu verwenden, benennen Sie die Spalte in um. ITEM_ID Wenn Sie Data Wrangler verwenden, um Ihre Daten zu formatieren, können Sie die Transformation Map columns for Amazon Personalize Data Wrangler verwenden, um sicherzustellen, dass Ihre Spalten korrekt benannt sind.

Informationen zur Verwendung von Data Wrangler zur Vorbereitung Ihrer Daten finden Sie unter. Vorbereiten und Importieren von Massendaten mit Amazon SageMaker AI Data Wrangler
Jeder Datensatz in Ihrer CSV-Datei muss sich in einer einzigen Zeile befinden.
Amazon Personalize unterstützt keine komplexen Datentypen wie Arrays und Maps.
Damit Amazon Personalize beim Training oder Filtern boolesche Daten verwendet, verwenden Sie Zeichenkettenwerte "False" und/oder "True" numerische Werte 1 für true und 0 false.
Wenn Sie Data Wrangler zum Formatieren Ihrer Daten verwenden, können Sie die Data Wrangler-Transformation „Wert als Typ analysieren“ verwenden, um die Datentypen zu konvertieren.
TIMESTAMPund die CREATION_TIMESTAMP Daten müssen im UNIX-Zeitformat für die Epoche vorliegen. Weitere Informationen finden Sie unter Daten mit Zeitstempel.
Vermeiden Sie es, " Zeichen oder Sonderzeichen in die Daten der Artikel-ID, Benutzer-ID und Aktions-ID aufzunehmen.
Wenn Ihre Daten nicht-ASCII-kodierte Zeichen enthalten, muss Ihre CSV-Datei im UTF-8-Format codiert sein.
Stellt sicher, dass Sie alle Textdaten wie unter beschrieben formatieren. Unstrukturierte Textmetadaten

Warnung JavaScript ist in Ihrem Browser nicht verfügbar oder deaktiviert.

Zur Nutzung der AWS-Dokumentation muss JavaScript aktiviert sein. Weitere Informationen finden auf den Hilfe-Seiten Ihres Browsers.

Dokumentkonventionen

HRNN-Kaltstart

Daten zur Interaktion mit Artikeln