Vorbereiten von Trainingsdaten für Amazon Personalize - Amazon Personalize

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Vorbereiten von Trainingsdaten für Amazon Personalize

Nachdem Sie einen Anwendungsfall oder ein Rezept für eine Domain ausgewählt und die Datenanforderungen notiert haben, können Sie mit der Vorbereitung Ihrer Daten beginnen. Amazon Personalize kann die folgenden Datentypen verwenden:

  • Artikelinteraktionen — In Amazon Personalize ist eine Artikelinteraktion ein positives Interaktionsereignis zwischen einem Benutzer und einem Artikel in Ihrem Katalog. Zum Beispiel ein Nutzer, der sich einen Film ansieht, sich ein Angebot ansieht oder ein Paar Schuhe kauft.

  • Artikel — Artikelmetadaten können Informationen wie Preis, SKU Typ, Beschreibung oder Verfügbarkeit für jeden Artikel in Ihrem Katalog enthalten.

  • Benutzer — Benutzermetadaten können Informationen wie Alter, Geschlecht, Treuemitgliedschaft und Interessen für jeden Ihrer Benutzer enthalten.

  • Aktionen — Eine Aktion ist eine Interaktionsaktivität, die Sie Ihren Kunden vielleicht empfehlen möchten. Zu den Aktionen können die Installation Ihrer mobilen App, das Ausfüllen eines Mitgliedsprofils, die Teilnahme an Ihrem Treueprogramm oder die Anmeldung für Werbe-E-Mails gehören. Für das Rezept „Next-Best-Action“ ist der Datensatz „Aktionen“ erforderlich. In keinem anderen benutzerdefinierten Rezept- oder Domain-Anwendungsfall werden Actions-Daten verwendet.

  • Aktionsinteraktionen — Eine Aktionsinteraktion ist ein Interaktionsereignis zwischen einem Benutzer und einer Aktion. Das Rezept für die nächste Best-Action verwendet diese Daten und die Daten in Ihrem Actions-Datensatz, um Ihren Benutzern Aktionen zu empfehlen. In keinem anderen benutzerdefinierten Rezept oder Domain-Anwendungsfall werden Action-Interactions-Daten verwendet.

Amazon Personalize speichert Daten in Datensätzen, einen für jeden Datentyp. Jeder Datensatz hat unterschiedliche Anforderungen. Wenn Sie Daten in einen Amazon Personalize importieren, können Sie wählen, ob Sie Datensätze in großen Mengen, einzeln oder beides importieren möchten. Bei Massenimporten wird eine große Anzahl historischer Datensätze importiert, die in einer oder mehreren CSV Dateien in einem Amazon S3 S3-Bucket gespeichert sind.

Die folgenden Abschnitte enthalten Datenanforderungen für jeden Amazon Personalize Personalize-Datensatztyp und Richtlinien für die Vorbereitung von Massendaten. Wenn Sie nicht über Massendaten verfügen, lesen Sie sich die Abschnitte durch, um mehr über die erforderlichen und optionalen Daten zu erfahren, die Sie mit einzelnen Importvorgängen importieren können. Wenn Sie zusätzliche Hilfe beim Formatieren Ihrer Daten benötigen, können Sie Amazon SageMaker Data Wrangler (Data Wrangler) verwenden, um Ihre Daten vorzubereiten. Weitere Informationen finden Sie unter Vorbereiten und Importieren von Massendaten mit Amazon SageMaker Data Wrangler.

Nachdem Sie Ihre Daten vorbereitet haben, können Sie eine Schemadatei erstellen. JSON Diese Datei informiert Amazon Personalize über die Struktur Ihrer Daten. Weitere Informationen finden Sie unter JSONSchemadateien für Amazon Personalize Personalize-Schemas erstellen.

Richtlinien für das Format von Massendaten für alle Datentypen

Mithilfe der folgenden Richtlinien und Anforderungen können Sie sicherstellen, dass Ihre Massendaten korrekt formatiert sind.

  • Ihre Eingabedaten müssen sich in einer Datei CSV (durch Kommas getrennte Werte) befinden.

  • Die erste Zeile Ihrer CSV Datei muss Ihre Spaltenüberschriften enthalten. Die Überschriften sollten nicht von Anführungszeichen (") umgeben sein.

  • Spalten müssen eindeutige alphanumerische Namen haben. Sie können beispielsweise nicht gleichzeitig ein GENRES_FIELD_1 Feld und ein GENRESFIELD1 Feld hinzufügen.

  • Stellen Sie sicher, dass Sie über die erforderlichen Felder für Ihren Datensatztyp verfügen und dass ihre Namen den Anforderungen von Amazon Personalize entsprechen. Beispielsweise könnten Ihre Artikeldaten IDs für jeden Ihrer Artikel eine Spalte ITEM_IDENTIFICATION_NUMBER mit dem Namen with haben. Um diese Spalte als ITEM _ID-Feld zu verwenden, benennen Sie die Spalte in umITEM_ID. Wenn Sie Data Wrangler verwenden, um Ihre Daten zu formatieren, können Sie die Transformation Map columns for Amazon Personalize Data Wrangler verwenden, um sicherzustellen, dass Ihre Spalten korrekt benannt sind.

    Informationen zur Verwendung von Data Wrangler zur Vorbereitung Ihrer Daten finden Sie unter. Vorbereiten und Importieren von Massendaten mit Amazon SageMaker Data Wrangler

  • Jeder Datensatz in Ihrer CSV Datei muss sich in einer einzigen Zeile befinden.

  • Amazon Personalize unterstützt keine komplexen Datentypen wie Arrays und Maps.

  • Damit Amazon Personalize beim Training oder Filtern boolesche Daten verwendet, verwenden Sie Zeichenkettenwerte "False" und/oder "True" numerische Werte 1 für true und 0 false.

  • Wenn Sie Data Wrangler zum Formatieren Ihrer Daten verwenden, können Sie die Data Wrangler-Transformation „Wert als Typ analysieren“ verwenden, um die Datentypen zu konvertieren.

  • TIMESTAMPund die CREATION_TIMESTAMP Daten müssen im Epochenzeitformat vorliegen. UNIX Weitere Informationen finden Sie unter Daten mit Zeitstempel.

  • Vermeiden Sie es, " Zeichen oder Sonderzeichen in die Daten der Artikel-ID, Benutzer-ID und Aktions-ID aufzunehmen.

  • Wenn Ihre Daten nicht ASCII kodierte Zeichen enthalten, muss Ihre CSV Datei im UTF -8-Format codiert sein.

  • Stellt sicher, dass Sie alle Textdaten wie unter beschrieben formatieren. Unstrukturierte Textmetadaten