Massendaten vorbereiten und importieren - Amazon Personalize

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Massendaten vorbereiten und importieren

Wenn Sie einen Datensatz erstellt haben, können Sie mit dem Import Ihrer historischen Massendaten in Amazon Personalize beginnen. Sie haben zwei Möglichkeiten, Ihre Massendatensätze zu importieren:

  • Für Artikelinteraktionen, Benutzer und Artikeldatensätze können Sie Amazon SageMaker Data Wrangler verwenden, um Ihre Daten aus mehr als 40 Quellen zu importieren, Visualisierungen und Amazon Personalize-spezifische Erkenntnisse zu generieren und sie so zu transformieren, dass sie die Anforderungen von Amazon Personalize erfüllen.

  • Für alle Datensatztypen können Sie Massendaten direkt in Datensätze importieren. Wenn Sie direkt importieren, formatieren Sie Ihre Daten manuell, um die Anforderungen von Amazon Personalize zu erfüllen, und laden sie auf Amazon S3 hoch. Anschließend erstellen Sie ein Schema und einen Datensatz und importieren die Daten mit einem Datensatz-Importjob direkt in den Datensatz.

Mithilfe der folgenden Richtlinien können Sie sicherstellen, dass Ihre Massendaten korrekt formatiert sind.

  • Ihre Eingabedaten müssen sich in einer CSV-Datei (durch Kommas getrennte Werte) befinden.

  • Die erste Zeile Ihrer CSV-Datei muss Ihre Spaltenüberschriften enthalten. Die Überschriften sollten nicht von Anführungszeichen (") umgeben sein.

  • Stellen Sie sicher, dass Sie über die erforderlichen Felder für Ihren Datensatztyp verfügen und dass ihre Namen den Anforderungen von Amazon Personalize entsprechen. Beispielsweise könnten Ihre Artikeldaten eine Spalte ITEM_IDENTIFICATION_NUMBER mit IDs für jeden Ihrer Artikel enthalten. Um diese Spalte als ITEM_ID-Feld zu verwenden, benennen Sie die Spalte in um. ITEM_ID Wenn Sie Data Wrangler verwenden, um Ihre Daten zu formatieren, können Sie die Transformation Map columns for Amazon Personalize Data Wrangler verwenden, um sicherzustellen, dass Ihre Spalten korrekt benannt sind.

    Informationen zu Pflichtfeldern finden Sie unter. Schemata Informationen zur Verwendung von Data Wrangler zur Vorbereitung Ihrer Daten finden Sie unter. Daten mit Amazon SageMaker Data Wrangler vorbereiten und importieren

  • Die Namen der Spaltenüberschriften in Ihrer CSV-Datei müssen Ihrem Schema entsprechen.

  • Jeder Datensatz in Ihrer CSV-Datei muss sich in einer einzigen Zeile befinden.

  • Die Datentypen in jeder Spalte müssen Ihrem Schema entsprechen. Wenn Sie Data Wrangler zum Formatieren Ihrer Daten verwenden, können Sie die Data Wrangler-Transformation „Wert als Typ analysieren“ verwenden, um die Datentypen zu konvertieren.

  • TIMESTAMPund die CREATION_TIMESTAMP Daten müssen im UNIX-Zeitformat für die Epoche vorliegen. Weitere Informationen finden Sie unter Zeitstempeldaten.

  • Vermeiden Sie es, " Zeichen oder Sonderzeichen in die Daten der Artikel-ID, Benutzer-ID und Aktions-ID aufzunehmen.

  • Wenn Ihre Daten nicht-ASCII-kodierte Zeichen enthalten, muss Ihre CSV-Datei im UTF-8-Format codiert sein.

  • Stellt sicher, dass Sie alle Textdaten wie unter beschrieben formatieren. Unstrukturierte Textmetadaten

  • Achten Sie darauf, Impressionsdaten und kategoriale Daten wie unter und beschrieben zu formatieren. Formatieren von expliziten Eindrücken Formatieren von kategorialen Daten

Weitere Informationen zu den Anforderungen an die Formatierung von Massendaten für Amazon Personalize finden Sie unterRichtlinien für Datenformate.

Nachdem Sie Daten in einen Amazon Personalize Personalize-Datensatz importiert haben, können Sie ihn analysieren, in einen Amazon S3 S3-Bucket exportieren, aktualisieren oder löschen, indem Sie den Datensatz löschen. Weitere Informationen finden Sie unter Verwaltung der Trainingsdaten in Ihren Datensätzen.

Wenn Sie bereits eine Empfehlung erstellt oder eine benutzerdefinierte Lösungsversion mit einer Kampagne bereitgestellt haben, hängt die Art und Weise, wie sich neue Masseneinträge auf Empfehlungen auswirken, vom verwendeten Domain-Anwendungsfall oder Rezept ab. Weitere Informationen finden Sie unter Wie neue Daten Empfehlungen in Echtzeit beeinflussen.

Filtern Sie Updates nach Bulk-Datensätzen

Innerhalb von 20 Minuten nach Abschluss eines Massenimports aktualisiert Amazon Personalize alle Filter, die Sie in der Datensatzgruppe erstellt haben, mit Ihren neuen Artikel- und Benutzerdaten. Mit diesem Update kann Amazon Personalize die neuesten Daten verwenden, um Empfehlungen für Ihre Benutzer zu filtern.