Daten transformieren - Amazon Personalize

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Daten transformieren

Um Daten in Data Wrangler zu transformieren, fügen Sie Ihrem Datenfluss einen Transformationsschritt hinzu. Data Wrangler umfasst über 300 Transformationen, mit denen Sie Ihre Daten aufbereiten können, darunter eine Transformation mit Kartenspalten für Amazon Personalize. Und Sie können die allgemeinen Data Wrangler-Transformationen verwenden, um Probleme wie Ausreißer, Typprobleme und fehlende Werte zu beheben.

Nachdem Sie Ihre Daten transformiert haben, können Sie sie mit Data Wrangler analysieren. Oder, wenn Sie mit der Vorbereitung Ihrer Daten in Data Wrangler fertig sind, können Sie sie verarbeiten und in Amazon Personalize importieren. Informationen zur Analyse von Daten finden Sie unter. Generierung von Visualisierungen und Dateneinblicken Hinweise zum Verarbeiten und Importieren von Daten finden Sie unterDaten verarbeiten und in Amazon Personalize importieren.

Zuordnen von Spalten für Amazon Personalize

Um Ihre Daten so zu transformieren, dass sie die Anforderungen von Amazon Personalize erfüllen, fügen Sie die Transformation Map-Spalten für Amazon Personalize hinzu und ordnen Ihre Spalten den erforderlichen und optionalen Feldern für Amazon Personalize zu.

So verwenden Sie die Map-Spalten für die Amazon Personalize Personalize-Transformation
  1. Wählen Sie + für Ihre letzte Transformation und wählen Sie Transformation hinzufügen. Wenn Sie keine Transformation hinzugefügt haben, wählen Sie + für die Transformation der Datentypen. Data Wrangler fügt diese Transformation automatisch zu Ihrem Flow hinzu.

  2. Wählen Sie Schritt hinzufügen.

  3. Wählen Sie Transforms for Amazon Personalize. Die Transformation Kartenspalten für Amazon Personalize ist standardmäßig ausgewählt.

  4. Verwenden Sie die Transformationsfelder, um Ihre Daten den erforderlichen Amazon Personalize-Attributen zuzuordnen.

    1. Wählen Sie den Datensatztyp, der Ihren Daten entspricht (Interaktionen, Artikel oder Benutzer).

    2. Wählen Sie Ihre Domain (ECOMMERCE, VIDEO _ON_ DEMAND oder benutzerdefiniert). Die von Ihnen gewählte Domäne muss mit der Domäne übereinstimmen, die Sie bei der Erstellung Ihrer Datensatzgruppe angegeben haben.

    3. Wählen Sie die Spalten aus, die den erforderlichen und optionalen Feldern für Amazon Personalize entsprechen. Wählen Sie beispielsweise für die Spalte item_ID die Spalte in Ihren Daten aus, in der die eindeutigen Identifikationsinformationen für jeden Ihrer Artikel gespeichert sind.

      Jedes Spaltenfeld wird nach Datentyp gefiltert. Nur die Spalten in Ihren Daten, die die Amazon Personalize Personalize-Datentypanforderungen erfüllen, sind verfügbar. Wenn Ihre Daten nicht dem erforderlichen Typ entsprechen, können Sie die Wrangler-Transformation „Wert als Typ analysieren“ verwenden, um sie zu konvertieren.

Allgemeine Daten: Wrangler-Transformationen

Die folgenden allgemeinen Data Wrangler-Transformationen können Ihnen bei der Vorbereitung von Daten für Amazon Personalize helfen:

  • Datentypkonvertierung: Wenn Ihr Feld in der Transformation Map-Spalten für Amazon Personalize nicht als mögliche Option aufgeführt ist, müssen Sie möglicherweise seinen Datentyp konvertieren. Die Data Wrangler-Transformation „Wert als Typ analysieren“ kann Ihnen bei der Konvertierung Ihrer Daten helfen. Oder Sie können die Datentypentransformation verwenden, die Data Wrangler standardmäßig hinzufügt, wenn Sie einen Flow erstellen. Um diese Transformation zu verwenden, wählen Sie den Datentyp aus den Dropdownlisten Typ aus, wählen Vorschau und dann Aktualisieren aus.

    Informationen zu den erforderlichen Datentypen für Felder finden Sie im Abschnitt für Ihre Domäne und Ihren Datensatztyp unterJSONSchemadateien für Amazon Personalize Personalize-Schemas erstellen.

  • Umgang mit fehlenden Werten und Ausreißern: Wenn Sie Erkenntnisse über fehlende Werte oder Ausreißer generieren, können Sie die Data Wrangler-Transformationen „Ausreißer behandeln“ und „Fehlende Werte behandeln“ verwenden, um diese Probleme zu lösen.

  • Benutzerdefinierte Transformationen: Mit Data Wrangler können Sie Ihre eigenen Transformationen mit Python (benutzerdefinierte Funktion) PySpark, Pandas oder () erstellen. PySpark SQL Sie können eine benutzerdefinierte Transformation verwenden, um Aufgaben wie das Löschen doppelter Spalten oder das Gruppieren nach Spalten auszuführen. Weitere Informationen finden Sie unter Benutzerdefinierte Transformationen im Amazon SageMaker Developer Guide.