Elementedatensatz - Amazon Personalize

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Elementedatensatz

Zu den Artikeldaten, die Sie in Amazon Personalize importieren können, gehören numerische und kategoriale Metadaten wie Erstellungszeitstempel, Preis, Genre, Beschreibung und Verfügbarkeit. Sie importieren Metadaten zu Ihren Artikeln in einen Amazon Personalize Items-Datensatz.

Amazon Personalize verwendet beim Training keine unkategorischen Zeichenkettendaten wie Artikeltitel oder Autorendaten. Einige Funktionen von Amazon Personalize verwenden diese Daten jedoch, um Empfehlungen zu verbessern. Weitere Informationen finden Sie unter Nicht kategorische Zeichenkettendaten.

Die maximale Anzahl von Metadatenspalten beträgt 100. Die maximale Anzahl von Artikeln, die Amazon Personalize während der Schulung berücksichtigt, hängt von Ihrem Anwendungsfall oder Ihrer Rezeptur ab. Nur Artikel, die während der Schulung berücksichtigt wurden, können in Empfehlungen erscheinen.

  • Für User-Personalization-v2 oder Personalized-Ranking-v2 beträgt die maximale Anzahl von Elementen, die von einem Modell während des Trainings berücksichtigt werden, 5 Millionen. Diese Elemente stammen sowohl aus dem Datensatz „Artikel“ als auch aus dem Datensatz „Artikelinteraktionen“.

  • Für alle Domain-Anwendungsfälle und benutzerdefinierten Rezepte mit Ausnahme von User-Personalization-v2 und Personalized-ranking-v2 beträgt die maximale Anzahl von Elementen, die von einem Modell beim Training und bei der Generierung von Empfehlungen berücksichtigt werden, 750.000.

Weitere Ein Rezept wählen Informationen zu Rezeptanforderungen finden Sie unter.

Dieses Thema enthält Informationen zu den folgenden Typen von Artikeldaten:

Zeitstempeldaten der Erstellung

Amazon Personalize verwendet Zeitstempeldaten der Erstellung (im Zeitformat Unix-Epoche, in Sekunden), um das Alter eines Artikels zu berechnen und die Empfehlungen entsprechend anzupassen.

Wenn Daten zum Erstellungszeitstempel für einen oder mehrere Artikel fehlen, leitet Amazon Personalize diese Informationen aus etwaigen Interaktionsdaten ab und verwendet den Zeitstempel der ältesten Interaktionsdaten des Artikels als Erstellungszeitstempel des Artikels. Wenn ein Artikel keine Interaktionsdaten hat, wird sein Erstellungszeitstempel als Zeitstempel der letzten Interaktion im Trainingssatz festgelegt und Amazon Personalize betrachtet ihn als neuen Artikel.

Kategorische Metadaten

Bei bestimmten Rezepten und Domains verwendet Amazon Personalize kategorische Metadaten, wie z. B. das Genre oder die Farbe eines Artikels, um zugrunde liegende Muster zu identifizieren, anhand derer die relevantesten Artikel für Ihre Benutzer sichtbar werden. Sie definieren Ihren eigenen Wertebereich auf der Grundlage Ihres Anwendungsfalls. Kategorische Metadaten können in jeder Sprache verfasst sein.

Bei allen Rezepten und Domänen können Sie kategoriale Daten importieren und sie verwenden, um Empfehlungen auf der Grundlage der Attribute eines Artikels zu filtern. Informationen zum Filtern von Empfehlungen finden Sie unterEmpfehlungen und Benutzersegmente filtern.

Kategorische Werte können maximal 1000 Zeichen lang sein. Wenn Sie ein Element mit einem kategorialen Wert mit mehr als 1000 Zeichen haben, schlägt Ihr Datensatz-Importjob fehl.

Für Domain-Datensatzgruppen verwenden sowohl die Domänen VIDEO_ON_DEMAND als auch E-COMMERCE kategoriale Metadaten. Für benutzerdefinierte Datensatzgruppen und benutzerdefinierte Lösungen umfassen Rezepte, die kategoriale Metadaten verwenden, Folgendes:

Unstrukturierte Textmetadaten

Bei bestimmten Rezepten und Domains kann Amazon Personalize aussagekräftige Informationen aus unstrukturierten Textmetadaten wie Produktbeschreibungen, Produktrezensionen oder Filmzusammenfassungen extrahieren. Amazon Personalize verwendet unstrukturierten Text, um relevante Artikel für Ihre Benutzer zu identifizieren, insbesondere wenn Artikel neu sind oder weniger Interaktionsdaten enthalten. Nehmen Sie unstrukturierte Textdaten in Ihren Artikeldatensatz auf, um die Klickraten und Konversationsraten für neue Artikel in Ihrem Katalog zu erhöhen.

Um unstrukturierte Daten zu verwenden, fügen Sie Ihrem Artikelschema ein Feld mit Typ string hinzu und legen Sie das Feldattribut auf fest. textual true Sie können höchstens ein Textfeld hinzufügen. Nehmen Sie dann die Textdaten in Ihre CSV-Massendatei und die Importe einzelner Artikel auf.

Setzen Sie bei CSV-Massendateien den Text in doppelte Anführungszeichen und entfernen Sie alle Zeilenumbrüche. Verwenden Sie das \ Zeichen, um doppelte Anführungszeichen oder\ -Zeichen in Ihren Daten zu maskieren. Ein Beispiel für ein Artikelschema mit einem Feld für unstrukturierte Textdaten finden Sie unterBeispiel für ein Artikel-Dataset-Schema (benutzerdefiniert). Amazon Personalize schneidet Textfelder bis zur Zeichenbeschränkung ab. Stellen Sie sicher, dass sich die relevantesten Informationen im Text am Anfang des Felds befinden. Informationen zum Importieren von Daten in Amazon Personalize finden Sie unterSchritt 2: Daten vorbereiten und importieren.

Unstrukturierte Textwerte können in allen Sprachen außer Chinesisch und Japanisch höchstens 20.000 Zeichen enthalten. Für Chinesisch und Japanisch können Sie maximal 7.000 Zeichen verwenden. Amazon Personalize kürzt Werte, die die Zeichenbeschränkung überschreiten, auf die Zeichenbeschränkung.

Text kann in den folgenden Sprachen verfasst werden:

  • Chinesisch (vereinfacht)

  • Chinesisch (traditionell)

  • Englisch

  • Französisch

  • Deutsch

  • Japanisch

  • Portugiesisch

  • Spanisch

Sie können unstrukturierte Textelemente in mehreren Sprachen einreichen, aber der Text jedes Elements sollte nur in einer Sprache verfasst sein.

Für Domain-Datensatzgruppen verwenden sowohl die Domänen VIDEO_ON_DEMAND als auch E-COMMERCE Textmetadaten. Für benutzerdefinierte Datensatzgruppen und benutzerdefinierte Lösungen umfassen Rezepte, die Textmetadaten verwenden, Folgendes:

Nicht kategorische Zeichenkettendaten

Mit Ausnahme von Artikel-IDs verwendet Amazon Personalize beim Training keine nicht kategorischen Zeichenkettendaten, wie Artikeltitel oder Autorendaten. Amazon Personalize kann es jedoch mit den folgenden Funktionen verwenden:

  • Amazon Personalize kann Artikelmetadaten in Empfehlungen aufnehmen, einschließlich nicht kategorischer Zeichenkettenwerte. Sie können Metadaten verwenden, um Empfehlungen auf Ihrer Benutzeroberfläche zu erweitern, z. B. um den Namen des Regisseurs zu einem Karussell mit Filmempfehlungen hinzuzufügen. Weitere Informationen finden Sie unter Artikelmetadaten in Empfehlungen.

  • Wenn Sie dies verwendenÄhnliche Elemente, können Sie Batch-Empfehlungen mit Themen generieren. Wenn Sie Batch-Empfehlungen mit Themen generieren, müssen Sie im Batch-Inferenzjob eine Spalte mit dem Elementnamen angeben. Weitere Informationen finden Sie unter Batch-Empfehlungen mit Themen aus dem Content Generator.

  • Sie können Filter erstellen, um Elemente auf der Grundlage von Zeichenkettendaten, die nicht kategorisch sind, in Empfehlungen aufzunehmen oder daraus zu entfernen. Weitere Informationen zu Filtern finden Sie unter Empfehlungen und Benutzersegmente filtern.