SIMS-Rezept - Amazon Personalize

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

SIMS-Rezept

Anmerkung

Alle RELATED_ITEMS-Rezepte verwenden Interaktionsdaten. Wählen Sie SIMS, wenn Sie mehr Hyperparameter für das Modell konfigurieren möchten. Wählen Sie, Rezept für ähnliche Artikel ob Sie Artikelmetadaten haben und möchten, dass Amazon Personalize diese verwendet, um ähnliche Artikel zu finden.

Das Rezept für Item-to-item Ähnlichkeiten (SIMS) verwendet kollaborative Filterung, um Artikel zu empfehlen, die einem von Ihnen angegebenen Artikel am ähnlichsten sind, wenn Sie Empfehlungen erhalten. SIMS verwendet Ihren Datensatz mit Artikelinteraktionen und nicht anhand von Artikelmetadaten wie Farbe oder Preis, um Ähnlichkeit zu ermitteln. SIMS identifiziert das gleichzeitige Vorkommen des Elements in den Benutzerhistorien in Ihrem Interaktionsdatensatz, um ähnliche Artikel zu empfehlen. Mit SIMS könnte Amazon Personalize beispielsweise Coffeeshop-Artikel empfehlen, die Kunden häufig zusammen gekauft haben, oder Filme, die sich auch verschiedene Benutzer angesehen haben.

Wenn Sie ähnliche Artikelempfehlungen erhalten, können Sie die Artikel anhand eines Attributs des Artikels filtern, das Sie in Ihrer Anfrage angegeben haben. Sie tun dies, indem Sie eine hinzufügenCurrentItem. attributeElement zu Ihrem Filter. Ein Beispiel finden Sie unter item data filter examples.

Um SIMS verwenden zu können, müssen Sie einen Datensatz mit Artikelinteraktionen mit mindestens 1000 eindeutigen historischen Interaktionen und Ereignissen (kombiniert) erstellen. SIMS verwendet bei der Generierung von Empfehlungen keine Daten in einem Benutzer- oder Artikeldatensatz. Sie können weiterhin Empfehlungen auf der Grundlage von Daten in diesen Datensätzen filtern. Weitere Informationen finden Sie unter Empfehlungen und Benutzersegmente filtern.

Wenn für einen Artikel nicht genügend Daten zum Nutzerverhalten vorliegen oder die von Ihnen angegebene Artikel-ID nicht gefunden wird, empfiehlt SIMS beliebte Artikel. Nachdem Sie eine Lösungsversion erstellt haben, stellen Sie sicher, dass Sie Ihre Lösungsversion und die Daten auf dem neuesten Stand halten. Mit SIMS müssen Sie manuell eine neue Lösungsversion erstellen (das Modell neu trainieren), damit Amazon Personalize neue Elemente für Empfehlungen berücksichtigt und das Modell mit dem neuesten Verhalten Ihres Benutzers aktualisieren kann. Anschließend müssen Sie alle Kampagnen aktualisieren, die die Lösungsversion verwenden. Weitere Informationen finden Sie unter Beibehaltung der Relevanz von Empfehlungen.

Das SIMS-Rezept hat die folgenden Eigenschaften:

  • Name (Nameaws-sims

  • Rezept Amazon-Ressourcenname (ARN)arn:aws:personalize:::recipe/aws-sims

  • Algorithmus ARNarn:aws:personalize:::algorithm/aws-sims

  • Merkmalstransformation ARNarn:aws:personalize:::feature-transformation/sims

  • Art des RezeptsRELATED_ITEMS

In der folgenden Tabelle werden die Hyperparameter für das SIMS-Rezept beschrieben. Ein Hyperparameter ist ein Algorithmusparameter, den Sie anpassen können, um die Modellleistung zu verbessern. Algorithmus-Hyperparameter steuern die Leistung des Modells. Hyperparameter zur Entwicklung von Funktionen steuern, wie die Daten für die Schulung gefiltert werden. Die Auswahl des besten Werts für einen Hyperparameter wird als Hyperparameteroptimierung (HPO) bezeichnet. Weitere Informationen finden Sie unter Hyperparameter und HPO.

Die Tabelle enthält auch die folgenden Informationen für jeden Hyperparameter:

  • Bereich: [Untergrenze, Obergrenze]

  • Werttyp: Ganzzahl, kontinuierlich (float), kategorisch (boolean, Liste, Zeichenfolge)

  • HPO optimierbar: Kann der Parameter an der Hyperparameteroptimierung (HPO) teilnehmen?

Name Beschreibung
Hyperparameter des Algorithmus
popularity_discount_factor

Konfigurieren Sie, wie Beliebtheit Empfehlungen beeinflusst. Geben Sie einen Wert näher an Null an, um populärere Artikel einzubeziehen. Geben Sie einen Wert an, der näher an eins liegt, um der Beliebtheit weniger Bedeutung beizumessen.

Standardwert: 0.5

Bereich: [0,0, 1,0].

Werttyp: Gleitkommazahl

HPO-optimierbar: Ja

min_cointeraction_count

Die Mindestanzahl von Co-Interaktionen, die Sie benötigen, um die Ähnlichkeit zwischen einem Elementpaar zu berechnen. Ein Wert von 3 bedeutet beispielsweise, dass Sie drei oder mehr Benutzer benötigen, die mit beiden Elementen interagiert haben, um ihre Ähnlichkeit zu berechnen.

Standardwert: 3

Bereich: [0, 10].

Werttyp: Ganzzahl

HPO-optimierbar: Ja

Hyperparameter zur Featureinstellung
min_user_history_length_percentile

Das Mindestperzentil der Benutzerhistorienlängen, das in die Modellschulung einbezogen werden muss. Die Historienlänge ist die Gesamtmenge der verfügbaren Daten für einen Benutzer. Verwenden Sie min_user_history_length_percentile, um einen Prozentsatz von Benutzern mit kurzen Historienlängen auszuschließen. Benutzer mit einer kurzen Historie zeigen häufig Muster basierend auf der Beliebtheit von Elementen anstelle der persönlichen Bedürfnisse oder Wünsche des Benutzers. Wenn Sie diese entfernen, können Sie Modelle schulen, die sich stärker auf die zugrunde liegenden Muster in Ihren Daten konzentrieren. Wählen Sie einen geeigneten Wert aus, nachdem Sie die Längen der Benutzerhistorien mithilfe eines Histogramms oder eines ähnlichen Tools überprüft haben. Wir empfehlen, den Wert so festzulegen, dass die meisten Benutzer beibehalten, aber die Grenzfälle entfernt werden.

Standardwert: 0.005

Bereich: [0,0, 1,0].

Werttyp: Gleitkommazahl

HPO-optimierbar: Nein

max_user_history_length_percentile

Das maximale Perzentil der Benutzerhistorienlänge, das in die Modellschulung einbezogen werden kann. Die Historienlänge ist die Gesamtmenge der verfügbaren Daten für einen Benutzer. Verwenden Sie max_user_history_length_percentile, um einen Prozentsatz von Benutzern mit langen Historienlängen auszuschließen. Benutzer mit einer langen Historie neigen dazu, Rauschen zu erzeugen. Beispielsweise kann ein Roboter über eine lange Liste automatisierter Interaktionen verfügen. Durch das Entfernen dieser Benutzer werden Störungen der Schulung eingeschränkt. Wählen Sie einen geeigneten Wert, nachdem Sie die Längen der Benutzerhistorien mit einem Histogramm oder einem ähnlichen Tool überprüft haben. Wir empfehlen, den Wert so festzulegen, dass die meisten Benutzer beibehalten, aber die Grenzfälle entfernt werden.

Wenn Sie beispielsweise min_hist_length_percentile = 0.05 und max_hist_length_percentile = 0.95 festlegen, werden alle Benutzer berücksichtigt, mit Ausnahme der unteren und oberen 5 % in Bezug auf ihre Historienlängen.

Standardwert: 0,995

Bereich: [0,0, 1,0].

Werttyp: Gleitkommazahl

HPO-optimierbar: Nein

min_item_interaction_count_percentile

Das minimale Perzentil der Element-Interaktionsanzahl, das in die Modellschulung einbezogen werden kann. Verwenden Sie min_item_interaction_count_percentile, um einen Prozentsatz von Elementen mit einer kurzen Historie von Interaktionen auszuschließen. Elemente mit einer kurzen Historie sind häufig neue Elemente. Wenn Sie sie entfernen, können Sie Modelle schulen, die sich stärker auf Elemente mit einer bekannten Historie konzentrieren. Wählen Sie einen geeigneten Wert aus, nachdem Sie die Längen der Benutzerhistorien mithilfe eines Histogramms oder eines ähnlichen Tools überprüft haben. Wir empfehlen, den Wert so festzulegen, dass die meisten Elemente beibehalten, aber die Grenzfälle entfernt werden.

Standardwert: 0.01

Bereich: [0,0, 1,0].

Werttyp: Gleitkommazahl

HPO-optimierbar: Nein

max_item_interaction_count_percentile

Das maximale Perzentil der Element-Interaktion zählt, um in die Modellschulung einbezogen zu werden. Verwenden Sie max_item_interaction_count_percentile, um einen Prozentsatz von Elementen mit einer langen Historie von Interaktionen auszuschließen. Elemente mit einer langen Historie sind in der Regel älter und können veraltet sein. Beispiel: Eine Film-DVD, die vergriffen ist. Das Entfernen dieser Elemente führt dazu, dass man sich auf relevantere Elemente konzentriert. Wählen Sie einen geeigneten Wert, nachdem Sie die Längen der Benutzerhistorien mit einem Histogramm oder einem ähnlichen Tool überprüft haben. Wir empfehlen, den Wert so festzulegen, dass die meisten Elemente beibehalten, aber die Grenzfälle entfernt werden.

Wenn Sie beispielsweise min_item_interaction_count_percentile = 0.05 und max_item_interaction_count_percentile = 0.95 festlegen, werden alle Elemente berücksichtigt, mit Ausnahme der unteren und oberen 5 % in Bezug auf ihre Interaktionsanzahl.

Standardwert: 0.9

Bereich: [0,0, 1,0].

Werttyp: Gleitkommazahl

HPO-optimierbar: Nein

SIMS-Beispielnotizbuch

Ein Beispiel eines Jupyter-Notizbuchs zur Verwendung des SIMS-Rezepts finden Sie unter Finding similar items + HPO (Suchen von ähnlichen Elementen + HPO).