Recette SIMS - Amazon Personalize

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Recette SIMS

Note

Toutes les recettes RELATED_ITEMS utilisent des données d'interactions. Choisissez SIMS si vous souhaitez configurer davantage d'hyperparamètres pour le modèle. Choisissez le Recette d'articles similaires si vous avez des métadonnées d'article et que vous souhaitez qu'Amazon Personalize les utilise pour rechercher des articles similaires.

La recette I tem-to-item similarités (SIMS) utilise un filtrage collaboratif pour recommander les éléments les plus similaires à un élément que vous spécifiez lorsque vous recevez des recommandations. SIMS utilise votre jeu de données sur les interactions entre les articles, et non les métadonnées des articles telles que la couleur ou le prix, pour déterminer la similitude. SIMS identifie la cooccurrence de l'élément dans l'historique des utilisateurs de votre jeu de données Interaction afin de recommander des éléments similaires. Par exemple, avec les cartes SIM, Amazon Personalize peut recommander des articles de café que les clients achètent fréquemment ensemble ou des films que différents utilisateurs regardent également.

Lorsque vous recevez des recommandations d'articles similaires, vous pouvez filtrer les articles en fonction d'un attribut de l'article que vous spécifiez dans votre demande. Pour ce faire, ajoutez unCurrentItem. attributeélément de votre filtre. Pour obtenir un exemple, consultez item data filter examples.

Pour utiliser SIMS, vous devez créer un jeu de données d'interactions entre éléments contenant au moins 1 000 interactions historiques et événementielles uniques (combinées). SIMS n'utilise pas les données d'un jeu de données Users or Items lors de la génération de recommandations. Vous pouvez toujours filtrer les recommandations en fonction des données contenues dans ces ensembles de données. Pour de plus amples informations, veuillez consulter Recommandations de filtrage et segments d'utilisateurs.

Si les données relatives au comportement des utilisateurs ne sont pas suffisantes pour un article ou si le numéro d'article que vous avez fourni est introuvable, SIMS recommande des articles populaires. Après avoir créé une version de solution, assurez-vous de maintenir la version et les données de votre solution à jour. Avec SIMS, vous devez créer manuellement une nouvelle version de solution (modifier le modèle) pour Amazon Personalize afin de prendre en compte les nouveaux éléments à recommander et de mettre à jour le modèle en fonction du comportement le plus récent de votre utilisateur. Vous devez ensuite mettre à jour toute campagne à l'aide de la version de la solution. Pour de plus amples informations, veuillez consulter Maintien de la pertinence des recommandations.

La recette SIMS possède les propriétés suivantes :

  • Nomaws-sims

  • Nom de la ressource Amazon (ARN) de la recettearn:aws:personalize:::recipe/aws-sims

  • Algorithme ARNarn:aws:personalize:::algorithm/aws-sims

  • ARN de transformation des fonctionnalitésarn:aws:personalize:::feature-transformation/sims

  • Type de recetteRELATED_ITEMS

Le tableau suivant décrit les hyper-paramètres de la recette SIMS. Un hyperparamètre est un paramètre d'algorithme que vous pouvez régler pour améliorer les performances du modèle. Les hyperparamètres d'algorithme contrôlent les performances du modèle. Les hyperparamètres d’organisation de fonction contrôlent la façon de filtrer les données à utiliser dans la formation. Le processus de sélection de la meilleure valeur pour un hyperparamètre est appelé optimisation des hyperparamètres (HPO). Pour de plus amples informations, veuillez consulter Hyperparamètres et HPO.

Le tableau fournit également les informations suivantes pour chaque hyperparamètre :

  • Plage: [lower bound, upper bound]

  • Type de valeur : integer (entier), Continuous (float) [continu (flottant)], Categorical (Boolean, list, string) [catégorique (booléen, liste, chaîne)]

  • HPO personnalisable : le paramètre peut-il participer à l'optimisation des hyperparamètres (HPO) ?

Name (Nom) Description
Hyperparamètres de l'algorithme
popularity_discount_factor

Configurez l'influence de la popularité sur les recommandations. Spécifiez une valeur proche de zéro pour inclure les articles les plus populaires. Spécifiez une valeur plus proche de 1 pour mettre moins l'accent sur la popularité.

Valeur par défaut : 0.5

Plage : [0.0, 1.0]

Type de valeur : flottante

HPO personnalisable : oui

min_cointeraction_count

Nombre minimal de co-interactions dont vous avez besoin pour calculer la similarité entre une paire d'éléments. Par exemple, la valeur 3 signifie que vous avez besoin de trois utilisateurs ou plus ayant interagi avec les deux éléments pour que l'algorithme calcule leur similarité.

Valeur par défaut : 3

Plage : [0, 10]

Type de valeur : entier

HPO personnalisable : oui

Hyperparamètres de fonctionnalité
min_user_history_length_percentile

Le percentile minimal des longueurs d’historique d'utilisateur à inclure dans la formation du modèle. La longueur de l'historique correspond à la quantité totale de données disponibles sur un utilisateur. Utilisez min_user_history_length_percentile pour exclure un pourcentage d'utilisateurs avec des longueurs d'historique courtes. Les utilisateurs avec un court historique affichent souvent des modèles basés sur la popularité des éléments plutôt que sur les besoins ou les souhaits personnels de l'utilisateur. Leur suppression peut former des modèles en mettant davantage l'accent sur les modèles sous-jacents dans vos données. Choisissez une valeur appropriée après avoir examiné les longueurs de l'historique utilisateur, à l'aide d'un histogramme ou d'un outil similaire. Nous vous recommandons de définir une valeur qui conserve la majorité des utilisateurs, mais supprime les cas périphériques.

Valeur par défaut : 0.005

Plage : [0.0, 1.0]

Type de valeur : flottante

HPO personnalisable : non

max_user_history_length_percentile

Le percentile maximal des longueurs d’historique d'utilisateur à inclure dans la formation du modèle. La longueur de l'historique correspond à la quantité totale de données disponibles sur un utilisateur. Utilisez max_user_history_length_percentile pour exclure un pourcentage d'utilisateurs avec de longues longueurs d'historique. Les utilisateurs dont l'historique est long ont tendance à contenir du bruit. Par exemple, un robot peut avoir une longue liste d'interactions automatisées. La suppression de ces utilisateurs limite le bruit dans la formation. Choisissez une valeur appropriée après avoir examiné les longueurs de l'historique utilisateur, à l'aide d'un histogramme ou d'un outil similaire. Nous vous recommandons de définir une valeur qui conserve la majorité des utilisateurs, mais supprime les cas périphériques.

Par exemple, min_hist_length_percentile = 0.05 et max_hist_length_percentile = 0.95 incluent tous les utilisateurs, sauf ceux dont la longueur de l'historique figure dans les 5 % du bas ou du haut.

Valeur par défaut : 0.995

Plage : [0.0, 1.0]

Type de valeur : flottante

HPO personnalisable : non

min_item_interaction_count_percentile

Le percentile minimal du nombre d’interactions d’éléments à inclure dans la formation du modèle. Utilisez min_item_interaction_count_percentile pour exclure un pourcentage d'éléments avec un historique court des interactions. Les éléments avec un historique court sont souvent de nouveaux éléments. Leur suppression peut entraîner des modèles en mettant davantage l'accent sur les éléments ayant un historique connu. Choisissez une valeur appropriée après avoir examiné les longueurs de l'historique utilisateur, à l'aide d'un histogramme ou d'un outil similaire. Nous vous recommandons de définir une valeur qui conserve la majorité des éléments, mais supprime les cas périphériques.

Valeur par défaut : 0.01

Plage : [0.0, 1.0]

Type de valeur : flottante

HPO personnalisable : non

max_item_interaction_count_percentile

Le percentile maximal du nombre d’interactions d’éléments à inclure dans la formation du modèle. Utilisez max_item_interaction_count_percentile pour exclure un pourcentage d'éléments avec un historique court des interactions. Les éléments dont l'historique est long ont tendance à être plus anciens et peuvent ne pas être à jour. Par exemple, une version de film qui est épuisée. La suppression de ces éléments peut se concentrer sur des éléments plus pertinents. Choisissez une valeur appropriée après avoir examiné les longueurs de l'historique utilisateur, à l'aide d'un histogramme ou d'un outil similaire. Nous vous recommandons de définir une valeur qui conserve la majorité des éléments, mais supprime les cas périphériques.

Par exemple, min_item_interaction_count_percentile = 0.05 et max_item_interaction_count_percentile = 0.95 incluent tous les éléments, à l'exception de ceux dont le nombre d'interactions est inférieur ou supérieur à 5 %.

Valeur par défaut : 0.9

Plage : [0.0, 1.0]

Type de valeur : flottante

HPO personnalisable : non

Exemple de bloc-notes SIMS

Pour obtenir un exemple de bloc-notes Jupyter qui vous montre comment utiliser la recette SIMS, veuillez consulter Finding similar items + HPO.