Recette HRNN-ColdStart (ancienne) - Amazon Personalize

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Recette HRNN-ColdStart (ancienne)

Note

Les recettes HRNN traditionnelles ne sont plus disponibles. Cette documentation est fournie à titre de référence.

Nous vous recommandons d'utiliser la recette aws-user-personalizaton (personnalisation utilisateur) plutôt que les anciennes recettes HRNN. La personnalisation par l'utilisateur améliore et unifie les fonctionnalités proposées par les recettes HRNN. Pour en savoir plus, consultez Recette de personnalisation par l'utilisateur.

Utilisez la recette HRNN-ColdStart pour prévoir les éléments avec lesquels un utilisateur va interagir lorsque vous ajoutez fréquemment de nouveaux éléments et interactions et que vous souhaitez obtenir des recommandations pour ces éléments immédiatement. La recette HRNN-Coldstart est similaire à la recette HRNN-Metadata, mais elle vous permet d'obtenir des recommandations pour de nouveaux éléments.

En outre, vous pouvez utiliser la recette HRNN-Coldstart lorsque vous souhaitez exclure de la formation des éléments qui ont une longue liste d'interactions, soit en raison d'une tendance récente de popularité, soit parce que les interactions peuvent être très inhabituelles et introduire du bruit dans la formation. Avec HRNN-Coldstart, vous pouvez filtrer les éléments moins pertinents pour créer un sous-ensemble pour la formation. Le sous-ensemble d'éléments, appelé éléments froids, est constitué d'éléments présentant des événements d'interaction connexes dans le jeu de données d'interactions entre articles. Un élément est considéré comme un élément froid lorsqu'il contient :

  • Moins d'interactions qu'un nombre spécifié d'interactions maximales. Vous spécifiez cette valeur dans l'hyperparamètre cold_start_max_interactions de la recette.

  • Durée relative plus courte que la durée maximale. Vous spécifiez cette valeur dans l'hyperparamètre cold_start_max_duration de la recette.

Pour réduire le nombre d'éléments froids, définissez une valeur inférieure pour cold_start_max_interactions ou cold_start_max_duration. Pour augmenter le nombre d'éléments froids, définissez une valeur supérieure pour cold_start_max_interactions ou cold_start_max_duration.

HRNN-Coldstart a les limites suivantes pour les éléments froids :

  • Maximum cold start items : 80.000

  • Minimum cold start items : 100

Si le nombre d'éléments froids est en dehors de cette plage, les tentatives de création d'une solution échouent.

La recette HRNN-Coldstart possède les propriétés suivantes :

  • Nomaws-hrnn-coldstart

  • Nom de la ressource Amazon (ARN) de la recettearn:aws:personalize:::recipe/aws-hrnn-coldstart

  • Algorithme ARNarn:aws:personalize:::algorithm/aws-hrnn-coldstart

  • ARN de transformation des fonctionnalitésarn:aws:personalize:::feature-transformation/featurize_coldstart

  • Type de recetteUSER_PERSONALIZATION

Pour en savoir plus, consultez Choisir une recette.

Le tableau suivant décrit les hyper-paramètres de la recette HRNN-Coldstart. Un hyperparamètre est un paramètre d'algorithme que vous pouvez régler pour améliorer les performances du modèle. Les hyperparamètres d'algorithme contrôlent les performances du modèle. Les hyperparamètres d’organisation de fonction contrôlent la façon de filtrer les données à utiliser dans la formation. Le processus de sélection de la meilleure valeur pour un hyperparamètre est appelé optimisation des hyperparamètres (HPO). Pour en savoir plus, consultez Hyperparamètres et HPO.

Le tableau fournit également les informations suivantes pour chaque hyperparamètre :

  • Plage: [lower bound, upper bound]

  • Type de valeur : integer (entier), Continuous (float) [continu (flottant)], Categorical (Boolean, list, string) [catégorique (booléen, liste, chaîne)]

  • HPO tunable (HPO réglable) : le paramètre peut-il participer à HPO ?

Name (Nom) Description
Hyperparamètres de l'algorithme
hidden_dimension

Nombre de variables masquées utilisées dans le modèle. Les variables masquées recréent l'historique des achats des utilisateurs et les statistiques des articles pour générer des scores de classement. Spécifiez un plus grand nombre de dimensions masquées lorsque votre jeu de données d'interactions entre objets inclut des modèles plus complexes. L'utilisation de dimensions masquées nécessite un ensemble de données plus volumineux et plus de temps pour le traitement. Pour décider de la valeur optimale, utilisez HPO. Pour utiliser HPO, définissez performHPO sur true lorsque vous appelez les opérations CreateSolution et CreateSolutionVersion.

Valeur par défaut : 149

Plage : [32, 256]

Type de valeur : entier

HPO personnalisable : oui

bptt

Détermine s'il convient d'utiliser la technique de propagation de retour à travers le temps. La propagation du retour au fil du temps est une technique qui met à jour les pondérations dans les algorithmes récurrents basés sur les réseaux neuronaux. Utilisez bptt pour les crédits à long terme afin de connecter les récompenses retardées à des événements précoces. Par exemple, une récompense retardée peut être un achat effectué après plusieurs clics. Un événement précoce peut être un clic initial. Même dans les mêmes types d'événements, comme un clic, il est judicieux de prendre en compte les effets à long terme et d'optimiser le total des récompenses. Pour prendre en compte les effets à long terme, utilisez des valeurs bptt plus élevées. L'utilisation d'une valeur bptt plus importante nécessite des ensembles de données plus volumineux et plus de temps pour le traitement.

Valeur par défaut : 32

Plage : [2, 32]

Type de valeur : entier

HPO personnalisable : oui

recency_mask

Détermine si le modèle doit prendre en compte les dernières tendances de popularité dans le jeu de données d'interactions entre articles. Les dernières tendances de popularité peuvent inclure des modifications soudaines dans les modèles sous-jacents des événements d'interaction. Pour former un modèle qui accorde plus de poids aux événements récents, définissez recency_mask sur true. Pour former un modèle qui pèse de manière égale toutes les interactions passées, définissez recency_mask sur false. Pour obtenir de bonnes recommandations en utilisant un poids égal, vous pouvez avoir besoin d'un ensemble de données de formation plus grand.

Valeur par défaut : True

Plage : True ou False

Type de valeur : booléen

HPO personnalisable : oui

Hyperparamètres de fonctionnalité
cold_start_max_interactions

Nombre maximal d'interactions utilisateur/élément qu'un élément peut avoir pour être considéré comme un élément froid.

Valeur par défaut : 15

Plage : entiers positifs

Type de valeur : entier

HPO personnalisable : non

cold_start_max_duration

Durée maximale en jours par rapport au point de départ pour qu'une interaction utilisateur/élément soit considérée comme un élément de démarrage à froid. Pour définir le point de départ de l'interaction utilisateur/élément, définissez l'hyper-paramètre cold_start_relative_from.

Valeur par défaut : 5.0

Plage : valeurs flottantes positives

Type de valeur : flottante

HPO personnalisable : non

cold_start_relative_from

Détermine le point de départ du calcul cold_start_max_duration par la recette HRNN-Coldstart. Pour calculer à partir de l'heure actuelle, choisissez currentTime.

Pour effectuer le calcul à cold_start_max_duration partir de l'horodatage du dernier élément du jeu de données d'interactions entre articles, choisissez. latestItem Ce paramètre est utile si vous ajoutez fréquemment de nouveaux éléments.

Valeur par défaut : latestItem

Plage : currentTime, latestItem

Type de valeu : chaîne

HPO personnalisable : non

min_user_history_length_percentile

Le percentile minimal des longueurs d’historique d'utilisateur à inclure dans la formation du modèle. La longueur de l'historique correspond à la quantité totale de données sur un utilisateur. Utilisez min_user_history_length_percentile pour exclure un pourcentage d'utilisateurs avec des longueurs d'historique courtes. Les utilisateurs avec un court historique affichent souvent des modèles basés sur la popularité des éléments plutôt que sur les besoins ou les souhaits personnels de l'utilisateur. Leur suppression peut former des modèles en mettant davantage l'accent sur les modèles sous-jacents dans vos données. Choisissez une valeur appropriée après avoir examiné les longueurs de l'historique utilisateur, à l'aide d'un histogramme ou d'un outil similaire. Nous vous recommandons de définir une valeur qui conserve la majorité des utilisateurs, mais supprime les cas périphériques.

Par exemple, la définition de min__user_history_length_percentile to 0.05 et max_user_history_length_percentile to 0.95 inclut tous les utilisateurs, sauf ceux dont la longueur de l'historique figure dans les 5 % du bas ou du haut.

Valeur par défaut : 0.0

Plage : [0.0, 1.0]

Type de valeur : flottante

HPO personnalisable : non

max_user_history_length_percentile

Le percentile maximal des longueurs d’historique d'utilisateur à inclure dans la formation du modèle. La longueur de l'historique correspond à la quantité totale de données sur un utilisateur. Utilisez max_user_history_length_percentile pour exclure un pourcentage d'utilisateurs avec de longues longueurs d'historique, car les données de ces utilisateurs ont tendance à contenir du bruit. Par exemple, un robot peut avoir une longue liste d'interactions automatisées. La suppression de ces utilisateurs limite le bruit dans la formation. Choisissez une valeur appropriée après avoir examiné les longueurs de l'historique utilisateur, à l'aide d'un histogramme ou d'un outil similaire. Nous vous recommandons de définir une valeur qui conserve la majorité des utilisateurs, mais supprime les cas périphériques.

Par exemple, la définition de min__user_history_length_percentile to 0.05 et max_user_history_length_percentile to 0.95 inclut tous les utilisateurs, sauf ceux dont la longueur de l'historique figure dans les 5 % du bas ou du haut.

Valeur par défaut : 0.99

Plage : [0.0, 1.0]

Type de valeur : flottante

HPO personnalisable : non