Recette de métadonnées HRNN (ancienne) - Amazon Personalize

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Recette de métadonnées HRNN (ancienne)

Note

Les recettes HRNN traditionnelles ne sont plus disponibles. Cette documentation est fournie à titre de référence.

Nous vous recommandons d'utiliser la recette aws-user-personalizaton (personnalisation utilisateur) plutôt que les anciennes recettes HRNN. La personnalisation par l'utilisateur améliore et unifie les fonctionnalités proposées par les recettes HRNN. Pour en savoir plus, consultez Recette de personnalisation par l'utilisateur.

La recette HRNN-Metadata prédit les éléments avec lesquels un utilisateur interagira. Elle est semblable à la recette HRNN, avec des fonctionnalités supplémentaires dérivées des métadonnées contextuelles, d’utilisateurs et d’éléments (respectivement issues des ensembles de données Interactions, Utilisateurs et Éléments). HRNN-Metadata fournit une meilleure précision que les autres modèles sans métadonnées lorsque des métadonnées de haute qualité sont disponibles. L'utilisation de cette recette peut nécessiter des durées de formation plus longues.

La recette HRNN-Metadata possède les propriétés suivantes :

  • Nomaws-hrnn-metadata

  • Nom de la ressource Amazon (ARN) de la recettearn:aws:personalize:::recipe/aws-hrnn-metadata

  • Algorithme ARNarn:aws:personalize:::algorithm/aws-hrnn-metadata

  • ARN de transformation des fonctionnalitésarn:aws:personalize:::feature-transformation/featurize_metadata

  • Type de recetteUSER_PERSONALIZATION

Le tableau suivant décrit les hyper-paramètres de la recette HRNN-Metadata. Un hyperparamètre est un paramètre d'algorithme que vous pouvez régler pour améliorer les performances du modèle. Les hyperparamètres d'algorithme contrôlent les performances du modèle. Les hyperparamètres d’organisation de fonction contrôlent la façon de filtrer les données à utiliser dans la formation. Le processus de sélection de la meilleure valeur pour un hyperparamètre est appelé optimisation des hyperparamètres (HPO). Pour en savoir plus, consultez Hyperparamètres et HPO.

Le tableau fournit également les informations suivantes pour chaque hyperparamètre :

  • Plage: [lower bound, upper bound]

  • Type de valeur : integer (entier), Continuous (float) [continu (flottant)], Categorical (Boolean, list, string) [catégorique (booléen, liste, chaîne)]

  • HPO personnalisable : le paramètre peut-il participer à l'optimisation des hyperparamètres (HPO) ?

Name (Nom) Description
Hyperparamètres d'algorithme
hidden_dimension

Nombre de variables masquées utilisées dans le modèle. Les variables masquées recréent l'historique des achats des utilisateurs et les statistiques des articles pour générer des scores de classement. Spécifiez un plus grand nombre de dimensions masquées lorsque votre jeu de données d'interactions entre objets inclut des modèles plus complexes. L'utilisation de dimensions masquées nécessite un ensemble de données plus volumineux et plus de temps pour le traitement. Pour décider de la valeur optimale, utilisez HPO. Pour utiliser HPO, définissez performHPO sur true lorsque vous appelez les opérations CreateSolution et CreateSolutionVersion.

Valeur par défaut : 43

Plage : [32, 256]

Type de valeur : entier

HPO personnalisable : oui

bptt

Détermine s'il convient d'utiliser la technique de propagation de retour à travers le temps. La propagation du retour au fil du temps est une technique qui met à jour les pondérations dans les algorithmes récurrents basés sur les réseaux neuronaux. Utilisez bptt pour les crédits à long terme afin de connecter les récompenses retardées à des événements précoces. Par exemple, une récompense retardée peut être un achat effectué après plusieurs clics. Un événement précoce peut être un clic initial. Même dans les mêmes types d'événements, comme un clic, il est judicieux de prendre en compte les effets à long terme et d'optimiser le total des récompenses. Pour prendre en compte les effets à long terme, utilisez des valeurs bptt plus élevées. L'utilisation d'une valeur bptt plus importante nécessite des ensembles de données plus volumineux et plus de temps pour le traitement.

Valeur par défaut : 32

Plage : [2, 32]

Type de valeur : entier

HPO personnalisable : oui

recency_mask

Détermine si le modèle doit prendre en compte les dernières tendances de popularité dans le jeu de données d'interactions entre articles. Les dernières tendances de popularité peuvent inclure des modifications soudaines dans les modèles sous-jacents des événements d'interaction. Pour former un modèle qui accorde plus de poids aux événements récents, définissez recency_mask sur true. Pour former un modèle qui pèse de manière égale toutes les interactions passées, définissez recency_mask sur false. Pour obtenir de bonnes recommandations en utilisant un poids égal, vous pouvez avoir besoin d'un ensemble de données de formation plus grand.

Valeur par défaut : True

Plage : True ou False

Type de valeur : booléen

HPO personnalisable : oui

Hyperparamètres de fonctionnalité
min_user_history_length_percentile

Le percentile minimal des longueurs d’historique d'utilisateur à inclure dans la formation du modèle. La longueur de l'historique correspond à la quantité totale de données sur un utilisateur. Utilisez min_user_history_length_percentile pour exclure un pourcentage d'utilisateurs avec des longueurs d'historique courtes. Les utilisateurs avec un court historique affichent souvent des modèles basés sur la popularité des éléments plutôt que sur les besoins ou les souhaits personnels de l'utilisateur. Leur suppression peut former des modèles en mettant davantage l'accent sur les modèles sous-jacents dans vos données. Choisissez une valeur appropriée après avoir examiné les longueurs de l'historique utilisateur, à l'aide d'un histogramme ou d'un outil similaire. Nous vous recommandons de définir une valeur qui conserve la majorité des utilisateurs, mais supprime les cas périphériques.

Par exemple, la définition de min__user_history_length_percentile to 0.05 et max_user_history_length_percentile to 0.95 inclut tous les utilisateurs, sauf ceux dont la longueur de l'historique figure dans les 5 % du bas ou du haut.

Valeur par défaut : 0.0

Plage : [0.0, 1.0]

Type de valeur : flottante

HPO personnalisable : non

max_user_history_length_percentile

Le percentile maximal des longueurs d’historique d'utilisateur à inclure dans la formation du modèle. La longueur de l'historique correspond à la quantité totale de données sur un utilisateur. Utilisez max_user_history_length_percentile pour exclure un pourcentage d'utilisateurs avec de longues longueurs d'historique, car les données de ces utilisateurs ont tendance à contenir du bruit. Par exemple, un robot peut avoir une longue liste d'interactions automatisées. La suppression de ces utilisateurs limite le bruit dans la formation. Choisissez une valeur appropriée après avoir examiné les longueurs de l'historique utilisateur, à l'aide d'un histogramme ou d'un outil similaire. Nous vous recommandons de définir une valeur qui conserve la majorité des utilisateurs, mais supprime les cas périphériques.

Par exemple, la définition de min__user_history_length_percentile to 0.05 et max_user_history_length_percentile to 0.95 inclut tous les utilisateurs, sauf ceux dont la longueur de l'historique figure dans les 5 % du bas ou du haut.

Valeur par défaut : 0.99

Plage : [0.0, 1.0]

Type de valeur : flottante

HPO personnalisable : non