Ensembles de données et schémas personnalisés - Amazon Personalize

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Ensembles de données et schémas personnalisés

Lorsque vous créez un groupe de jeux de données personnalisé, vous créez vos propres schémas à partir de zéro. Les ensembles de données et les schémas de groupes de jeux de données personnalisés comportent moins de champs obligatoires et sont plus flexibles. Les rubriques suivantes expliquent le schéma et les exigences en matière de données pour les ensembles de données d'un groupe de jeux de données personnalisé. Chaque section du jeu de données répertorie les données requises pour le type de jeu de données et fournit un JSON exemple de schéma.

Pour plus d'informations sur les types de données que vous pouvez importer dans Amazon Personalize, consultezTypes de données qu'Amazon Personalize peut utiliser. Pour plus d'informations sur les exigences générales du schéma Amazon Personalize, telles que les exigences de mise en forme et les types de données de champ disponibles, consultezCréation de JSON fichiers de schéma pour vos données. Ces exigences s'appliquent à tous les schémas Amazon Personalize.

Exigences relatives aux ensembles de données et aux schémas personnalisés

Lorsque vous créez un ensemble de données pour un groupe de jeux de données personnalisé, chaque type de jeu de données comporte les champs obligatoires et les mots clés réservés suivants avec les types de données requis.

Type d'ensemble de données Champs obligatoires Mots-clés réservés
Interactions entre éléments (exemple de schéma)

USER_ID () string

ITEM_ID () string

TIMESTAMP (long)

EVENT_TYPE (string)

EVENT_VALUE (float, null)

IMPRESSION (string, null)

RECOMMENDATION_ID (string,null)

EVENT_ATTRIBUTION_SOURCE (string, null)

Utilisateurs (exemple de schéma)

USER_ID () string

1 champ de métadonnées (catégorique string ou numérique)

Éléments (exemple de schéma)

ITEM_ID () string

1 champ de métadonnées (champ catégorique ou textuel ou string champ numérique)

CREATION_TIMESTAMP (long)

Actions (exemple de schéma)

ACTION_ID () string

1 champ de métadonnées (catégorique string ou numérique)

CREATION_TIMESTAMP (long)

VALUE (long, null)

TYPE (string, null)

EXPIRATION_TIMESTAMP (long, null)

REPEAT_FREQUENCY (long, null)

Interactions entre actions (exemple de schéma)

USER_ID () string

ACTION_ID () string

EVENT_TYPE (string)

TIMESTAMP (long)

IMPRESSION (string, null)

RECOMMENDATION_ID (string,null)

Champs de métadonnées

Les métadonnées incluent des champs sous forme de chaîne ou non sous forme de chaîne qui ne sont pas obligatoires ou qui n'utilisent pas de mot clé réservé. Les schémas de métadonnées sont soumis aux restrictions suivantes :

  • Les schémas d'utilisateurs, d'éléments et d'actions nécessitent au moins un champ de métadonnées.

  • Vous pouvez ajouter au maximum 25 champs de métadonnées pour un schéma Users, 100 champs de métadonnées pour un schéma Items et 10 champs de métadonnées pour un schéma Actions.

  • Si vous ajoutez votre propre champ de métadonnées de typestring, il doit inclure l'categoricalattribut ou l'textualattribut (seuls les schémas Items prennent en charge les champs avec l'attribut textuel). Sinon, Amazon Personalize n'utilisera pas le champ lors de la formation d'un modèle.

Mots-clés réservés

Les mots clés réservés sont des champs facultatifs qui ne sont pas des champs de métadonnées. Ces champs sont considérés comme réservés car vous devez définir les champs comme leur type de données obligatoire lorsque vous les utilisez, et les mots clés ne peuvent pas être utilisés comme valeurs dans vos données. Les champs de chaîne catégorielle réservés doivent être categorical définis surtrue, tandis que les champs de chaîne réservés ne peuvent pas être catégoriques. Les mots clés suivants sont réservés :

  • EVENT_ TYPE : Pour les ensembles de données d'interactions entre éléments comportant un ou plusieurs types d'événements, tels que le clic et le téléchargement, utilisez un EVENT_TYPE champ. Vous devez définir un TYPE champ EVENT _ comme un string et ne pouvez pas être défini comme catégorique.

  • EVENT_ VALUE : Pour les ensembles de données d'interactions entre articles qui incluent des données de valeur relatives à des événements, telles que le pourcentage d'une vidéo regardée par un utilisateur, utilisez un EVENT_VALUE champ avec un type float et éventuellement null un champ.

  • CREATION_ TIMESTAMP : Pour les ensembles de données d'éléments ou d'actions avec un horodatage pour la date de création de chaque élément, utilisez un CREATION_TIMESTAMP champ avec un type. long Amazon Personalize utilise CREATION_TIMESTAMP les données pour calculer l'âge d'un article et ajuster les recommandations en conséquence. Consultez Données d'horodatage de création.

  • IMPRESSION: Pour les ensembles de données d'interactions entre articles contenant des données d'impressions explicites, utilisez un IMPRESSION champ avec un type String et éventuellement un typenull. Les impressions sont des listes d'éléments visibles par un utilisateur lorsqu'il interagissait avec un élément en particulier (par exemple, en cliquant ou en regardant). Pour de plus amples informations, veuillez consulter Données sur les impressions.

  • RECOMMENDATION_ID : pour les ensembles de données d'interactions entre articles qui utilisent les recommandations précédentes comme données d'impressions implicites, utilisez éventuellement un RECOMMENDATION_ID champ avec type String et éventuellement type. null

    Il n'est pas nécessaire d'ajouter un RECOMMENDATION_ID champ pour qu'Amazon Personalize utilise les impressions implicites lors de la génération de recommandations. Vous pouvez réussir recommendationId une PutEvents opération sans elle. Pour de plus amples informations, veuillez consulter Données sur les impressions.

  • VALUE: Pour les ensembles de données Actions, si vous disposez de données de valeur pour certaines ou toutes vos actions, ajoutez un VALUE champ à votre schéma. Pour son type, utilisez long et tapez éventuellementnull. Pour plus d'informations sur les actions et leur valeur, consultezDonnées de valeur.

  • ACTION_ EXPIRATION _ TIMESTAMP : Pour les ensembles de données Actions, si vous avez un horodatage d'expiration pour certaines ou toutes vos actions, ajoutez un ACTION_EXPIRATION_TIMESTAMP champ à votre schéma. Pour son type, utilisez long et tapez éventuellementnull. Pour plus d'informations sur les horodatages d'expiration, consultez. Données d'horodatage d'expiration des actions

  • REPEAT_ FREQUENCY : Pour les ensembles de données Actions, si vous disposez de données de fréquence de répétition pour certaines ou toutes vos actions, ajoutez un REPEAT_FREQUENCY champ à votre schéma. Pour son type, utilisez long et tapez éventuellementnull. Pour plus d'informations sur les données de fréquence de répétition, consultezRépéter les données de fréquence.