Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Ensembles de données et schémas personnalisés
Lorsque vous créez un groupe de jeux de données personnalisé, vous créez vos propres schémas à partir de zéro. Les ensembles de données et les schémas de groupes de jeux de données personnalisés comportent moins de champs obligatoires et sont plus flexibles. Les rubriques suivantes expliquent le schéma et les exigences en matière de données pour les ensembles de données d'un groupe de jeux de données personnalisé. Chaque section du jeu de données répertorie les données requises pour le type de jeu de données et fournit un JSON exemple de schéma.
Pour plus d'informations sur les types de données que vous pouvez importer dans Amazon Personalize, consultezTypes de données qu'Amazon Personalize peut utiliser. Pour plus d'informations sur les exigences générales du schéma Amazon Personalize, telles que les exigences de mise en forme et les types de données de champ disponibles, consultezCréation de JSON fichiers de schéma pour les schémas Amazon Personalize. Ces exigences s'appliquent à tous les schémas Amazon Personalize.
Rubriques
- Exigences relatives aux ensembles de données et aux schémas personnalisés
- Exigences relatives au schéma du jeu de données sur les interactions entre articles (personnalisé)
- Exigences relatives au schéma du jeu de données utilisateur (personnalisé)
- Exigences relatives au schéma du jeu de données d'articles (personnalisé)
- Exigences relatives au schéma du jeu de données Actions (personnalisé)
- Exigences relatives au schéma du jeu de données Action Interactions (personnalisé)
Exigences relatives aux ensembles de données et aux schémas personnalisés
Lorsque vous créez un ensemble de données pour un groupe de jeux de données personnalisé, chaque type de jeu de données comporte les champs obligatoires et les mots clés réservés suivants avec les types de données requis.
Type d'ensemble de données | Champs obligatoires | Mots-clés réservés |
---|---|---|
Interactions entre éléments (exemple de schéma) |
USER_ID () ITEM_ID () TIMESTAMP ( |
EVENT_TYPE ( EVENT_VALUE ( IMPRESSION ( RECOMMENDATION_ID ( EVENT_ATTRIBUTION_SOURCE ( |
Utilisateurs (exemple de schéma) |
USER_ID () 1 champ de métadonnées (catégorique |
|
Éléments (exemple de schéma) |
ITEM_ID () 1 champ de métadonnées (champ catégorique ou textuel ou |
CREATION_TIMESTAMP ( |
Actions (exemple de schéma) |
ACTION_ID () 1 champ de métadonnées (catégorique |
CREATION_TIMESTAMP ( VALUE ( TYPE ( EXPIRATION_TIMESTAMP ( REPEAT_FREQUENCY ( |
Interactions entre actions (exemple de schéma) |
USER_ID () ACTION_ID () EVENT_TYPE ( TIMESTAMP ( |
IMPRESSION ( RECOMMENDATION_ID ( |
Champs de métadonnées
Les métadonnées incluent des champs sous forme de chaîne ou non sous forme de chaîne qui ne sont pas obligatoires ou qui n'utilisent pas de mot clé réservé. Les schémas de métadonnées sont soumis aux restrictions suivantes :
-
Les schémas d'utilisateurs, d'éléments et d'actions nécessitent au moins un champ de métadonnées.
-
Vous pouvez ajouter au maximum 25 champs de métadonnées pour un schéma Users, 100 champs de métadonnées pour un schéma Items et 10 champs de métadonnées pour un schéma Actions.
-
Si vous ajoutez votre propre champ de métadonnées de type
string
, il doit inclure l'categorical
attribut ou l'textual
attribut (seuls les schémas Items prennent en charge les champs avec l'attribut textuel). Sinon, Amazon Personalize n'utilisera pas le champ lors de la formation d'un modèle.
Mots-clés réservés
Les mots clés réservés sont des champs facultatifs qui ne sont pas des champs de métadonnées. Ces champs sont considérés comme réservés car vous devez définir les champs comme leur type de données obligatoire lorsque vous les utilisez, et les mots clés ne peuvent pas être utilisés comme valeurs dans vos données. Les champs de chaîne catégorielle réservés doivent être categorical
définis surtrue
, tandis que les champs de chaîne réservés ne peuvent pas être catégoriques. Les mots clés suivants sont réservés :
-
EVENT_ TYPE : Pour les ensembles de données d'interactions entre éléments comportant un ou plusieurs types d'événements, tels que le clic et le téléchargement, utilisez un
EVENT_TYPE
champ. Vous devez définir un TYPE champ EVENT _ comme unstring
et ne pouvez pas être défini comme catégorique. -
EVENT_ VALUE : Pour les ensembles de données d'interactions entre articles qui incluent des données de valeur relatives à des événements, telles que le pourcentage d'une vidéo regardée par un utilisateur, utilisez un
EVENT_VALUE
champ avec un typefloat
et éventuellementnull
un champ. -
CREATION_ TIMESTAMP : Pour les ensembles de données d'éléments ou d'actions avec un horodatage pour la date de création de chaque élément, utilisez un
CREATION_TIMESTAMP
champ avec un type.long
Amazon Personalize utiliseCREATION_TIMESTAMP
les données pour calculer l'âge d'un article et ajuster les recommandations en conséquence. Consultez Données d'horodatage de création. -
IMPRESSION: Pour les ensembles de données d'interactions entre articles contenant des données d'impressions explicites, utilisez un
IMPRESSION
champ avec un typeString
et éventuellement un typenull
. Les impressions sont des listes d'éléments visibles par un utilisateur lorsqu'il interagissait avec un élément en particulier (par exemple, en cliquant ou en regardant). Pour de plus amples informations, veuillez consulter Données sur les impressions. -
RECOMMENDATION_ID : pour les ensembles de données d'interactions entre articles qui utilisent les recommandations précédentes comme données d'impressions implicites, utilisez éventuellement un
RECOMMENDATION_ID
champ avec typeString
et éventuellement type.null
Il n'est pas nécessaire d'ajouter un
RECOMMENDATION_ID
champ pour qu'Amazon Personalize utilise les impressions implicites lors de la génération de recommandations. Vous pouvez réussirrecommendationId
une PutEvents opération sans elle. Pour de plus amples informations, veuillez consulter Données sur les impressions. -
VALUE: Pour les ensembles de données Actions, si vous disposez de données de valeur pour certaines ou toutes vos actions, ajoutez un
VALUE
champ à votre schéma. Pour son type, utilisezlong
et tapez éventuellementnull
. Pour plus d'informations sur les actions et leur valeur, consultezDonnées de valeur. -
ACTION_ EXPIRATION _ TIMESTAMP : Pour les ensembles de données Actions, si vous avez un horodatage d'expiration pour certaines ou toutes vos actions, ajoutez un
ACTION_EXPIRATION_TIMESTAMP
champ à votre schéma. Pour son type, utilisezlong
et tapez éventuellementnull
. Pour plus d'informations sur les horodatages d'expiration, consultez. Données d'horodatage d'expiration des actions -
REPEAT_ FREQUENCY : Pour les ensembles de données Actions, si vous disposez de données de fréquence de répétition pour certaines ou toutes vos actions, ajoutez un
REPEAT_FREQUENCY
champ à votre schéma. Pour son type, utilisezlong
et tapez éventuellementnull
. Pour plus d'informations sur les données de fréquence de répétition, consultezRépéter les données de fréquence.