Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Exigences relatives au jeu de données d'articles (VIDEOdomaine _ON_DEMAND)
Un jeu de données d'articles stocke les métadonnées relatives à vos articles dans votre catalogue. Cela peut inclure des informations telles que le prix, le genre et la disponibilité de chaque article. Pour plus d'informations sur les types de données d'articles que vous pouvez importer dans Amazon Personalize, consultezMétadonnées de l'article. Pour plus d'informations sur les exigences générales du schéma Amazon Personalize, telles que les exigences de mise en forme et les types de données de champ disponibles, consultezCréation de JSON fichiers de schéma pour les schémas Amazon Personalize. Ces exigences s'appliquent à tous les schémas, quel que soit le domaine.
Un jeu de données Items est requis pour certains cas d'utilisation (voirCas d'utilisation de VIDEO_ON_DEMAND). Lorsque cela est facultatif, nous vous recommandons tout de même d'en créer un pour obtenir les recommandations les plus pertinentes. Si vous créez un jeu de données Items, votre schéma doit inclure les champs suivants :
-
ITEM_ID
-
GENRES(catégorique
string
) -
CREATION_ TIMESTAMP (au format Unix Epoch Time)
Votre schéma peut également inclure les mots clés réservés suivants. Chaque mot clé indique le type de données requis et indique s'il prend en charge les données nulles. L'ajout du type nul est facultatif.
PRICE(flotteur)
DURATION(flotteur)
GENRE_L2 (catégorique
string
,)null
GENRE_L3 (catégorique
string
,)null
AVERAGE_RATING (
float
,null
)PRODUCT_ DESCRIPTION (textuel
string
,null
)CONTENT_ OWNER (catégorique
string
,null
) : société propriétaire de la vidéo. Par exemple, les valeurs peuvent être HBO Paramount etNBC.CONTENT_ CLASSIFICATION (catégorique
string
,null
) : évaluation du contenu. Par exemple, les valeurs peuvent être G, PG, PG-13, R, NC-17 et rated.
Pour obtenir les meilleures recommandations, nous vous recommandons de conserver ces champs autant de champs dans votre schéma que vous disposez de données. Les données que vous importez doivent correspondre à votre schéma. Le nombre maximum de colonnes de métadonnées est de 100. Vous êtes libre d'ajouter des champs supplémentaires en fonction de votre cas d'utilisation et de vos données. Tant que les champs ne sont pas répertoriés comme obligatoires ou réservés et que les types de données y sont répertoriésTypes de données de schéma, les noms des champs et les types de données dépendent de vous.
Utilisez les mots clés réservés GENRE _L2 et GENRE _L3 pour les articles comportant plusieurs catégories à plusieurs niveaux. Pour de plus amples informations, veuillez consulter Utilisation de données catégoriques. Pour plus d'informations sur les métadonnées textuelles et catégoriques, voir. Préparation des métadonnées des éléments pour la formation Pour obtenir un exemple du schéma par défaut pour les ensembles de données Items pour les ECOMMERCE domaines, consultezSchéma des éléments par défaut (VIDEOdomaine _ON_DEMAND).
Utilisation de données catégoriques
Pour utiliser des données catégoriques, ajoutez un champ de type string
et définissez l'attribut catégorique du champ sur true
dans votre schéma. Incluez ensuite les données catégorielles dans votre CSV fichier groupé et vos importations d'articles individuels. Les valeurs catégorielles peuvent comporter au maximum 1 000 caractères. Si vous avez un élément avec une valeur catégorique de plus de 1 000 caractères, votre tâche d'importation de jeu de données échouera.
Pour les articles comportant plusieurs catégories, séparez chaque valeur par la barre verticale « | ». Par exemple, pour un GENRES champ, vos données pour un élément peuvent êtreAction|Crime|Biopic
. Si vous disposez de plusieurs niveaux de données catégorielles et que certains éléments comportent plusieurs catégories pour chaque niveau de la hiérarchie, ajoutez un champ pour chaque niveau et ajoutez un indicateur de niveau après le nom de chaque champ :GENRES, GENRE _L2, _L3. GENRE Cela vous permet de filtrer les recommandations en fonction de sous-catégories, même si un article appartient à plusieurs catégories à plusieurs niveaux. Par exemple, une vidéo peut contenir les données suivantes pour chaque niveau de catégorie :
-
GENRES: Action|Aventure
-
GENRE_L2 : Criminel|Western
-
GENRE_L3 : film biographique
Dans cet exemple, la vidéo se trouve dans la hiérarchie action > crime > biopic et dans la hiérarchie aventure > western > biopic. Nous vous recommandons de n'utiliser que le niveau L3, mais vous pouvez utiliser d'autres niveaux si nécessaire. Pour plus d'informations sur la création et l'utilisation de filtres, consultezRecommandations de filtrage et segments d'utilisateurs.
Schéma des éléments par défaut (VIDEOdomaine _ON_DEMAND)
Le schéma par défaut des ensembles de données Items pour le domaine VIDEO _ON_ DEMAND est le suivant.
{
"type": "record",
"name": "Items",
"namespace": "com.amazonaws.personalize.schema",
"fields": [
{
"name": "ITEM_ID",
"type": "string"
},
{
"name": "GENRES",
"type": [
"string"
],
"categorical": true
},
{
"name": "CREATION_TIMESTAMP",
"type": "long"
}
],
"version": "1.0"
}