Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Schémas
Un schéma indique à Amazon Personalize la structure de vos données et permet à Amazon Personalize d'analyser les données. Un schéma possède une clé de nom dont la valeur doit correspondre au type de jeu de données. Une fois que vous avez créé un schéma, vous ne pouvez pas le modifier.
Pour les groupes de jeux de données de domaine, chaque type de jeu de données possède un schéma par défaut avec des champs obligatoires et des mots clés réservés. Chaque fois que vous créez un jeu de données, vous pouvez utiliser le schéma de domaine existant ou en créer un nouveau en modifiant le schéma par défaut existant. Utilisez le schéma par défaut comme guide pour déterminer les données à importer pour votre domaine. Une fois que vous avez défini le schéma et créé le jeu de données, vous ne pouvez pas le modifier.
Rubriques
Exigences relatives au formatage du schéma
Lorsque vous créez un schéma pour un ensemble de données dans un groupe de jeux de données de domaine ou un groupe de jeux de données personnalisé, vous devez suivre les directives suivantes :
-
Vous devez définir le schéma au format Avro.
Pour plus d'informations sur les types de données Avro que nous prenons en charge, consultezTypes de données de schéma. -
Les champs du schéma peuvent apparaître dans n'importe quel ordre, mais ils doivent correspondre à l'ordre des en-têtes de colonne correspondants dans votre CSV fichier.
-
Les schémas doivent être des JSON fichiers plats sans structures imbriquées. Par exemple, un champ ne peut pas être le parent de plusieurs sous-champs.
-
Les schémas Amazon Personalize ne prennent pas en charge les types complexes tels que les tableaux et les cartes.
-
Les champs du schéma doivent avoir des noms alphanumériques uniques. Par exemple, vous ne pouvez pas ajouter à la fois un
GENRES_FIELD_1
champ et unGENRESFIELD1
champ. -
Vous devez définir les champs obligatoires en tant que types de données obligatoires. Les champs de chaîne catégorielle réservés doivent avoir l'
categorical
attribut défini surtrue
, tandis que les champs de chaîne réservés ne peuvent pas être catégoriques. Les mots clés ne peuvent pas figurer dans vos données. -
Si vous ajoutez votre propre champ de métadonnées
string
et que vous souhaitez qu'Amazon Personalize l'utilise lors de la formation, il doit inclure l'categorical
attribut ou l'textual
attribut (seuls les schémas d'articles prennent en charge les champs comportant l'attribut textuel). -
Amazon Personalize peut utiliser des colonnes de chaîne non catégoriques, telles que des colonnes de nom d'article, lors de la génération de thèmes, du renvoi de métadonnées dans les recommandations et des recommandations de filtrage. Pour de plus amples informations, veuillez consulter Données de chaîne non catégoriques.
-
Amazon Personalize n'utilise pas
boolean
de données de type lors de la formation ou du filtrage des recommandations. Pour qu'Amazon Personalize utilise des données booléennes lors de l'entraînement ou du filtrage, utilisez un champ de type String et utilisez les valeurs"True"
et contenues"False"
dans vos données. Vous pouvez également utiliser le type int ou long et les valeurs0
et1
. -
Les champs textuels doivent être du type
string
et leurtextual
attribut doit être défini sur.true
Pour plus d'informations sur les données de texte non structurées, consultezMétadonnées de texte non structurées.
Les ensembles de données de groupes de jeux de données de domaine ont des exigences supplémentaires basées à la fois sur le domaine et le type de jeu de données. Les ensembles de données de groupes de jeux de données personnalisés ont des exigences supplémentaires en fonction du type.
Types de données de schéma
Les schémas Amazon Personalize prennent en charge les types Avro suivants pour les champs :
-
float
-
double
-
int
-
long
-
chaîne
-
un booléen
-
null
Certains champs obligatoires et réservés prennent en charge les données nulles. L'ajout d'un null
type à un champ vous permet d'utiliser des données imparfaites (par exemple, des métadonnées avec des valeurs vides) pour générer des recommandations. Pour plus d'informations sur les champs qui acceptent les données nulles, consultez Ensembles de données et schémas de domaine ouEnsembles de données et schémas personnalisés. L'exemple suivant montre comment ajouter un type nul pour un GENDER champ.
{ "name": "GENDER", "type": [ "null", "string" ], "categorical": true }