Schémas - Amazon Personalize

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Schémas

Un schéma indique à Amazon Personalize la structure de vos données et permet à Amazon Personalize d'analyser les données. Un schéma possède une clé de nom dont la valeur doit correspondre au type de jeu de données. Une fois que vous avez créé un schéma, vous ne pouvez pas le modifier.

Pour les groupes de jeux de données de domaine, chaque type de jeu de données possède un schéma par défaut avec des champs obligatoires et des mots clés réservés. Chaque fois que vous créez un jeu de données, vous pouvez utiliser le schéma de domaine existant ou en créer un nouveau en modifiant le schéma par défaut existant. Utilisez le schéma par défaut comme guide pour déterminer les données à importer pour votre domaine. Une fois que vous avez défini le schéma et créé le jeu de données, vous ne pouvez pas le modifier.

Exigences relatives au formatage du schéma

Lorsque vous créez un schéma pour un ensemble de données dans un groupe de jeux de données de domaine ou un groupe de jeux de données personnalisé, vous devez suivre les directives suivantes :

  • Vous devez définir le schéma au format Avro. Pour plus d'informations sur les types de données Avro que nous prenons en charge, consultezTypes de données de schéma.

  • Les champs du schéma peuvent apparaître dans n'importe quel ordre, mais ils doivent correspondre à l'ordre des en-têtes de colonne correspondants dans votre CSV fichier.

  • Les schémas doivent être des JSON fichiers plats sans structures imbriquées. Par exemple, un champ ne peut pas être le parent de plusieurs sous-champs.

  • Les schémas Amazon Personalize ne prennent pas en charge les types complexes tels que les tableaux et les cartes.

  • Les champs du schéma doivent avoir des noms alphanumériques uniques. Par exemple, vous ne pouvez pas ajouter à la fois un GENRES_FIELD_1 champ et un GENRESFIELD1 champ.

  • Vous devez définir les champs obligatoires en tant que types de données obligatoires. Les champs de chaîne catégorielle réservés doivent avoir l'categoricalattribut défini surtrue, tandis que les champs de chaîne réservés ne peuvent pas être catégoriques. Les mots clés ne peuvent pas figurer dans vos données.

  • Si vous ajoutez votre propre champ de métadonnées string et que vous souhaitez qu'Amazon Personalize l'utilise lors de la formation, il doit inclure l'categoricalattribut ou l'textualattribut (seuls les schémas d'articles prennent en charge les champs comportant l'attribut textuel).

  • Amazon Personalize peut utiliser des colonnes de chaîne non catégoriques, telles que des colonnes de nom d'article, lors de la génération de thèmes, du renvoi de métadonnées dans les recommandations et des recommandations de filtrage. Pour de plus amples informations, veuillez consulter Données de chaîne non catégoriques.

  • Amazon Personalize n'utilise pas boolean de données de type lors de la formation ou du filtrage des recommandations. Pour qu'Amazon Personalize utilise des données booléennes lors de l'entraînement ou du filtrage, utilisez un champ de type String et utilisez les valeurs "True" et contenues "False" dans vos données. Vous pouvez également utiliser le type int ou long et les valeurs 0 et1.

  • Les champs textuels doivent être du type string et leur textual attribut doit être défini sur. true Pour plus d'informations sur les données de texte non structurées, consultezMétadonnées de texte non structurées.

Les ensembles de données de groupes de jeux de données de domaine ont des exigences supplémentaires basées à la fois sur le domaine et le type de jeu de données. Les ensembles de données de groupes de jeux de données personnalisés ont des exigences supplémentaires en fonction du type.

Types de données de schéma

Les schémas Amazon Personalize prennent en charge les types Avro suivants pour les champs :

  • float

  • double

  • int

  • long

  • chaîne

  • un booléen

  • null

Certains champs obligatoires et réservés prennent en charge les données nulles. L'ajout d'un null type à un champ vous permet d'utiliser des données imparfaites (par exemple, des métadonnées avec des valeurs vides) pour générer des recommandations. Pour plus d'informations sur les champs qui acceptent les données nulles, consultez Ensembles de données et schémas de domaine ouEnsembles de données et schémas personnalisés. L'exemple suivant montre comment ajouter un type nul pour un GENDER champ.

{ "name": "GENDER", "type": [ "null", "string" ], "categorical": true }