Exigences relatives au formatage du schéma

Création de JSON fichiers de schéma pour les schémas Amazon Personalize

Après avoir préparé vos données, vous êtes prêt à créer des JSON fichiers de schéma pour chaque type de données que vous importez. Ces fichiers décrivent la structure et le contenu de vos données, y compris les noms des colonnes et leurs types de données.

Vous utilisez des JSON fichiers de schéma lorsque vous créez un schéma Amazon Personalize dansCréation d'un schéma et d'un jeu de données. Dans Amazon Personalize, un schéma est une ressource qui permet à Amazon Personalize d'analyser les données lorsque vous les importez dans votre ensemble de données. Vous créez un schéma pour chaque jeu de données que vous utilisez.

Pour les ressources personnalisées, chaque ensemble de données a des exigences de schéma spécifiques. Pour les groupes de jeux de données de domaine, le domaine que vous choisissez détermine les exigences de votre jeu de données et de schéma. Chaque domaine possède un schéma par défaut pour chaque type de jeu de données. Lorsque vous créez un jeu de données, vous pouvez utiliser le schéma de domaine existant ou en créer un nouveau en modifiant le schéma par défaut existant. Utilisez le schéma par défaut comme guide pour déterminer les données à importer pour votre domaine.

Les sections suivantes présentent les exigences personnalisées et de domaine relatives à la création d'un JSON fichier de schéma pour chaque type de jeu de données.

Rubriques

Exigences relatives au formatage du schéma

Lorsque vous créez un schéma pour un ensemble de données dans un groupe de jeux de données de domaine ou un groupe de jeux de données personnalisé, vous devez suivre les directives suivantes :

Vous devez définir le schéma au format Avro. Pour plus d'informations sur les types de données Avro que nous prenons en charge, consultezTypes de données de schéma.
Un schéma possède une clé de nom dont la valeur doit correspondre au type de jeu de données.
Les champs du schéma peuvent apparaître dans n'importe quel ordre, mais ils doivent correspondre à l'ordre des en-têtes de colonne correspondants dans votre CSV fichier.
Les schémas doivent être des JSON fichiers plats sans structures imbriquées. Par exemple, un champ ne peut pas être le parent de plusieurs sous-champs.
Les schémas Amazon Personalize ne prennent pas en charge les types complexes tels que les tableaux et les cartes.
Les champs du schéma doivent avoir des noms alphanumériques uniques. Par exemple, vous ne pouvez pas ajouter à la fois un GENRES_FIELD_1 champ et un GENRESFIELD1 champ.
Vous devez définir les champs obligatoires en tant que types de données obligatoires. Les champs de chaîne catégorielle réservés doivent avoir l'categoricalattribut défini surtrue, tandis que les champs de chaîne réservés ne peuvent pas être catégoriques. Les mots clés ne peuvent pas figurer dans vos données.
Si vous ajoutez votre propre champ de métadonnées string et que vous souhaitez qu'Amazon Personalize l'utilise lors de la formation, il doit inclure l'categoricalattribut ou l'textualattribut (seuls les schémas d'articles prennent en charge les champs comportant l'attribut textuel).
Amazon Personalize n'utilise pas boolean de données de type lors de la formation ou du filtrage des recommandations. Pour qu'Amazon Personalize utilise des données booléennes lors de l'entraînement ou du filtrage, utilisez un champ de type String et utilisez les valeurs "True" et contenues "False" dans vos données. Vous pouvez également utiliser le type int ou long et les valeurs 0 et1.
Les champs textuels doivent être du type string et leur textual attribut doit être défini sur. true Pour plus d'informations sur les données de texte non structurées, consultezMétadonnées de texte non structurées.

Les ensembles de données de groupes de jeux de données de domaine ont des exigences supplémentaires basées à la fois sur le domaine et le type de jeu de données. Les ensembles de données de groupes de jeux de données personnalisés ont des exigences supplémentaires en fonction du type.

Types de données de schéma

Les schémas Amazon Personalize prennent en charge les types Avro suivants pour les champs :

float
double
int
long
chaîne
un booléen
null

Certains champs obligatoires et réservés prennent en charge les données nulles. L'ajout d'un null type à un champ vous permet d'utiliser des données imparfaites (par exemple, des métadonnées avec des valeurs vides) pour générer des recommandations. Pour plus d'informations sur les champs qui prennent en charge les données nulles, consultez la rubrique relative aux exigences du schéma pour votre domaine : VIDEODEMANDEnsembles de données et schémas _ON_ECOMMERCEensembles de données et schémas, ouEnsembles de données et schémas personnalisés. L'exemple suivant montre comment ajouter un type nul pour un GENDER champ.


{
  "name": "GENDER",
  "type": [
    "null",
    "string"
  ],
  "categorical": true
}

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

Données d'interaction entre actions

VIDEODEMANDEnsembles de données et schémas _ON_