Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Création d'un schéma et d'un jeu de données
Après avoir créé un groupe de jeux de données, vous êtes prêt à créer un schéma Amazon Personalize et un ensemble de données pour chaque type de données que vous importez. Un schéma indique à Amazon Personalize la structure de vos données et permet à Amazon Personalize d'analyser les données. Lorsque vous créez un schéma dans Amazon Personalize, vous utilisez le JSON fichier dans lequel vous l'avez crééCréation de JSON fichiers de schéma pour les schémas Amazon Personalize.
Un ensemble de données est un conteneur pour les données de formation dans Amazon Personalize. Les différents types de jeux de données ont des exigences différentes. Vous créez un ensemble de données pour chaque type de données que vous importez. Pour plus d'informations sur les différents types de jeux de données et sur la façon de préparer vos données, consultezPréparation des données de formation pour Amazon Personalize.
Vous pouvez créer des schémas et des ensembles de données avec la console Amazon Personalize, AWS Command Line Interface (AWS CLI), ou AWS SDKs. Vous ne pouvez pas créer les meilleures ressources d'action suivantes, notamment les ensembles de données d'actions et d'interactions d'action, dans un groupe de jeux de données de domaine.
Important
Une fois que vous avez créé un schéma, vous ne pouvez pas le modifier. Toutefois, si vous ajoutez de nouvelles colonnes, vous pouvez remplacer le schéma d'un jeu de données par un nouveau. Pour de plus amples informations, veuillez consulter Remplacement du schéma d'un ensemble de données pour ajouter de nouvelles colonnes.
Rubriques
Création d'un jeu de données et d'un schéma (console)
S'il s'agit du premier jeu de données de votre groupe de jeux de données, votre premier type de jeu de données sera un jeu de données d'interactions entre éléments. Pour créer votre jeu de données d'interactions Item dans la console, spécifiez le nom du jeu de données, puis spécifiez un JSON schéma au format Avro
Pour plus d'informations sur les exigences relatives aux ensembles de données Amazon Personalize, consultezPréparation des données de formation pour Amazon Personalize. Si vous venez de terminer Création d'un groupe de jeux de données Amazon Personalize et que vous êtes déjà en train de créer votre jeu de données, passez à l'étape 4 de cette procédure.
Pour créer un jeu de données et un schéma
-
Si ce n'est pas déjà fait, suivez les instructions Création de JSON fichiers de schéma pour les schémas Amazon Personalize pour créer un JSON fichier de schéma qui décrit vos données.
-
Ouvrez la console Amazon Personalize https://console.aws.amazon.com/personalize/chez
vous et connectez-vous à votre compte. -
Sur la page Groupes de jeux de données, choisissez le groupe de jeux de données dans lequel vous avez crééCréation d'un groupe de jeux de données Amazon Personalize.
-
À l'étape 1. Créez des ensembles de données et importez des données, choisissez Créer un ensemble de données et choisissez le type de jeu de données à créer.
-
Choisissez Importer les données directement dans les ensembles de données Amazon Personalize, puis Next.
-
Dans Détails du jeu de données, dans Nom du jeu de données, spécifiez le nom de votre ensemble de données.
-
Pour le schéma du jeu de données, choisissez Créer un nouveau schéma ou Utiliser un schéma existant.
-
Si vous utilisez un schéma existant, choisissez le schéma existant à utiliser. Si vous créez un nouveau schéma, nommez-le et collez-y le schéma JSON correspondant à vos données. Vous avez créé ce fichier dansCréation de JSON fichiers de schéma pour les schémas Amazon Personalize.
-
Pour les balises, ajoutez éventuellement des balises. Pour plus d'informations sur le balisage des ressources Amazon Personalize, consultezMarquer les ressources Amazon Personalize.
-
Choisissez Next et suivez les instructions Importation de données de formation dans les ensembles de données Amazon Personalize pour importer vos données.
Création d'un jeu de données et d'un schéma (AWS CLI)
Pour créer un jeu de données et un schéma à l'aide du AWS CLI, vous utilisez la create-schema
commande (qui utilise l'CreateSchemaAPIopération) puis create-dataset
(qui utilise l'CreateDatasetAPIopération).
Pour créer un schéma et un jeu de données
-
Si ce n'est pas déjà fait, suivez les instructions Création de JSON fichiers de schéma pour les schémas Amazon Personalize pour créer un JSON fichier de schéma qui décrit vos données.
-
Créez un schéma dans Amazon Personalize en exécutant la commande suivante. Une fois que vous avez créé un schéma, vous ne pouvez pas le modifier. Remplacez
schemaName
par le nom du schéma et remplacezfile://SchemaName.json
par l'emplacement de votre JSON fichier. L'exemple montre que le fichier appartient au dossier actif. Si vous créez une structure pour un jeu de données dans un groupe de jeux de données de domaine, ajoutez ledomain
paramètre et définissez-le surECOMMERCE
ouVIDEO_ON_DEMAND
. Pour plus d'informations sur leAPI, consultezCreateSchema.aws personalize create-schema \ --name
SchemaName
\ --schemafile://SchemaName.json
Le schéma Amazon Resource Name (ARN) s'affiche, comme illustré dans l'exemple suivant :
{ "schemaArn": "arn:aws:personalize:us-west-2:acct-id:schema/SchemaName" }
-
Créez un ensemble de données vide en exécutant la commande suivante. Indiquez le groupe de données Amazon Resource Name (ARN) Création d'un groupe de jeux de données (AWS CLI) et le schéma ARN de l'étape précédente. Les valeurs de type d'ensemble de données peuvent être
Interactions
Users
Items
,Actions
,, ouAction_Interactions
. Pour plus d'informations sur leAPI, consultezCreateDataset.aws personalize create-dataset \ --name
Dataset Name
\ --dataset-group-arnDataset Group ARN
\ --dataset-typeDataset Type
\ --schema-arnSchema Arn
Le jeu de données ARN est affiché, comme indiqué dans l'exemple suivant.
{ "datasetArn": "arn:aws:personalize:us-west-2:acct-id:dataset/DatasetName/INTERACTIONS" }
-
Enregistrez l'ensemble de données ARN pour une utilisation ultérieure. Après avoir créé un jeu de données, vous êtes prêt à importer vos données d'entraînement. Consultez Importation de données de formation dans les ensembles de données Amazon Personalize.
Création d'un jeu de données et d'un schéma (AWS SDKs)
Pour créer un jeu de données et un schéma à l'aide du AWS SDKs, vous définissez d'abord un schéma au format Avro
Pour créer un schéma et un jeu de données
-
Si ce n'est pas déjà fait, suivez les instructions Création de JSON fichiers de schéma pour les schémas Amazon Personalize pour créer un JSON fichier de schéma qui décrit vos données.
-
Créez un schéma dans Amazon Personalize à l'aide du code suivant. Spécifiez le nom de votre schéma et le chemin du fichier de votre schémaJSON. Si vous créez une structure pour un jeu de données dans un groupe de jeux de données de domaine, ajoutez le
domain
paramètre et définissez-le surECOMMERCE
ouVIDEO_ON_DEMAND
. Pour plus d'informations sur leAPI, consultezCreateSchema.Amazon Personalize renvoie le ARN nouveau schéma. Enregistrez-le car vous en aurez besoin à l'étape suivante.
-
Créez un ensemble de données à l'aide de l'CreateDatasetopération. Le code suivant montre comment créer un ensemble de données. Spécifiez le nom de ressource Amazon (ARN) de votre groupe de jeux de données, le schéma ARN de l'étape précédente et spécifiez le type de jeu de données. Les valeurs de type d'ensemble de données peuvent être
Interactions
Users
Items
,Actions
,, ouAction_Interactions
. Pour plus d'informations sur les différents types de jeux de données, consultezPréparation des données de formation pour Amazon Personalize.Après avoir créé un jeu de données, vous êtes prêt à importer vos données d'entraînement. Consultez Importation de données de formation dans les ensembles de données Amazon Personalize.