Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Création d'un jeu de données et d'un schéma
Une fois que vous avez terminéÉtape 1 : Création d'un groupe de jeux de données, vous êtes prêt à créer un jeu de données. Les ensembles de données sont des conteneurs Amazon Personalize pour les données. Lorsque vous créez un jeu de données, vous créez également un schéma pour le jeu de données. Un schéma indique à Amazon Personalize la structure de vos données et permet à Amazon Personalize d'analyser les données.
Vous créez des ensembles de données à l'aide de la console Amazon Personalize AWS Command Line Interface (AWS CLI) ou des AWS SDK. Vous ne pouvez pas créer les meilleures ressources d'action suivantes, notamment les ensembles de données d'actions et d'interactions d'action, dans un groupe de jeux de données de domaine. Pour plus d'informations sur les différents types de jeux de données, ainsi que sur les exigences relatives aux ensembles de données et aux schémas, consultezEnsembles de données et schémas.
Rubriques
Création d'un jeu de données et d'un schéma (console)
S'il s'agit du premier jeu de données de votre groupe de jeux de données, votre premier type de jeu de données sera un jeu de données d'interactions entre éléments. Pour créer votre jeu de données d'interactions Item dans la console, spécifiez le nom du jeu de données, puis spécifiez un schéma JSON au format Avro
Pour plus d'informations sur les ensembles de données Amazon Personalize et les exigences relatives aux schémas, consultezEnsembles de données et schémas.
Note
Si vous venez de terminer Étape 1 : Création d'un groupe de jeux de données et que vous êtes déjà en train de créer votre jeu de données, passez à l'étape 4 de cette procédure.
Pour créer un jeu de données et un schéma
-
Ouvrez la console Amazon Personalize à l'adresse https://console.aws.amazon.com/personalize/home
et connectez-vous à votre compte. -
Sur la page Groupes de jeux de données, choisissez le groupe de jeux de données dans lequel vous avez crééÉtape 1 : Création d'un groupe de jeux de données.
-
Dans Configurer des ensembles de données, choisissez Créer un ensemble de données et choisissez le type de jeu de données à créer.
-
Choisissez Importer les données directement dans les ensembles de données Amazon Personalize, puis Next.
-
Dans Détails du jeu de données, dans Nom du jeu de données, spécifiez le nom de votre ensemble de données.
-
Dans Détails du schéma, pour la sélection du schéma, choisissez un schéma existant ou choisissez Créer un nouveau schéma.
-
Si vous créez un nouveau schéma, pour la définition du schéma, collez le JSON du schéma qui correspond à vos données. Utilisez les exemples ci-dessous Schémas comme guide. Une fois que vous avez créé un schéma, vous ne pouvez pas le modifier.
-
Pour New schema name (Nom du nouveau schéma), spécifiez un nom pour le nouveau schéma.
-
Pour les balises, ajoutez éventuellement des balises. Pour plus d'informations sur le balisage des ressources Amazon Personalize, consultezMarquer les ressources Amazon Personalize.
-
Choisissez Next et suivez les instructions Préparation et importation de données en masse pour importer vos données.
Création d'un jeu de données et d'un schéma (AWS CLI)
Pour créer un ensemble de données et un schéma à l'aide de AWS CLI, vous devez d'abord définir un schéma au format Avro
Pour créer un schéma et un jeu de données
-
Créez un fichier de schéma au format Avro et enregistrez-le en tant que fichier JSON. Ce fichier doit être basé sur le type de jeu de données, tel que Interactions, que vous créez.
Le schéma doit correspondre aux colonnes de vos données et
name
il doit correspondre à l'un des types de jeux de données reconnus par Amazon Personalize. Voici un exemple de schéma de jeu de données minimal sur les interactions entre éléments. Pour obtenir plus d’exemples, consultez Schémas.{ "type": "record", "name": "Interactions", "namespace": "com.amazonaws.personalize.schema", "fields": [ { "name": "USER_ID", "type": "string" }, { "name": "ITEM_ID", "type": "string" }, { "name": "TIMESTAMP", "type": "long" } ], "version": "1.0" }
-
Créez un schéma dans Amazon Personalize en exécutant la commande suivante. Une fois que vous avez créé un schéma, vous ne pouvez pas le modifier. Remplacez
schemaName
par le nom du schéma, puisfile://SchemaName.json
par l'emplacement du fichier JSON que vous avez créé à l'étape précédente. L'exemple montre que le fichier appartient au dossier actif.Si vous créez une structure pour un jeu de données dans un groupe de jeux de données de domaine, ajoutez le
domain
paramètre et définissez-le surECOMMERCE
ouVIDEO_ON_DEMAND
. Pour plus d’informations sur l’API, consultez CreateSchema.aws personalize create-schema \ --name
SchemaName
\ --schemafile://SchemaName.json
Le schéma Amazon Resource Name (ARN) s'affiche, comme illustré dans l'exemple suivant :
{ "schemaArn": "arn:aws:personalize:us-west-2:acct-id:schema/SchemaName" }
-
Créez un ensemble de données vide en exécutant la commande suivante. Indiquez le nom de ressource Amazon (ARN) du groupe de données Création d'un groupe de jeux de données (AWS CLI) et l'ARN du schéma de l'étape précédente. Les valeurs de type d'ensemble de données peuvent être
Interactions
Users
Items
,Actions
,, ouAction_Interactions
. Pour plus d’informations sur l’API, consultez CreateDataset.aws personalize create-dataset \ --name
Dataset Name
\ --dataset-group-arnDataset Group ARN
\ --dataset-typeDataset Type
\ --schema-arnSchema Arn
L'ARN du jeu de données est affiché, comme indiqué dans l'exemple suivant.
{ "datasetArn": "arn:aws:personalize:us-west-2:acct-id:dataset/DatasetName/INTERACTIONS" }
-
Enregistrez l'ARN du jeu de données pour une utilisation ultérieure. Après avoir créé un jeu de données, vous êtes prêt à importer vos données d'entraînement. veuillez consulter Préparation et importation de données en masse.
Création d'un jeu de données et d'un schéma (AWS SDK)
Pour créer un ensemble de données et un schéma à l'aide AWS des SDK, vous devez d'abord définir un schéma au format Avro
Pour créer un schéma et un jeu de données
-
Créez un fichier de schéma au format Avro et enregistrez-le sous forme de fichier JSON dans votre répertoire de travail.
Le schéma doit correspondre aux colonnes de vos données et le schéma
name
doit correspondre à un type de jeu de données reconnu par Amazon Personalize. Voici un exemple de schéma de jeu de données minimal sur les interactions entre éléments. Pour obtenir plus d’exemples, consultez Schémas.{ "type": "record", "name": "Interactions", "namespace": "com.amazonaws.personalize.schema", "fields": [ { "name": "USER_ID", "type": "string" }, { "name": "ITEM_ID", "type": "string" }, { "name": "TIMESTAMP", "type": "long" } ], "version": "1.0" }
-
Créez un schéma avec le code suivant. Spécifiez le nom de votre schéma et le chemin du fichier JSON de schéma.
Si vous créez une structure pour un jeu de données dans un groupe de jeux de données de domaine, ajoutez le
domain
paramètre et définissez-le surECOMMERCE
ouVIDEO_ON_DEMAND
. Pour plus d’informations sur l’API, consultez CreateSchema.Amazon Personalize renvoie l'ARN du nouveau schéma. Enregistrez-le car vous en aurez besoin à l'étape suivante.
-
Créez un ensemble de données à l'aide de l'CreateDatasetopération. Le code suivant montre comment créer un ensemble de données. Spécifiez le nom de ressource Amazon (ARN) de votre groupe de jeux de données, l'ARN du schéma de l'étape précédente et spécifiez le type de jeu de données. Les valeurs de type d'ensemble de données peuvent être
Interactions
Users
Items
,Actions
,, ouAction_Interactions
. Pour plus d'informations sur les différents types de jeux de données, consultezEnsembles de données et schémas.Après avoir créé un jeu de données, vous êtes prêt à importer vos données d'entraînement. veuillez consulter Préparation et importation de données en masse.