Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Création d'une tâche d'exportation de jeux de données dans Amazon Personalize
Vous pouvez créer une tâche d'exportation de jeux de données à l'aide de la console Amazon Personalize, AWS Command Line Interface (AWS CLI) ou AWS SDKs.
Création d'une tâche d'exportation de jeux de données (console)
Après avoir importé vos données dans un ensemble de données et créé un compartiment Amazon S3 en sortie, vous pouvez exporter les données vers le compartiment à des fins d'analyse. Pour exporter un ensemble de données à l'aide de la console Amazon Personalize, vous devez créer une tâche d'exportation de jeu de données. Pour plus d'informations sur la création d'un compartiment Amazon S3, consultez la section Création d'un compartiment dans le guide de l'utilisateur d'Amazon Simple Storage Service.
Avant d'exporter un ensemble de données, assurez-vous que votre rôle de service Amazon Personalize peut accéder à votre compartiment Amazon S3 de sortie et y écrire. Consultez Exigences relatives aux autorisations d'exportation de jeux de données.
Pour créer une tâche d'exportation d'un ensemble de données (console)
-
Ouvrez la console Amazon Personalize à la https://console.aws.amazon.com/personalize/maison
. -
Dans le volet de navigation, sélectionnez Groupes de jeux de données.
-
Sur la page Groupes de jeux de données, choisissez votre groupe de jeux de données.
-
Dans le volet de navigation, sélectionnez Datasets.
-
Choisissez l'ensemble de données que vous souhaitez exporter vers un compartiment Amazon S3.
-
Dans Tâches d'exportation de jeux de données, choisissez Créer une tâche d'exportation de jeu de données.
-
Dans Détails de la tâche d'exportation de l'ensemble de données, pour le nom de la tâche d'exportation de l'ensemble de données, entrez le nom de la tâche d'exportation.
-
Pour le rôle de service IAM, choisissez le rôle de service Amazon Personalize que vous avez créé dansCréation d'un rôle IAM pour Amazon Personalize.
-
Pour le chemin de sortie des données Amazon S3, entrez le compartiment Amazon S3 de destination. Utilisez la syntaxe suivante :
s3://amzn-s3-demo-bucket/<folder path>
-
Si vous utilisez AWS KMS pour le chiffrement, pour l'ARN de la clé KMS, entrez le nom de ressource Amazon (ARN) de la AWS KMS clé.
-
Pour Exporter le type de données, choisissez le type de données à exporter en fonction de la façon dont vous avez initialement importé les données.
-
Choisissez Bulk pour exporter uniquement les données que vous avez importées en bloc à l'aide d'une tâche d'importation de jeux de données.
-
Choisissez Incremental pour exporter uniquement les données que vous avez importées individuellement à l'aide de la console ou
PutItems
des opérationsPutEvents
PutUsers
, ou. -
Choisissez Les deux pour exporter toutes les données de l'ensemble de données.
-
-
Pour les balises, ajoutez éventuellement des balises. Pour plus d'informations sur le balisage des ressources Amazon Personalize, consultezMarquer les ressources Amazon Personalize.
-
Choisissez Créer une tâche d'exportation de jeux de données.
Sur la page d'aperçu de l'ensemble de données, dans Tâches d'exportation de l'ensemble de données, la tâche est répertoriée avec un statut de tâche d'exportation. La tâche d'exportation du jeu de données est terminée lorsque le statut est ACTIF. Vous pouvez ensuite télécharger les données depuis le compartiment Amazon S3 de sortie. Pour plus d'informations sur le téléchargement d'objets depuis un compartiment Amazon S3, consultez la section Téléchargement d'un objet dans le guide de l'utilisateur d'Amazon Simple Storage Service. .
Création d'une tâche d'exportation de jeux de données (AWS CLI)
Après avoir importé vos données dans le jeu de données et créé un compartiment Amazon S3 en sortie, vous pouvez exporter l'ensemble de données vers le compartiment à des fins d'analyse. Pour exporter un ensemble de données à l'aide de AWS CLI, créez une tâche d'exportation d'ensemble de données à l'aide de la create-dataset-export-job
AWS CLI commande. Pour plus d'informations sur la création d'un compartiment Amazon S3, consultez la section Création d'un compartiment dans le guide de l'utilisateur d'Amazon Simple Storage Service.
Avant d'exporter un ensemble de données, assurez-vous que le rôle de service Amazon Personalize peut accéder à votre compartiment Amazon S3 de sortie et y écrire. Consultez Exigences relatives aux autorisations d'exportation de jeux de données.
Voici un exemple de la commande create-dataset-export-job
AWS CLI . Donnez un nom à la tâche, remplacez-le dataset arn
par le nom de ressource Amazon (ARN) de l'ensemble de données que vous souhaitez exporter et remplacez-le role ARN
par l'ARN du rôle de service Amazon Personalize dans lequel vous l'avez crééCréation d'un rôle IAM pour Amazon Personalize. Danss3DataDestination
, pour lekmsKeyArn
, indiquez éventuellement l'ARN de votre AWS KMS clé, et pour le, path
fournissez le chemin d'accès à votre compartiment Amazon S3 de sortie.
Pouringestion-mode
, spécifiez les données à exporter à partir des options suivantes :
-
Spécifiez
BULK
de n'exporter que les données que vous avez importées en masse à l'aide d'une tâche d'importation de jeux de données. -
Spécifiez
PUT
de n'exporter que les données que vous avez importées individuellement à l'aide de la console ouPutItems
des opérationsPutEvents
PutUsers, ou. -
Spécifiez
ALL
d'exporter toutes les données de l'ensemble de données.
Pour de plus amples informations, veuillez consulter CreateDatasetExportJob.
aws personalize create-dataset-export-job \
--job-name job name
\
--dataset-arn dataset ARN
\
--job-output "{\"s3DataDestination\":{\"kmsKeyArn\":\"kms key ARN
\",\"path\":\"s3://amzn-s3-demo-bucket
/folder-name
/\"}}" \
--role-arn role ARN
\
--ingestion-mode PUT
L'ARN de la tâche d'exportation du jeu de données s'affiche.
{
"datasetExportJobArn": "arn:aws:personalize:us-west-2:acct-id:dataset-export-job/DatasetExportJobName"
}
Utilisez cette DescribeDatasetExportJob
opération pour vérifier l'état.
aws personalize describe-dataset-export-job \ --dataset-export-job-arn
dataset export job ARN
Création d'une tâche d'exportation de jeux de données (AWS SDKs)
Après avoir importé vos données dans le jeu de données et créé un compartiment Amazon S3 en sortie, vous pouvez exporter l'ensemble de données vers le compartiment à des fins d'analyse. Pour exporter un ensemble de données à l'aide de AWS SDKs, créez une tâche d'exportation d'ensemble de données à l'aide de l'CreateDatasetExportJobopération. Pour plus d'informations sur la création d'un compartiment Amazon S3, consultez la section Création d'un compartiment dans le guide de l'utilisateur d'Amazon Simple Storage Service.
Le code suivant montre comment créer une tâche d'exportation de jeu de données à l'aide du SDK pour Python (Boto3) ou du SDK SDK pour Java 2.x.
Avant d'exporter un ensemble de données, assurez-vous que le rôle de service Amazon Personalize peut accéder à votre compartiment Amazon S3 de sortie et y écrire. Consultez Exigences relatives aux autorisations d'exportation de jeux de données.
Utilisez ce qui suit create_dataset_export_job
pour exporter les données d'un ensemble de données vers un compartiment Amazon S3. Donnez un nom à la tâche, remplacez-le dataset arn
par le nom de ressource Amazon (ARN) de l'ensemble de données que vous souhaitez exporter et remplacez-le role ARN
par l'ARN du rôle de service Amazon Personalize dans lequel vous l'avez crééCréation d'un rôle IAM pour Amazon Personalize. Danss3DataDestination
, pour lekmsKeyArn
, indiquez éventuellement l'ARN de votre AWS KMS clé, et pour le, path
fournissez le chemin d'accès à votre compartiment Amazon S3 de sortie.
PouringestionMode
, spécifiez les données à exporter à partir des options suivantes :
-
Spécifiez
BULK
de n'exporter que les données que vous avez importées en masse à l'aide d'une tâche d'importation de jeux de données. -
Spécifiez
PUT
de n'exporter que les données que vous avez importées individuellement à l'aide de la console ouPutItems
des opérationsPutEvents
PutUsers, ou. -
Spécifiez
ALL
d'exporter toutes les données de l'ensemble de données.
import boto3
personalize = boto3.client('personalize')
response = personalize.create_dataset_export_job(
jobName = 'job name
',
datasetArn = 'dataset ARN
',
jobOutput = {
"s3DataDestination": {
"kmsKeyArn": "kms key ARN
",
"path": "s3://amzn-s3-demo-bucket/folder-name/
"
}
},
roleArn = 'role ARN
',
ingestionMode = 'PUT
'
)
dsej_arn = response['datasetExportJobArn']
print ('Dataset Export Job arn: ' + dsej_arn)
description = personalize.describe_dataset_export_job(
datasetExportJobArn = dsej_arn)['datasetExportJob']
print('Name: ' + description['jobName'])
print('ARN: ' + description['datasetExportJobArn'])
print('Status: ' + description['status'])