Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Préparation et importation de données en masse à l'aide d'Amazon SageMaker AI Data Wrangler
Important
Lorsque vous utilisez Data Wrangler, vous encourez des coûts liés à l'IA. SageMaker Pour obtenir la liste complète des frais et des prix, consultez l'onglet Data Wrangler des tarifs d'Amazon SageMaker AI
Après avoir créé un groupe de jeux de données, vous pouvez utiliser Amazon SageMaker AI Data Wrangler (Data Wrangler) pour importer des données provenant de plus de 40 sources dans un ensemble de données Amazon Personalize. Data Wrangler est une fonctionnalité d'Amazon SageMaker AI Studio Classic qui fournit une end-to-end solution pour importer, préparer, transformer et analyser des données. Vous ne pouvez pas utiliser Data Wrangler pour préparer et importer des données dans un ensemble de données Actions ou Action interactions.
Lorsque vous utilisez Data Wrangler pour préparer et importer des données, vous utilisez un flux de données. Un flux de données définit une série d'étapes de préparation des données d'apprentissage automatique, en commençant par l'importation des données. Chaque fois que vous ajoutez une étape à votre flux, Data Wrangler agit sur vos données, par exemple en les transformant ou en générant une visualisation.
Voici certaines des étapes que vous pouvez ajouter à votre flux pour préparer les données pour Amazon Personalize :
-
Informations : vous pouvez ajouter des étapes d'analyse spécifiques à Amazon Personalize à votre flux. Ces informations peuvent vous aider à mieux connaître vos données et les mesures que vous pouvez prendre pour les améliorer.
-
Visualisations : vous pouvez ajouter des étapes de visualisation pour générer des graphiques tels que des histogrammes et des nuages de points. Les graphiques peuvent vous aider à détecter les problèmes liés à vos données, tels que les valeurs aberrantes ou les valeurs manquantes.
-
Transformations : vous pouvez utiliser les étapes de transformation spécifiques et générales d'Amazon Personalize pour vous assurer que vos données répondent aux exigences d'Amazon Personalize. La transformation Amazon Personalize vous permet de mapper vos colonnes de données aux colonnes requises en fonction du type de jeu de données Amazon Personalize.
Si vous devez quitter Data Wrangler avant d'importer des données dans Amazon Personalize, vous pouvez revenir là où vous vous êtes arrêté en choisissant le même type de jeu de données lorsque vous lancez Data Wrangler depuis la console Amazon Personalize. Vous pouvez également accéder à Data Wrangler directement via SageMaker AI Studio Classic.
Nous vous recommandons d'importer les données de Data Wrangler dans Amazon Personalize comme suit. Les étapes de transformation, de visualisation et d'analyse sont facultatives, répétables et peuvent être effectuées dans n'importe quel ordre.
-
Configurer les autorisations : configurez les autorisations pour Amazon Personalize et les rôles de service SageMaker AI. Et configurez des autorisations pour vos utilisateurs.
-
Lancez Data Wrangler dans SageMaker AI Studio Classic depuis la console Amazon Personalize : utilisez la console Amazon Personalize pour configurer un domaine SageMaker AI et lancez Data Wrangler dans SageMaker AI Studio Classic.
-
Importez vos données dans Data Wrangler - Importez des données provenant de plus de 40 sources dans Data Wrangler. Les sources incluent AWS des services, tels qu'Amazon Redshift, Amazon ou Amazon AthenaEMR, et des tiers tels que Snowflake ou. DataBricks
-
Transformez vos données : utilisez Data Wrangler pour transformer vos données afin de répondre aux exigences d'Amazon Personalize.
-
Visualisez et analysez vos données : utilisez Data Wrangler pour visualiser vos données et les analyser grâce à des informations spécifiques d'Amazon Personalize.
-
Traitez et importez des données dans Amazon Personalize : utilisez un bloc-notes Jupyter SageMaker AI Studio Classic pour importer vos données traitées dans Amazon Personalize.
Informations supplémentaires
Les ressources suivantes fournissent des informations supplémentaires sur l'utilisation d'Amazon SageMaker AI Data Wrangler et d'Amazon Personalize.
-
Pour un didacticiel expliquant le traitement et la transformation d'un exemple de jeu de données, consultez Demo : Data Wrangler Titanic Dataset Walkthrough dans le guide du développeur Amazon SageMaker AI. Ce didacticiel présente les champs et les fonctions de Data Wrangler.
-
Pour plus d'informations sur l'intégration aux domaines Amazon SageMaker AI, consultez la section Intégration rapide au domaine Amazon SageMaker AI dans le manuel Amazon SageMaker AI Developer Guide.
-
Pour plus d'informations sur les exigences relatives aux données d'Amazon Personalize, consultezPréparation des données de formation pour Amazon Personalize.