Préparation et importation de données à l'aide d'Amazon SageMaker Data Wrangler - Amazon Personalize

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Préparation et importation de données à l'aide d'Amazon SageMaker Data Wrangler

Important

Lorsque vous utilisez Data Wrangler, vous encourez des frais SageMaker . Pour obtenir la liste complète des frais et des prix, consultez l'onglet Data Wrangler des tarifs Amazon SageMaker . Pour éviter d'encourir des frais supplémentaires, arrêtez votre instance Data Wrangler lorsque vous avez terminé. Pour plus d'informations, voir Arrêter Data Wrangler.

Après avoir créé un groupe de jeux de données, vous pouvez utiliser Amazon SageMaker Data Wrangler (Data Wrangler) pour importer des données provenant de plus de 40 sources dans un ensemble de données Amazon Personalize. Data Wrangler est une fonctionnalité d'Amazon SageMaker Studio Classic qui fournit une end-to-end solution pour importer, préparer, transformer et analyser des données. Vous ne pouvez pas utiliser Data Wrangler pour préparer et importer des données dans un ensemble de données Actions ou Action interactions.

Lorsque vous utilisez Data Wrangler pour préparer et importer des données, vous utilisez un flux de données. Un flux de données définit une série d'étapes de préparation des données d'apprentissage automatique, en commençant par l'importation des données. Chaque fois que vous ajoutez une étape à votre flux, Data Wrangler agit sur vos données, par exemple en les transformant ou en générant une visualisation.

Voici certaines des étapes que vous pouvez ajouter à votre flux pour préparer les données pour Amazon Personalize :

  • Informations : vous pouvez ajouter des étapes d'analyse spécifiques à Amazon Personalize à votre flux. Ces informations peuvent vous aider à mieux connaître vos données et les mesures que vous pouvez prendre pour les améliorer.

  • Visualisations : vous pouvez ajouter des étapes de visualisation pour générer des graphiques tels que des histogrammes et des nuages de points. Les graphiques peuvent vous aider à détecter les problèmes liés à vos données, tels que les valeurs aberrantes ou les valeurs manquantes.

  • Transformations : vous pouvez utiliser les étapes de transformation spécifiques et générales d'Amazon Personalize pour vous assurer que vos données répondent aux exigences d'Amazon Personalize. La transformation Amazon Personalize vous permet de mapper vos colonnes de données aux colonnes requises en fonction du type de jeu de données Amazon Personalize.

Si vous devez quitter Data Wrangler avant d'importer des données dans Amazon Personalize, vous pouvez revenir là où vous vous êtes arrêté en choisissant le même type de jeu de données lorsque vous lancez Data Wrangler depuis la console Amazon Personalize. Vous pouvez également accéder à Data Wrangler directement via SageMaker Studio Classic.

Nous vous recommandons d'importer les données de Data Wrangler dans Amazon Personalize comme suit. Les étapes de transformation, de visualisation et d'analyse sont facultatives, répétables et peuvent être effectuées dans n'importe quel ordre.

  1. Configurer les autorisations : configurez les autorisations pour Amazon Personalize et les rôles SageMaker de service. Et configurez des autorisations pour vos utilisateurs.

  2. Lancez Data Wrangler dans SageMaker Studio Classic depuis la console Amazon Personalize : utilisez la console Amazon Personalize pour configurer un SageMaker domaine et lancer Data Wrangler dans Studio Classic. SageMaker

  3. Importez vos données dans Data Wrangler - Importez des données provenant de plus de 40 sources dans Data Wrangler. Les sources incluent AWS des services, tels qu'Amazon Redshift, Amazon ou Amazon AthenaEMR, et des tiers tels que Snowflake ou. DataBricks

  4. Transformez vos données : utilisez Data Wrangler pour transformer vos données afin de répondre aux exigences d'Amazon Personalize.

  5. Visualisez et analysez vos données : utilisez Data Wrangler pour visualiser vos données et les analyser grâce à des informations spécifiques d'Amazon Personalize.

  6. Traitez et importez des données dans Amazon Personalize : utilisez un bloc-notes Jupyter SageMaker Studio Classic pour importer les données traitées dans Amazon Personalize.

Informations supplémentaires

Les ressources suivantes fournissent des informations supplémentaires sur l'utilisation d'Amazon SageMaker Data Wrangler et d'Amazon Personalize.