Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Modifier les étapes du flux de données
Dans Amazon SageMaker Canvas, vous pouvez modifier les étapes individuelles de vos flux de données afin de transformer votre ensemble de données sans avoir à créer un nouveau flux de données. La page suivante explique comment modifier les étapes de jointure et de concaténation, ainsi que les étapes de la source de données.
Modifier les étapes de jointure et de concaténation
Dans vos flux de données, vous avez la possibilité de modifier vos étapes de jointure et de concaténation. Vous pouvez apporter les ajustements nécessaires à votre flux de traitement des données, en veillant à ce que vos données soient correctement combinées et transformées sans avoir à refaire l'intégralité de votre flux de données.
Pour modifier une étape de jointure ou de concaténation dans votre flux de données, procédez comme suit :
-
Ouvrez votre flux de données.
-
Choisissez l'icône plus (+) à côté du nœud de jointure ou de concaténation que vous souhaitez modifier.
-
Dans le menu contextuel, choisissez Edit.
-
Un panneau latéral s'ouvre dans lequel vous pouvez modifier les détails de votre jointure ou de votre concaténation. Modifiez les champs de vos étapes, tels que le type de jointure. Pour remplacer un nœud de données et en sélectionner un autre à joindre ou à concaténer, cliquez sur l'icône de suppression à côté du nœud, puis, dans la vue du flux de données, sélectionnez le nouveau nœud que vous souhaitez inclure dans votre transformation.
Note
Lorsque vous échangez un nœud pendant le processus d'édition, vous ne pouvez sélectionner que les étapes qui se produisent avant l'opération de jointure ou de concaténation. Vous pouvez échanger le nœud gauche ou droit, mais vous ne pouvez échanger qu'un seul nœud à la fois. En outre, vous ne pouvez pas sélectionner un nœud source en remplacement.
-
Choisissez Aperçu pour afficher le résultat de l'opération de combinaison.
-
Choisissez Mettre à jour pour enregistrer vos modifications.
Votre flux de données devrait maintenant être mis à jour.
Modifier ou remplacer une étape de source de données
Vous devrez peut-être apporter des modifications à votre source de données ou à votre jeu de données sans supprimer les transformations et les étapes de flux de données appliquées à vos données d'origine. Dans Data Wrangler, vous pouvez modifier ou remplacer la configuration de votre source de données tout en respectant les étapes de votre flux de données. Lorsque vous modifiez une source de données, vous pouvez modifier les paramètres d'importation, tels que la taille ou la méthode d'échantillonnage, ainsi que les paramètres avancés. Vous pouvez également ajouter d'autres fichiers avec le même schéma, ou pour les sources de données basées sur des requêtes telles qu'Amazon Athena, vous pouvez modifier la requête. Lorsque vous remplacez une source de données, vous avez la possibilité de sélectionner un autre jeu de données, ou même d'importer les données d'une source de données complètement différente, à condition que le schéma des nouvelles données corresponde aux données d'origine.
Pour modifier la configuration d'une source de données, procédez comme suit :
-
Dans l'application Canvas, accédez à la page Data Wrangler.
-
Choisissez votre flux de données pour le visualiser.
-
Dans l'onglet Flux de données qui indique les étapes de votre flux de données, recherchez le nœud Source que vous souhaitez modifier.
-
Cliquez sur l'icône représentant des points de suspension à côté du nœud Source.
-
Dans le menu contextuel, choisissez Edit.
-
Pour les sources de données Amazon S3 et le téléchargement local, vous avez la possibilité de sélectionner ou de télécharger d'autres fichiers avec le même schéma que vos données d'origine. Pour les sources de données basées sur des requêtes telles qu'Amazon Athena, vous pouvez supprimer et sélectionner différentes tables dans le générateur visuel de requêtes, ou vous pouvez modifier directement la requête SQL. Lorsque vous avez terminé, sélectionnez Next.
-
Pour les paramètres d'importation, apportez les modifications souhaitées.
-
Lorsque vous avez terminé, choisissez Enregistrer les modifications.
Votre source de données devrait maintenant être mise à jour.
Pour remplacer une source de données, procédez comme suit :
-
Dans l'application Canvas, accédez à la page Data Wrangler.
-
Choisissez votre flux de données pour le visualiser.
-
Dans l'onglet Flux de données qui indique les étapes de votre flux de données, recherchez le nœud Source que vous souhaitez modifier.
-
Cliquez sur l'icône représentant des points de suspension à côté du nœud Source.
-
Dans le menu contextuel, choisissez Remplacer.
-
Passez par l'étape de création d'un flux de données pour sélectionner une autre source de données et des données.
-
Lorsque vous avez sélectionné vos données et que vous êtes prêt à mettre à jour le nœud source, choisissez Enregistrer.
Vous devriez maintenant voir le nœud Source mis à jour dans votre flux de données.