Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Pour tester les transformations effectuées par votre tâche, vous pouvez obtenir un échantillon de données afin de vérifier que la transformation fonctionne comme prévu. La transformation Spigot écrit un sous-ensemble d'enregistrements à partir du jeu de données dans un fichier JSON situé dans un compartiment Amazon S3. La méthode d'échantillonnage des données peut être soit un nombre spécifique d'enregistrements à partir du début du fichier, soit un facteur de probabilité utilisé pour choisir les enregistrements.
Pour ajouter un nœud de transformation Spigot à votre diagramme de tâche
-
(Facultatif) Ouvrez le panneau Ressources, puis choisissez Spigot pour ajouter une nouvelle transformation à votre diagramme de tâches, si nécessaire.
-
Sur la page Node properties (Propriétés de nœud) au cours de la tâche, saisissez un nom pour le nœud dans le diagramme de tâche. Si aucun parent de nœud n'est déjà sélectionné, choisissez un nœud dans la liste Node parents (Parents de nœud) à utiliser comme source pour la transformation.
-
Choisissez l'onglet Transformation dans le volet de détails du nœud.
-
Saisissez un chemin d'accès Amazon S3 ou choisissez Browse S3 (Parcourir S3) pour choisir un emplacement dans Amazon S3. C'est l'emplacement où la tâche écrit le fichier JSON qui contient l'échantillon de données.
-
Saisissez les informations relatives à la méthode d'échantillonnage. Vous pouvez spécifier une valeur pour le Number of records (Nombre d'enregistrements) à écrire en commençant par le début du jeu de données et un Probability threshold (Seuil de probabilité) (saisi comme une valeur décimale avec une valeur maximale de 1) permettant de choisir un enregistrement donné.
Par exemple, pour écrire les 50 premiers enregistrements du jeu de données, vous devez définir le Number of records (Nombre d'enregistrements) à 50 et le Probability threshold (Seuil de probabilité) à 1 (100%).