Sélectionner vos préférences de cookies

Nous utilisons des cookies essentiels et des outils similaires qui sont nécessaires au fonctionnement de notre site et à la fourniture de nos services. Nous utilisons des cookies de performance pour collecter des statistiques anonymes afin de comprendre comment les clients utilisent notre site et d’apporter des améliorations. Les cookies essentiels ne peuvent pas être désactivés, mais vous pouvez cliquer sur « Personnaliser » ou « Refuser » pour refuser les cookies de performance.

Si vous êtes d’accord, AWS et les tiers approuvés utiliseront également des cookies pour fournir des fonctionnalités utiles au site, mémoriser vos préférences et afficher du contenu pertinent, y compris des publicités pertinentes. Pour accepter ou refuser tous les cookies non essentiels, cliquez sur « Accepter » ou « Refuser ». Pour effectuer des choix plus détaillés, cliquez sur « Personnaliser ».

Utilisation de Spigot pour échantillonner votre jeu de données

Mode de mise au point
Utilisation de Spigot pour échantillonner votre jeu de données - AWS Glue

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Pour tester les transformations effectuées par votre tâche, vous pouvez obtenir un échantillon de données afin de vérifier que la transformation fonctionne comme prévu. La transformation Spigot écrit un sous-ensemble d'enregistrements à partir du jeu de données dans un fichier JSON situé dans un compartiment Amazon S3. La méthode d'échantillonnage des données peut être soit un nombre spécifique d'enregistrements à partir du début du fichier, soit un facteur de probabilité utilisé pour choisir les enregistrements.

Pour ajouter un nœud de transformation Spigot à votre diagramme de tâche
  1. (Facultatif) Ouvrez le panneau Ressources, puis choisissez Spigot pour ajouter une nouvelle transformation à votre diagramme de tâches, si nécessaire.

  2. Sur la page Node properties (Propriétés de nœud) au cours de la tâche, saisissez un nom pour le nœud dans le diagramme de tâche. Si aucun parent de nœud n'est déjà sélectionné, choisissez un nœud dans la liste Node parents (Parents de nœud) à utiliser comme source pour la transformation.

  3. Choisissez l'onglet Transformation dans le volet de détails du nœud.

  4. Saisissez un chemin d'accès Amazon S3 ou choisissez Browse S3 (Parcourir S3) pour choisir un emplacement dans Amazon S3. C'est l'emplacement où la tâche écrit le fichier JSON qui contient l'échantillon de données.

  5. Saisissez les informations relatives à la méthode d'échantillonnage. Vous pouvez spécifier une valeur pour le Number of records (Nombre d'enregistrements) à écrire en commençant par le début du jeu de données et un Probability threshold (Seuil de probabilité) (saisi comme une valeur décimale avec une valeur maximale de 1) permettant de choisir un enregistrement donné.

    Par exemple, pour écrire les 50 premiers enregistrements du jeu de données, vous devez définir le Number of records (Nombre d'enregistrements) à 50 et le Probability threshold (Seuil de probabilité) à 1 (100%).

ConfidentialitéConditions d'utilisation du sitePréférences de cookies
© 2025, Amazon Web Services, Inc. ou ses affiliés. Tous droits réservés.