Sélectionner vos préférences de cookies

Nous utilisons des cookies essentiels et des outils similaires qui sont nécessaires au fonctionnement de notre site et à la fourniture de nos services. Nous utilisons des cookies de performance pour collecter des statistiques anonymes afin de comprendre comment les clients utilisent notre site et d’apporter des améliorations. Les cookies essentiels ne peuvent pas être désactivés, mais vous pouvez cliquer sur « Personnaliser » ou « Refuser » pour refuser les cookies de performance.

Si vous êtes d’accord, AWS et les tiers approuvés utiliseront également des cookies pour fournir des fonctionnalités utiles au site, mémoriser vos préférences et afficher du contenu pertinent, y compris des publicités pertinentes. Pour accepter ou refuser tous les cookies non essentiels, cliquez sur « Accepter » ou « Refuser ». Pour effectuer des choix plus détaillés, cliquez sur « Personnaliser ».

Filtrage des clés dans un jeu de données

Mode de mise au point
Filtrage des clés dans un jeu de données - AWS Glue

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Utiliser la transformation Filter (Filtrer) pour créer un jeu de données en filtrant les enregistrements du jeu de données source en fonction d'une expression régulière. Les lignes qui ne satisfont pas à la condition de filtre sont retirées du résultat.

  • Pour les types de données de chaîne, vous pouvez filtrer les lignes où la valeur clé correspond à une chaîne spécifiée.

  • Pour les types de données numériques, vous pouvez filtrer les lignes en comparant la valeur clé à une valeur spécifiée, à l'aide des opérateurs de comparaison <, >, =, !=, <= et >=.

Si vous spécifiez plusieurs conditions de filtrage, les résultats sont combinés à l'aide d'un opérateur AND par défaut, mais vous pouvez choisir OR à la place.

La transformation Filter (Filtrer) est sensible à la casse. Ajoutez une transformation ApplyMapping comme nœud parent si vous avez besoin de noms de clés de propriété insensibles à la casse.

Pour ajouter un nœud de transformation de filtre à votre diagramme de tâche
  1. (Facultatif) Ouvrez le panneau Ressources, puis choisissez Filtrer pour ajouter une nouvelle transformation à votre diagramme de tâches, si nécessaire.

  2. Sur la page Node properties (Propriétés de nœud) au cours de la tâche, saisissez un nom pour le nœud dans le diagramme de tâche. Si aucun parent de nœud n'est déjà sélectionné, choisissez un nœud dans la liste Node parents (Parent de nœud) à utiliser comme source pour la transformation.

  3. Choisissez l'onglet Transformation.

  4. Choisissez soit ET global, soit OU global. Cela détermine la façon dont plusieurs conditions de filtrage sont combinées. Toutes les conditions sont combinées en utilisant les opérations AND ou OR. Si vous n'avez qu'une seule condition de filtre, vous pouvez choisir l'une ou l'autre.

  5. Cliquez sur le bouton Add condition (Ajouter une condition) dans la section Filter condition (Condition de filtrage) pour ajouter une condition de filtre.

    Dans le champ Key (Clé), choisissez un nom de clé de propriété dans le jeu de données. Dans le champ Opération, choisissez l'opérateur de comparaison. Dans le champ Valeur, saisissez la valeur de comparaison. Voici quelques exemples de conditions de filtrage :

    • year >= 2018

    • State matches 'CA*'

    Lorsque vous filtrez des valeurs de chaîne, assurez-vous que la valeur de comparaison utilise un format d'expression régulière qui correspond au langage de script sélectionné dans les propriétés de la tâche (Python ou Scala).

  6. Ajoutez des conditions de filtrage supplémentaires, si nécessaire.

  7. (Facultatif) Après avoir configuré les propriétés du nœud de transformation, vous pouvez afficher le schéma modifié pour vos données en sélectionnant l'onglet Output Schema (Schéma de sortie) dans le volet de détails du nœud. La première fois que vous choisissez cet onglet pour un nœud de votre tâche, vous êtes invité à fournir un rôle IAM pour accéder aux données. Si vous n'avez pas spécifié de rôle IAM dans le Job détails (Détails de la tâche), vous y êtes invité à ce stade.

  8. (Facultatif) Après avoir configuré les propriétés du nœud et les propriétés de transformation, vous pouvez prévisualiser le jeu de données modifié en sélectionnant l'onglet Prévisualisation des données dans le volet de détails du nœud. La première fois que vous choisissez cet onglet pour un nœud de votre tâche, vous êtes invité à fournir un rôle IAM pour accéder aux données. Il y a un coût associé à l'utilisation de cette fonction, et la facturation commence dès que vous fournissez le rôle IAM.

ConfidentialitéConditions d'utilisation du sitePréférences de cookies
© 2025, Amazon Web Services, Inc. ou ses affiliés. Tous droits réservés.