Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Utiliser la transformation Filter (Filtrer) pour créer un jeu de données en filtrant les enregistrements du jeu de données source en fonction d'une expression régulière. Les lignes qui ne satisfont pas à la condition de filtre sont retirées du résultat.
-
Pour les types de données de chaîne, vous pouvez filtrer les lignes où la valeur clé correspond à une chaîne spécifiée.
-
Pour les types de données numériques, vous pouvez filtrer les lignes en comparant la valeur clé à une valeur spécifiée, à l'aide des opérateurs de comparaison
<
,>
,=
,!=
,<=
et>=
.
Si vous spécifiez plusieurs conditions de filtrage, les résultats sont combinés à l'aide d'un opérateur AND
par défaut, mais vous pouvez choisir OR
à la place.
La transformation Filter (Filtrer) est sensible à la casse. Ajoutez une transformation ApplyMapping comme nœud parent si vous avez besoin de noms de clés de propriété insensibles à la casse.
Pour ajouter un nœud de transformation de filtre à votre diagramme de tâche
-
(Facultatif) Ouvrez le panneau Ressources, puis choisissez Filtrer pour ajouter une nouvelle transformation à votre diagramme de tâches, si nécessaire.
-
Sur la page Node properties (Propriétés de nœud) au cours de la tâche, saisissez un nom pour le nœud dans le diagramme de tâche. Si aucun parent de nœud n'est déjà sélectionné, choisissez un nœud dans la liste Node parents (Parent de nœud) à utiliser comme source pour la transformation.
-
Choisissez l'onglet Transformation.
-
Choisissez soit ET global, soit OU global. Cela détermine la façon dont plusieurs conditions de filtrage sont combinées. Toutes les conditions sont combinées en utilisant les opérations
AND
ouOR
. Si vous n'avez qu'une seule condition de filtre, vous pouvez choisir l'une ou l'autre. -
Cliquez sur le bouton Add condition (Ajouter une condition) dans la section Filter condition (Condition de filtrage) pour ajouter une condition de filtre.
Dans le champ Key (Clé), choisissez un nom de clé de propriété dans le jeu de données. Dans le champ Opération, choisissez l'opérateur de comparaison. Dans le champ Valeur, saisissez la valeur de comparaison. Voici quelques exemples de conditions de filtrage :
-
year >= 2018
-
State matches 'CA*'
Lorsque vous filtrez des valeurs de chaîne, assurez-vous que la valeur de comparaison utilise un format d'expression régulière qui correspond au langage de script sélectionné dans les propriétés de la tâche (Python ou Scala).
-
-
Ajoutez des conditions de filtrage supplémentaires, si nécessaire.
(Facultatif) Après avoir configuré les propriétés du nœud de transformation, vous pouvez afficher le schéma modifié pour vos données en sélectionnant l'onglet Output Schema (Schéma de sortie) dans le volet de détails du nœud. La première fois que vous choisissez cet onglet pour un nœud de votre tâche, vous êtes invité à fournir un rôle IAM pour accéder aux données. Si vous n'avez pas spécifié de rôle IAM dans le Job détails (Détails de la tâche), vous y êtes invité à ce stade.
(Facultatif) Après avoir configuré les propriétés du nœud et les propriétés de transformation, vous pouvez prévisualiser le jeu de données modifié en sélectionnant l'onglet Prévisualisation des données dans le volet de détails du nœud. La première fois que vous choisissez cet onglet pour un nœud de votre tâche, vous êtes invité à fournir un rôle IAM pour accéder aux données. Il y a un coût associé à l'utilisation de cette fonction, et la facturation commence dès que vous fournissez le rôle IAM.