Analyse d'une colonne de chaîne contenant des données JSON

Cette transformation analyse une colonne de chaîne contenant des données JSON et la convertit en une structure ou en une colonne de tableau, selon que le JSON est respectivement un objet ou un tableau. Vous pouvez éventuellement conserver la colonne analysée et la colonne d'origine.

Le schéma JSON peut être fourni ou déduit (dans le cas des objets JSON), avec un échantillonnage facultatif.

Pour ajouter un nœud de transformation Analyser la colonne JSON à votre diagramme de tâches

Ouvrez le panneau Ressources, puis choisissez Analyser la colonne JSON pour ajouter une nouvelle transformation à votre diagramme de tâches. Le nœud sélectionné au moment de l'ajout du nœud sera son parent.
Dans le panneau des propriétés du nœud, vous pouvez saisir un nom pour le nœud dans le diagramme de tâches. Si aucun parent de nœud n'est déjà sélectionné, choisissez un nœud dans la liste de Node parents (Parents de nœud) à utiliser comme source pour la transformation.
Dans l'onglet Transformer, sélectionnez la colonne contenant la chaîne JSON.
(Facultatif) Dans l'onglet Transformer, saisissez le schéma suivi par les données JSON en utilisant la syntaxe SQL, par exemple : « field1 STRING, field2 INT » dans le cas d'un objet ou « ARRAY<STRING> » dans le cas d'un tableau.

Dans le cas d'un tableau, le schéma est obligatoire, mais dans le cas d'un objet, si le schéma n'est pas spécifié, il sera déduit à l'aide des données. Pour réduire l'impact de l'inférence du schéma (en particulier sur un jeu de données volumineux), vous pouvez éviter de lire le jeu de données deux fois en saisissant un Ratio d'échantillons à utiliser pour déduire le schéma. Si la valeur est inférieure à 1, le ratio correspondant d'échantillons aléatoires est utilisé pour déduire le schéma. Si les données sont fiables et que l'objet est cohérent entre les lignes, vous pouvez utiliser un faible ratio tel que 0,1 pour améliorer les performances.
(Facultatif) Dans l'onglet Transformer, vous pouvez saisir un nouveau nom de colonne si vous souhaitez conserver à la fois la colonne de chaîne d'origine et la colonne analysée.

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

Supprimer les lignes nulles

Extraction d'un chemin JSON