Sélectionner vos préférences de cookies

Nous utilisons des cookies essentiels et des outils similaires qui sont nécessaires au fonctionnement de notre site et à la fourniture de nos services. Nous utilisons des cookies de performance pour collecter des statistiques anonymes afin de comprendre comment les clients utilisent notre site et d’apporter des améliorations. Les cookies essentiels ne peuvent pas être désactivés, mais vous pouvez cliquer sur « Personnaliser » ou « Refuser » pour refuser les cookies de performance.

Si vous êtes d’accord, AWS et les tiers approuvés utiliseront également des cookies pour fournir des fonctionnalités utiles au site, mémoriser vos préférences et afficher du contenu pertinent, y compris des publicités pertinentes. Pour accepter ou refuser tous les cookies non essentiels, cliquez sur « Accepter » ou « Refuser ». Pour effectuer des choix plus détaillés, cliquez sur « Personnaliser ».

Analyse d'une colonne de chaîne contenant des données JSON

Mode de mise au point
Analyse d'une colonne de chaîne contenant des données JSON - AWS Glue

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Cette transformation analyse une colonne de chaîne contenant des données JSON et la convertit en une structure ou en une colonne de tableau, selon que le JSON est respectivement un objet ou un tableau. Vous pouvez éventuellement conserver la colonne analysée et la colonne d'origine.

Le schéma JSON peut être fourni ou déduit (dans le cas des objets JSON), avec un échantillonnage facultatif.

Pour ajouter un nœud de transformation Analyser la colonne JSON à votre diagramme de tâches
  1. Ouvrez le panneau Ressources, puis choisissez Analyser la colonne JSON pour ajouter une nouvelle transformation à votre diagramme de tâches. Le nœud sélectionné au moment de l'ajout du nœud sera son parent.

  2. Dans le panneau des propriétés du nœud, vous pouvez saisir un nom pour le nœud dans le diagramme de tâches. Si aucun parent de nœud n'est déjà sélectionné, choisissez un nœud dans la liste de Node parents (Parents de nœud) à utiliser comme source pour la transformation.

  3. Dans l'onglet Transformer, sélectionnez la colonne contenant la chaîne JSON.

  4. (Facultatif) Dans l'onglet Transformer, saisissez le schéma suivi par les données JSON en utilisant la syntaxe SQL, par exemple : « field1 STRING, field2 INT » dans le cas d'un objet ou « ARRAY<STRING> » dans le cas d'un tableau.

    Dans le cas d'un tableau, le schéma est obligatoire, mais dans le cas d'un objet, si le schéma n'est pas spécifié, il sera déduit à l'aide des données. Pour réduire l'impact de l'inférence du schéma (en particulier sur un jeu de données volumineux), vous pouvez éviter de lire le jeu de données deux fois en saisissant un Ratio d'échantillons à utiliser pour déduire le schéma. Si la valeur est inférieure à 1, le ratio correspondant d'échantillons aléatoires est utilisé pour déduire le schéma. Si les données sont fiables et que l'objet est cohérent entre les lignes, vous pouvez utiliser un faible ratio tel que 0,1 pour améliorer les performances.

  5. (Facultatif) Dans l'onglet Transformer, vous pouvez saisir un nouveau nom de colonne si vous souhaitez conserver à la fois la colonne de chaîne d'origine et la colonne analysée.

ConfidentialitéConditions d'utilisation du sitePréférences de cookies
© 2025, Amazon Web Services, Inc. ou ses affiliés. Tous droits réservés.