Sélectionner vos préférences de cookies

Nous utilisons des cookies essentiels et des outils similaires qui sont nécessaires au fonctionnement de notre site et à la fourniture de nos services. Nous utilisons des cookies de performance pour collecter des statistiques anonymes afin de comprendre comment les clients utilisent notre site et d’apporter des améliorations. Les cookies essentiels ne peuvent pas être désactivés, mais vous pouvez cliquer sur « Personnaliser » ou « Refuser » pour refuser les cookies de performance.

Si vous êtes d’accord, AWS et les tiers approuvés utiliseront également des cookies pour fournir des fonctionnalités utiles au site, mémoriser vos préférences et afficher du contenu pertinent, y compris des publicités pertinentes. Pour accepter ou refuser tous les cookies non essentiels, cliquez sur « Accepter » ou « Refuser ». Pour effectuer des choix plus détaillés, cliquez sur « Personnaliser ».

Affichage des statistiques de colonne

Mode de mise au point
Affichage des statistiques de colonne - AWS Glue

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Une fois les statistiques générées avec succès, Data Catalog stocke ces informations pour les optimiseurs basés sur les coûts Amazon Athena et Amazon Redshift afin de faire des choix optimaux lors de l'exécution de requêtes. Les statistiques varient en fonction du type de colonne.

AWS Management Console
Pour afficher les statistiques de colonne d'une table
  • Après avoir exécuté la tâche de statistiques de colonne, l'onglet Statistiques de colonne de la page Détails de la table affiche les statistiques pour la table.

    La capture d'écran montre les colonnes générées à partir de la dernière exécution.

    Les statistiques suivantes sont disponibles :

    • Nom de colonne : nom de colonne utilisé pour générer des statistiques

    • Dernière mise à jour : date et heure de génération des statistiques

    • Longueur moyenne : longueur moyenne des valeurs dans la colonne

    • Valeurs distinctes : nombre total de valeurs distinctes dans la colonne. Nous estimons le nombre de valeurs distinctes dans une colonne avec une erreur relative de 5 %.

    • Valeur maximale : la plus grande valeur de la colonne.

    • Valeur minimale : la plus petite valeur de la colonne.

    • Longueur maximale : longueur de la valeur la plus élevée dans la colonne.

    • Valeurs nulles : nombre total de valeurs nulles dans la colonne.

    • Valeurs réelles : nombre total de valeurs réelles dans la colonne.

    • Valeurs fausses : nombre total de valeurs fausses dans la colonne.

    • NumFiles : nombre total de fichiers dans la table. Cette valeur est disponible sous l'onglet Propriétés avancées.

AWS CLI

L'exemple suivant montre comment récupérer les statistiques de colonne à l'aide de la AWS CLI.

aws glue get-column-statistics-for-table \ --database-name database_name \ --table-name table_name \ --column-names <column_name>

Vous pouvez également consulter les statistiques des colonnes à l'aide de l'opération GetColumnStatisticsForTableAPI.

Pour afficher les statistiques de colonne d'une table
  • Après avoir exécuté la tâche de statistiques de colonne, l'onglet Statistiques de colonne de la page Détails de la table affiche les statistiques pour la table.

    La capture d'écran montre les colonnes générées à partir de la dernière exécution.

    Les statistiques suivantes sont disponibles :

    • Nom de colonne : nom de colonne utilisé pour générer des statistiques

    • Dernière mise à jour : date et heure de génération des statistiques

    • Longueur moyenne : longueur moyenne des valeurs dans la colonne

    • Valeurs distinctes : nombre total de valeurs distinctes dans la colonne. Nous estimons le nombre de valeurs distinctes dans une colonne avec une erreur relative de 5 %.

    • Valeur maximale : la plus grande valeur de la colonne.

    • Valeur minimale : la plus petite valeur de la colonne.

    • Longueur maximale : longueur de la valeur la plus élevée dans la colonne.

    • Valeurs nulles : nombre total de valeurs nulles dans la colonne.

    • Valeurs réelles : nombre total de valeurs réelles dans la colonne.

    • Valeurs fausses : nombre total de valeurs fausses dans la colonne.

    • NumFiles : nombre total de fichiers dans la table. Cette valeur est disponible sous l'onglet Propriétés avancées.

ConfidentialitéConditions d'utilisation du sitePréférences de cookies
© 2025, Amazon Web Services, Inc. ou ses affiliés. Tous droits réservés.