Génération de statistiques de colonnes pour les tables Iceberg - AWS Glue

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Génération de statistiques de colonnes pour les tables Iceberg

Procédez comme suit pour configurer un calendrier de génération de statistiques dans le catalogue de données à l'aide de la AWS Glue console AWS CLI ou de l'opération ou exécutez l'StartColumnStatisticsTaskRunopération.

Pour générer des statistiques sur les colonnes
  1. Connectez-vous à la AWS Glue console à l'adresse https://console.aws.amazon.com/glue/.

  2. Choisissez Tables sous Catalogue de données.

  3. Choisissez une table Iceberg dans la liste.

  4. Choisissez Statistiques de colonne, Générer à la demande, dans le menu Actions.

    Vous pouvez également choisir le bouton Générer des statistiques sous l'onglet Statistiques de colonne dans la section inférieure de la page Tables.

  5. Sur la page Générer des statistiques, fournissez les détails relatifs à la génération des statistiques. Suivez les étapes 6 à 11 de la Génération de statistiques sur les colonnes selon un calendrier section pour configurer un calendrier de génération de statistiques pour les tables Iceberg.

    Vous pouvez également choisir de générer des statistiques de colonnes à la demande en suivant les instructions du Génération de statistiques de colonnes à la demande

    Note

    L'option d'échantillonnage n'est pas disponible pour les tables Iceberg.

    AWS Glue calcule le nombre de valeurs distinctes pour chaque colonne de la table Iceberg dans un nouveau fichier Puffin validé avec l'ID de snapshot spécifié dans votre emplacement Amazon S3.