Apache Iceberg tables en AWS Clean Rooms - AWS Clean Rooms

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Apache Iceberg tables en AWS Clean Rooms

Apache Iceberg est un format de table open source pour les lacs de données. AWS Clean Rooms peut utiliser les statistiques stockées dans Apache Iceberg métadonnées pour optimiser les plans de requêtes et réduire le nombre de scans de fichiers pendant le traitement des requêtes en salle blanche. Pour plus d'informations, consultez la documentation d'Apache Iceberg.

Lorsque vous utilisez des tables Iceberg, tenez compte AWS Clean Rooms des points suivants :

  • Tables situées dans le AWS Glue Data Catalog seul... Apache Iceberg les tables doivent être définies sur la AWS Glue Data Catalog base de l'implémentation du catalogue de colle open source.

  • Format de fichier Parquet : prend AWS Clean Rooms uniquement en charge les tables Iceberg au format de fichier de données Parquet.

  • GZIPet Snappy Compression — AWS Clean Rooms supporte le parquet avec et GZIP Snappy compression.

  • Versions Iceberg : AWS Clean Rooms permet d'exécuter des requêtes sur les tables Iceberg des versions 1 et 2.

  • Partitions — Vous n'avez pas besoin d'ajouter manuellement des partitions pour votre Apache Iceberg tables en AWS Glue. AWS Clean Rooms détecte les nouvelles partitions dans Apache Iceberg les tables sont automatiquement et aucune opération manuelle n'est nécessaire pour mettre à jour les partitions dans la définition des tables. Les partitions Iceberg apparaissent sous forme de colonnes normales dans le schéma de AWS Clean Rooms table et non séparément sous forme de clé de partition dans le schéma de table configuré.

  • Limites

    • Nouvelles tables Iceberg uniquement

      Apache Iceberg tables converties à partir de Apache Parquet les tables ne sont pas prises en charge.

    • Requêtes Time Travel

      AWS Clean Rooms ne prend pas en charge les demandes de voyage dans le temps avec Apache Iceberg tables.

    • Moteur Athena version 2

      Iceberg les tables créées avec la version 2 du moteur Athena ne sont pas prises en charge.

    • Formats de fichiers

      Avro et les formats de fichier Optimized Row Columnar (ORC) ne sont pas pris en charge.

    • Compression

      Zstandard (Zstd) compression pour Parquet n'est pas pris en charge.

Types de données pris en charge pour les tables Iceberg

AWS Clean Rooms peut interroger Iceberg tables contenant les types de données suivants :

  • boolean

  • date

  • decimal

  • double

  • float

  • int

  • list

  • long

  • map

  • string

  • struct

  • timestamp without time zone

Pour en savoir plus sur les types de données Iceberg, consultez Schemas for Iceberg dans la documentation Apache Iceberg.