Types de données pris en charge pour les tables Iceberg

Apache Iceberg tables en AWS Clean Rooms

Apache Iceberg est un format de table open source pour les lacs de données. AWS Clean Rooms peut utiliser les statistiques stockées dans Apache Iceberg métadonnées pour optimiser les plans de requêtes et réduire le nombre de scans de fichiers pendant le traitement des requêtes en salle blanche. Pour plus d'informations, consultez la documentation d'Apache Iceberg.

Lorsque vous utilisez des tables Iceberg, tenez compte AWS Clean Rooms des points suivants :

Tables situées dans le AWS Glue Data Catalog seul... Apache Iceberg les tables doivent être définies sur la AWS Glue Data Catalog base de l'implémentation du catalogue de colle open source.
Format de fichier Parquet : prend AWS Clean Rooms uniquement en charge les tables Iceberg au format de fichier de données Parquet.
GZIPet Snappy Compression — AWS Clean Rooms supporte le parquet avec et GZIP Snappy compression.
Versions Iceberg : AWS Clean Rooms permet d'exécuter des requêtes sur les tables Iceberg des versions 1 et 2.
Partitions — Vous n'avez pas besoin d'ajouter manuellement des partitions pour votre Apache Iceberg tables en AWS Glue. AWS Clean Rooms détecte les nouvelles partitions dans Apache Iceberg les tables sont automatiquement et aucune opération manuelle n'est nécessaire pour mettre à jour les partitions dans la définition des tables. Les partitions Iceberg apparaissent sous forme de colonnes normales dans le schéma de AWS Clean Rooms table et non séparément sous forme de clé de partition dans le schéma de table configuré.
Limites
- Nouvelles tables Iceberg uniquement
  
  Apache Iceberg tables converties à partir de Apache Parquet les tables ne sont pas prises en charge.
- Requêtes Time Travel
  
  AWS Clean Rooms ne prend pas en charge les demandes de voyage dans le temps avec Apache Iceberg tables.
- Moteur Athena version 2
  
  Iceberg les tables créées avec la version 2 du moteur Athena ne sont pas prises en charge.
- Formats de fichiers
  
  Avro et les formats de fichier Optimized Row Columnar (ORC) ne sont pas pris en charge.
- Compression
  
  Zstandard (Zstd) compression pour Parquet n'est pas pris en charge.

Types de données pris en charge pour les tables Iceberg

AWS Clean Rooms peut interroger Iceberg tables contenant les types de données suivants :

boolean
date
decimal
double
float
int
list
long
map
string
struct
timestamp without time zone

Pour en savoir plus sur les types de données Iceberg, consultez Schemas for Iceberg dans la documentation Apache Iceberg.

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

Formats de données

Préparation de tableaux de données