Apache Iceberg tavoli in AWS Clean Rooms - AWS Clean Rooms

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Apache Iceberg tavoli in AWS Clean Rooms

Apache Iceberg è un formato di tabella open source per data lake. AWS Clean Rooms può utilizzare le statistiche memorizzate in Apache Iceberg metadati per ottimizzare i piani di interrogazione e ridurre le scansioni dei file durante l'elaborazione delle interrogazioni in camera bianca. Per ulteriori informazioni, consulta la documentazione di Apache Iceberg.

Considerate quanto segue quando utilizzate AWS Clean Rooms con le tabelle Iceberg:

  • Tabelle all'interno delle AWS Glue Data Catalog sole: Apache Iceberg le tabelle devono essere definite in AWS Glue Data Catalog base all'implementazione open source del catalogo Glue.

  • Formato di file Parquet: supporta AWS Clean Rooms solo le tabelle Iceberg nel formato di file di dati Parquet.

  • GZIPe compressione Snappy: AWS Clean Rooms supporta Parquet con e GZIP Snappy compressione.

  • Versioni Iceberg: AWS Clean Rooms supporta l'esecuzione di query sulle tabelle Iceberg versione 1 e versione 2.

  • Partizioni: non è necessario aggiungere manualmente partizioni per Apache Iceberg tabelle in. AWS Glue AWS Clean Rooms rileva nuove partizioni in Apache Iceberg le tabelle automaticamente e non è necessaria alcuna operazione manuale per aggiornare le partizioni nella definizione della tabella. Le partizioni Iceberg vengono visualizzate come colonne regolari nello schema della AWS Clean Rooms tabella e non separatamente come chiave di partizione nello schema della tabella configurato.

  • Limitazioni

    • Solo nuove tabelle Iceberg

      Apache Iceberg tabelle convertite da Apache Parquet le tabelle non sono supportate.

    • Query temporali

      AWS Clean Rooms non supporta le interrogazioni sui viaggi nel tempo con Apache Iceberg tavoli.

    • Motore Athena versione 2

      Iceberg le tabelle create con la versione 2 del motore Athena non sono supportate.

    • Formati di file

      Avro e i formati di file Optimized Row Columnar (ORC) non sono supportati.

    • Compressione

      Zstandard (Zstd) compressione per Parquet non è supportata.

Tipi di dati supportati per le tabelle Iceberg

AWS Clean Rooms può interrogare Iceberg tabelle che contengono i seguenti tipi di dati:

  • boolean

  • date

  • decimal

  • double

  • float

  • int

  • list

  • long

  • map

  • string

  • struct

  • timestamp without time zone

Per ulteriori informazioni sui tipi di tabella Iceberg, consulta Schemi per Iceberg nella documentazione di Apache.