Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Apache Iceberg tavoli in AWS Clean Rooms
Apache Iceberg è un formato di tabella open source per data lake. AWS Clean Rooms può utilizzare le statistiche memorizzate in Apache Iceberg metadati per ottimizzare i piani di interrogazione e ridurre le scansioni dei file durante l'elaborazione delle interrogazioni in camera bianca. Per ulteriori informazioni, consulta la documentazione di Apache Iceberg
Considerate quanto segue quando utilizzate AWS Clean Rooms con le tabelle Iceberg:
-
Tabelle all'interno delle AWS Glue Data Catalog sole: Apache Iceberg le tabelle devono essere definite in AWS Glue Data Catalog base all'implementazione open source del catalogo Glue
. -
Formato di file Parquet: supporta AWS Clean Rooms solo le tabelle Iceberg nel formato di file di dati Parquet.
-
GZIPe compressione Snappy: AWS Clean Rooms supporta Parquet con e GZIP Snappy compressione.
-
Versioni Iceberg: AWS Clean Rooms supporta l'esecuzione di query sulle tabelle Iceberg versione 1 e versione 2.
-
Partizioni: non è necessario aggiungere manualmente partizioni per Apache Iceberg tabelle in. AWS Glue AWS Clean Rooms rileva nuove partizioni in Apache Iceberg le tabelle automaticamente e non è necessaria alcuna operazione manuale per aggiornare le partizioni nella definizione della tabella. Le partizioni Iceberg vengono visualizzate come colonne regolari nello schema della AWS Clean Rooms tabella e non separatamente come chiave di partizione nello schema della tabella configurato.
-
Limitazioni
-
Solo nuove tabelle Iceberg
Apache Iceberg tabelle convertite da Apache Parquet le tabelle non sono supportate.
-
Query temporali
AWS Clean Rooms non supporta le interrogazioni sui viaggi nel tempo con Apache Iceberg tavoli.
-
Motore Athena versione 2
Iceberg le tabelle create con la versione 2 del motore Athena non sono supportate.
-
Formati di file
Avro e i formati di file Optimized Row Columnar (ORC) non sono supportati.
-
Compressione
Zstandard (Zstd) compressione per Parquet non è supportata.
-
Tipi di dati supportati per le tabelle Iceberg
AWS Clean Rooms può interrogare Iceberg tabelle che contengono i seguenti tipi di dati:
-
boolean
-
date
-
decimal
-
double
-
float
-
int
-
list
-
long
-
map
-
string
-
struct
-
timestamp without time zone
Per ulteriori informazioni sui tipi di tabella Iceberg, consulta Schemi per Iceberg