Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Interroga le tabelle Apache Iceberg
È possibile utilizzare Athena per eseguire operazioni di lettura, viaggi nel tempo, scrittura e DDL interrogazioni sulle tabelle Apache Iceberg. Le tabelle Iceberg devono utilizzare il formato Apache Parquet per i dati e il catalogo per il loro metastore. AWS Glue
Apache Iceberg
Per ulteriori informazioni su Apache Iceberg, consulta https://iceberg.apache.org/
Considerazioni e limitazioni
Il supporto di Athena per le tabelle Iceberg presenta le seguenti considerazioni e limitazioni:
-
Supporto per la versione Iceberg — Athena supporta la versione 1.4.2 di Apache Iceberg.
-
Solo tabelle con AWS Glue catalogo: solo le tabelle Iceberg create in base al AWS Glue catalogo in base alle specifiche definite dall'implementazione open source del catalogo Glue
sono supportate da Athena. -
Supporto per il blocco delle tabelle AWS Glue solo da parte di: a differenza dell'implementazione open source del catalogo Glue, che supporta il blocco personalizzato tramite plug-in, Athena supporta AWS Glue solo il blocco ottimistico. L'utilizzo di Athena per modificare una tabella Iceberg con qualsiasi altra implementazione di blocco causerà potenziali perdite di dati e interruzioni delle transazioni.
-
Formati di file supportati: il supporto del formato di file Iceberg in Athena dipende dalla versione del motore Athena, come illustrato nella tabella seguente.
Versione del motore Athena Parquet ORC Avro 2 Sì No No 3 Sì Sì Sì -
Tabelle Iceberg v2: Athena crea e opera solo su tabelle Iceberg v2. Per la differenza tra le tabelle v1 e v2, consulta Modifiche al tipo di formato
nella documentazione di Apache Iceberg. -
Visualizzazione dei tipi di orario senza fuso orario: l'ora e il timestamp senza i tipi di fuso orario vengono visualizzati in. UTC Se il fuso orario non è specificato in un'espressione di filtro in una colonna temporale, UTC viene utilizzato.
-
Precisione dei dati relativi al timestamp: mentre Iceberg supporta una precisione al microsecondo per il tipo di dati del timestamp, Athena per i timestamp supporta solo una precisione al millisecondo sia in lettura che in scrittura. Per i dati nelle colonne relative al tempo riscritti durante le operazioni di compattazione manuale, Athena mantiene solo una precisione al millisecondo.
-
Operazioni non supportate:le seguenti operazioni Athena non sono supportate per le tabelle Iceberg.
-
Viste: utilizza
CREATE VIEW
per creare viste Athena come descritto nella pagina Lavora con le viste. Se desideri utilizzare le specifiche di visualizzazione Icebergper creare viste, contatta athena-feedback@amazon.com . -
TTFcomandi di gestione non supportati in AWS Lake Formation — Sebbene sia possibile utilizzare Lake Formation per gestire le autorizzazioni di accesso in lettura per TransactionTable Formats (TTFs) come Apache Iceberg, Apache Hudi e Linux Foundation Delta Lake, non è possibile utilizzare Lake Formation per gestire le autorizzazioni per operazioni come
VACUUM
MERGE
,UPDATE
o con questi formati di tabella.OPTIMIZE
Per ulteriori informazioni sull'integrazione di Lake Formation con Athena, consulta Using AWS Lake Formation with Amazon Athena nella AWS Lake Formation Developer Guide. -
Partizionamento per campi annidati: il partizionamento per campi annidati non è supportato. Il tentativo di eseguire questa operazione genera il messaggio
NOT_SUPPORTED: Il partizionamento per campo annidato
non è supportato:column_name
.nested_field_name
. -
Ignorare gli oggetti S3 Glacier non supportati: se gli oggetti nella tabella Apache Iceberg si trovano in una classe di archiviazione Amazon S3 Glacier, l'impostazione della proprietà della tabella
read_restored_glacier_objects
sufalse
non ha alcun effetto.Ad esempio, supponiamo di emettere il seguente comando:
ALTER TABLE
table_name
SET TBLPROPERTIES ('read_restored_glacier_objects' = 'false')Per le tabelle Iceberg e Delta Lake, il comando produce l'errore
Chiave delle proprietà della tabella non supportata: read_restored_glacier_objects
. Per le tabelle Hudi, il comandoALTER TABLE
non produce un errore, ma gli oggetti Amazon S3 Glacier ancora non verranno ignorati. L'esecuzione delle querySELECT
dopo il comandoALTER TABLE
continuerà a restituire tutti gli oggetti.
Se si desidera che Athena supporti una particolare funzionalità, inviare un feedback all'indirizzo athena-feedback@amazon.com
Argomenti
- Crea tabelle Iceberg
- Interroga i dati della tabella Iceberg
- Esegui ricerche sui viaggi nel tempo e sui viaggi di versione
- Aggiorna i dati della tabella Iceberg
- Gestisci le tabelle Iceberg
- Evolve lo schema della tabella Iceberg
- Esegui altre DDL operazioni sulle tabelle Iceberg
- Ottimizza le tabelle Iceberg
- Tipi di dati supportati per tabelle Iceberg in Athena
- Risorse aggiuntive