Scegli un file SerDe per i tuoi dati - Amazon Athena

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Scegli un file SerDe per i tuoi dati

La tabella seguente elenca i formati di dati supportati in Athena e le librerie corrispondenti SerDe .

Formati di dati supportati e SerDes
Formato dei dati Descrizione SerDe tipi supportati in Athena
Amazon Ion Amazon Ion è un formato di dati altamente tipizzato e autodescrittivo ed è un superset di JSON, sviluppato e reso disponibile in open source da Amazon. Utilizza il Amazon Ion Hive SerDe.

Apache Avro

Un formato per archiviare i dati in Hadoop che impiega schemi basati su JSON per i valori dei record.

Utilizzo della Avro SerDe

Apache Parquet

Un formato per storage colonnare di dati in Hadoop.

Utilizzare la compressione SNAPPY e Parquet SerDe.

registri di Apache WebServer

Un formato per l'archiviazione dei log in Apache. WebServer

Utilizzare Grok SerDe o Regex SerDe.

CloudTrail registri

Un formato per l'archiviazione dei log in. CloudTrail

CSV (valori separati da virgola)

Per i dati in CSV, ogni riga rappresenta un record di dati e ogni record è composto da uno o più campi, separati da virgole.

Delimitatore personalizzato

Per i dati in questo formato, ogni riga rappresenta un record di dati e i record sono separati da delimitatori personalizzati a carattere singolo.

Utilizzare Lazy SerDe Simple per file CSV, TSV e delimitati in modo personalizzato e specificare un delimitatore di carattere singolo personalizzato.

JSON (notazione di JavaScript oggetti)

Per i dati in JSON, ogni riga rappresenta un registro di dati e ogni registro è composto da coppie attributo-valore e da matrici, separate da virgole.

Log di Logstash

Formato per archiviare log in Logstash.

Utilizzo della Grok SerDe

ORC (Optimized Row Columnar)

Un formato per storage colonnare ottimizzato basato su dati Hive.

Utilizzare la compressione ZLIB e ORCO SerDe.

TSV (valori separati da tabulazione)

Per i dati in TSV, ogni riga rappresenta un record di dati e ogni record è composto da uno o più campi, separati da tabulazioni.

Utilizzare Lazy SerDe Simple per file CSV, TSV e delimitati in modo personalizzato e specificare il carattere separatore come FIELDS TERMINATED BY '\t'.