Scegli un file SerDe per i tuoi dati - Amazon Athena

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Scegli un file SerDe per i tuoi dati

La tabella seguente elenca i formati di dati supportati in Athena e le librerie corrispondenti SerDe .

Formati di dati supportati e SerDes
Formato dei dati Descrizione SerDe tipi supportati in Athena
Amazon Ion Amazon Ion è un formato di dati altamente tipizzato e autodescrittivo che è un superset di Amazon, JSON sviluppato e reso open source da Amazon. Utilizza il Amazon Ion Hive SerDe.

Apache Avro

Un formato per l'archiviazione dei dati in Hadoop che utilizza schemi basati per i valori dei record. JSON

Utilizzo della Avro SerDe

Apache Parquet

Un formato per storage colonnare di dati in Hadoop.

Usa la compressione e. Parquet SerDe SNAPPY

Registri di Apache WebServer

Un formato per l'archiviazione dei log in Apache. WebServer

Utilizzare Grok SerDe o Regex SerDe.

CloudTrail registri

Un formato per l'archiviazione dei log in. CloudTrail

CSV(Valori separati da virgole)

Per i dati in CSV ingresso, ogni riga rappresenta un record di dati e ogni record è composto da uno o più campi, separati da virgole.

Delimitatore personalizzato

Per i dati in questo formato, ogni riga rappresenta un record di dati e i record sono separati da delimitatori personalizzati a carattere singolo.

Utilizzare Lazy SerDe Simple per CSV file TSV delimitati in modo personalizzato e specificare un delimitatore di carattere singolo personalizzato.

JSON(Notazione JavaScript degli oggetti)

Per quanto riguarda JSON i dati, ogni riga rappresenta un record di dati e ogni record è costituito da coppie e matrici attributo-valore, separate da virgole.

Log di Logstash

Formato per archiviare log in Logstash.

Utilizzo della Grok SerDe

ORC(Riga colonnare ottimizzata)

Un formato per storage colonnare ottimizzato basato su dati Hive.

Usa la compressione ORC SerDe and. ZLIB

TSV(Valori separati da tabulazioni)

Per i dati in TSV ingresso, ogni riga rappresenta un record di dati e ogni record è composto da uno o più campi, separati da schede.

Utilizzare Lazy SerDe Simple per CSV file TSV delimitati in modo personalizzato e specificare il carattere separatore come FIELDS TERMINATED BY '\t'.