Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Scegli un file SerDe per i tuoi dati
La tabella seguente elenca i formati di dati supportati in Athena e le librerie corrispondenti SerDe .
Formato dei dati | Descrizione | SerDe tipi supportati in Athena |
---|---|---|
Amazon Ion | Amazon Ion è un formato di dati altamente tipizzato e autodescrittivo ed è un superset di JSON, sviluppato e reso disponibile in open source da Amazon. | Utilizza il Amazon Ion Hive SerDe. |
Apache Avro |
Un formato per archiviare i dati in Hadoop che impiega schemi basati su JSON per i valori dei record. |
Utilizzo della Avro SerDe |
Apache Parquet |
Un formato per storage colonnare di dati in Hadoop. |
Utilizzare la compressione SNAPPY e Parquet SerDe. |
registri di Apache WebServer |
Un formato per l'archiviazione dei log in Apache. WebServer |
Utilizzare Grok SerDe o Regex SerDe. |
CloudTrail registri |
Un formato per l'archiviazione dei log in. CloudTrail |
|
CSV (valori separati da virgola) |
Per i dati in CSV, ogni riga rappresenta un record di dati e ogni record è composto da uno o più campi, separati da virgole. |
|
Delimitatore personalizzato |
Per i dati in questo formato, ogni riga rappresenta un record di dati e i record sono separati da delimitatori personalizzati a carattere singolo. |
Utilizzare Lazy SerDe Simple per file CSV, TSV e delimitati in modo personalizzato e specificare un delimitatore di carattere singolo personalizzato. |
JSON (notazione di JavaScript oggetti) |
Per i dati in JSON, ogni riga rappresenta un registro di dati e ogni registro è composto da coppie attributo-valore e da matrici, separate da virgole. |
|
Log di Logstash |
Formato per archiviare log in Logstash. |
Utilizzo della Grok SerDe |
ORC (Optimized Row Columnar) |
Un formato per storage colonnare ottimizzato basato su dati Hive. |
Utilizzare la compressione ZLIB e ORCO SerDe. |
TSV (valori separati da tabulazione) |
Per i dati in TSV, ogni riga rappresenta un record di dati e ogni record è composto da uno o più campi, separati da tabulazioni. |
Utilizzare Lazy SerDe Simple per file CSV, TSV e delimitati in modo personalizzato e specificare il carattere separatore come |