Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Scegli un file SerDe per i tuoi dati
La tabella seguente elenca i formati di dati supportati in Athena e le librerie corrispondenti SerDe .
Formato dei dati | Descrizione | SerDe tipi supportati in Athena |
---|---|---|
Amazon Ion | Amazon Ion è un formato di dati altamente tipizzato e autodescrittivo che è un superset di Amazon, JSON sviluppato e reso open source da Amazon. | Utilizza il Amazon Ion Hive SerDe. |
Apache Avro |
Un formato per l'archiviazione dei dati in Hadoop che utilizza schemi basati per i valori dei record. JSON |
Utilizzo della Avro SerDe |
Apache Parquet |
Un formato per storage colonnare di dati in Hadoop. |
Usa la compressione e. Parquet SerDe SNAPPY |
Registri di Apache WebServer |
Un formato per l'archiviazione dei log in Apache. WebServer |
Utilizzare Grok SerDe o Regex SerDe. |
CloudTrail registri |
Un formato per l'archiviazione dei log in. CloudTrail |
|
CSV(Valori separati da virgole) |
Per i dati in CSV ingresso, ogni riga rappresenta un record di dati e ogni record è composto da uno o più campi, separati da virgole. |
|
Delimitatore personalizzato |
Per i dati in questo formato, ogni riga rappresenta un record di dati e i record sono separati da delimitatori personalizzati a carattere singolo. |
Utilizzare Lazy SerDe Simple per CSV file TSV delimitati in modo personalizzato e specificare un delimitatore di carattere singolo personalizzato. |
JSON(Notazione JavaScript degli oggetti) |
Per quanto riguarda JSON i dati, ogni riga rappresenta un record di dati e ogni record è costituito da coppie e matrici attributo-valore, separate da virgole. |
|
Log di Logstash |
Formato per archiviare log in Logstash. |
Utilizzo della Grok SerDe |
ORC(Riga colonnare ottimizzata) |
Un formato per storage colonnare ottimizzato basato su dati Hive. |
Usa la compressione ORC SerDe and. ZLIB |
TSV(Valori separati da tabulazioni) |
Per i dati in TSV ingresso, ogni riga rappresenta un record di dati e ogni record è composto da uno o più campi, separati da schede. |
Utilizzare Lazy SerDe Simple per CSV file TSV delimitati in modo personalizzato e specificare il carattere separatore come |