Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Le tableau suivant répertorie les formats de données pris en charge par Athena et les bibliothèques correspondantes SerDe .
Format de données | Description | SerDe types pris en charge dans Athena |
---|---|---|
Amazon Ion | Amazon Ion est un format de données abondamment typé et auto-descriptif qui est un superensemble de JSON, développé et ouvert par Amazon. | Utilisez Amazon Ion Hive SerDe. |
Apache Avro |
Format d'enregistrement des données dans Hadoop qui utilise des schémas basés sur JSON pour les valeurs d'enregistrement. |
Utilisez Avro SerDe. |
Apache Parquet |
Format pour le stockage en colonnes des données dans Hadoop. |
Utilisez le type Parquet SerDe et la compression SNAPPY. |
WebServer Journaux Apache |
Format de stockage des journaux dans Apache WebServer. |
Utilisez le type Grok SerDe ou Régex SerDe. |
CloudTrail journaux |
Format de stockage des connexions CloudTrail. |
|
CSV (valeurs séparées par des virgules) |
Pour les données au format CSV, chaque ligne représente un enregistrement de données, et chaque enregistrement se compose d'un ou de plusieurs champs, séparés par des virgules. |
|
Séparateur personnalisé |
Pour les données qui se trouvent dans ce format, chaque ligne représente un enregistrement de données. Les enregistrements sont séparés par des délimiteurs personnalisés. |
Utilisez le type Lazy Simple SerDe pour les fichiers CSV, TSV et délimités sur mesure et spécifiez un séparateur à caractère unique personnalisé. |
JSON (notation JavaScript d'objet) |
Pour les données JSON, chaque ligne représente un enregistrement de données, et chaque enregistrement se compose de paires attribut-valeur et de tableaux, séparés par des virgules. |
|
Journaux Logstash |
Format pour le stockage des fichiers journaux dans Logstash. |
Utilisez Grok SerDe. |
ORC (Optimized Row Columnar) |
Format pour le stockage en colonnes optimisé des données Hive. |
Utilisez le type ORC SerDe et la compression ZLIB. |
TSV (valeurs séparées par des tabulations) |
Pour les données au format TSV, chaque ligne représente un enregistrement de données, et chaque enregistrement se compose d'un ou de plusieurs champs, séparés par des tabulations. |
Utilisez le type Lazy Simple SerDe pour les fichiers CSV, TSV et délimités sur mesure et spécifiez le caractère séparateur sous la forme |