Choisissez un SerDe pour vos données

Mode de mise au point

Choisissez un SerDe pour vos données - Amazon Athena

Le tableau suivant répertorie les formats de données pris en charge par Athena et les bibliothèques correspondantes SerDe .

Formats de données pris en charge et SerDes
Format de données	Description	SerDe types pris en charge dans Athena
Amazon Ion	Amazon Ion est un format de données abondamment typé et auto-descriptif qui est un superensemble de JSON, développé et ouvert par Amazon.	Utilisez Amazon Ion Hive SerDe.
Apache Avro	Format d'enregistrement des données dans Hadoop qui utilise des schémas basés sur JSON pour les valeurs d'enregistrement.	Utilisez Avro SerDe.
Apache Parquet	Format pour le stockage en colonnes des données dans Hadoop.	Utilisez le type Parquet SerDe et la compression SNAPPY.
WebServer Journaux Apache	Format de stockage des journaux dans Apache WebServer.	Utilisez le type Grok SerDe ou Régex SerDe.
CloudTrail journaux	Format de stockage des connexions CloudTrail.	Utilisez Hive JSON SerDe. Pour de plus amples informations, veuillez consulter AWS CloudTrail Journaux de requêtes.
CSV (valeurs séparées par des virgules)	Pour les données au format CSV, chaque ligne représente un enregistrement de données, et chaque enregistrement se compose d'un ou de plusieurs champs, séparés par des virgules.	Utilisez le type Lazy Simple SerDe pour les fichiers CSV, TSV et délimités sur mesure si vos données n'incluent pas de valeurs entre guillemets ou si elles utilisent le format `java.sql.Timestamp`. Utilisez le type Ouvrez le fichier CSV SerDe pour le traitement du fichier CSV lorsque vos données comprennent des guillemets dans les valeurs ou utilisent le format numérique UNIX pour `TIMESTAMP` (par exemplee, `1564610311`).
Séparateur personnalisé	Pour les données qui se trouvent dans ce format, chaque ligne représente un enregistrement de données. Les enregistrements sont séparés par des délimiteurs personnalisés.	Utilisez le type Lazy Simple SerDe pour les fichiers CSV, TSV et délimités sur mesure et spécifiez un séparateur à caractère unique personnalisé.
JSON (notation JavaScript d'objet)	Pour les données JSON, chaque ligne représente un enregistrement de données, et chaque enregistrement se compose de paires attribut-valeur et de tableaux, séparés par des virgules.	Utilisez Hive JSON SerDe. Utilisez OpenX JSON SerDe.
Journaux Logstash	Format pour le stockage des fichiers journaux dans Logstash.	Utilisez Grok SerDe.
ORC (Optimized Row Columnar)	Format pour le stockage en colonnes optimisé des données Hive.	Utilisez le type ORC SerDe et la compression ZLIB.
TSV (valeurs séparées par des tabulations)	Pour les données au format TSV, chaque ligne représente un enregistrement de données, et chaque enregistrement se compose d'un ou de plusieurs champs, séparés par des tabulations.	Utilisez le type Lazy Simple SerDe pour les fichiers CSV, TSV et délimités sur mesure et spécifiez le caractère séparateur sous la forme `FIELDS TERMINATED BY '\t'`.

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

Utiliser SerDes

Utiliser un SerDe pour créer une table

Sélectionner vos préférences de cookies

Personnaliser les préférences de cookies

Essentiels

Performances

Fonctionnels

Publicitaires

Impossible d'enregistrer les préférences concernant les cookies

Choisissez un SerDe pour vos données

Cette page vous a-t-elle été utile ?

Rubrique suivante :

Rubrique précédente :

Avez-vous besoin d’aide ?