Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Dans Athena, vous pouvez utiliser des SerDe bibliothèques pour désérialiser les données JSON. La désérialisation convertit les données JSON afin qu'elles puissent être sérialisées (écrites) dans un format différent comme Parquet ou ORC.
Note
Les bibliothèques Hive et OpenX s'attendent à ce que les données JSON soient sur une seule ligne (non formatées), les registres étant séparés par un caractère de nouvelle ligne.
Amazon Ion étant un sur-ensemble de JSON, vous pouvez utiliser Amazon Ion Hive SerDe pour interroger des ensembles de données JSON autres qu'Amazon Ion. Contrairement aux bibliothèques SerDe JSON Hive et OpenX, Amazon SerDe Ion ne s'attend pas à ce que chaque ligne de données se trouve sur une seule ligne. Cette fonction est utile si vous souhaitez interroger des jeux de données JSON au format « pretty print » ou si vous souhaitez diviser les champs d'une ligne avec des caractères de saut de ligne.
Noms des bibliothèques
Utilisez l'une des options suivantes :
org.apache.hive.hcatalog.data. JsonSerDe
org.openx.data.json. JsonSerDe
com.amazon.ionhiveserde. IonHiveSerDe
Ressources supplémentaires
Pour de plus amples informations sur l'utilisation de JSON et de JSON imbriqué dans Athena, consultez les ressources suivantes :
-
Créez des tables dans Amazon Athena à partir de JSON imbriqué et de mappages à l'aide JSONSer de De
(AWS Big Data Blog) -
Je reçois des erreurs lorsque j'essaie de lire des données JSON dans Amazon Athena
(article du AWS Knowledge Center) -
hive-json-schema
(GitHub) — Outil écrit en Java qui génère des CREATE TABLE
instructions à partir d'exemples de documents JSON. Les instructionsCREATE TABLE
générées utilisent le SerDe JSON OpenX.