Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Librerie JSON SerDe
In Athena, puoi usare le SerDe librerie per deserializzare i dati JSON. La deserializzazione converte i dati JSON in modo che possano essere serializzati (scritti) in un formato diverso come Parquet o ORC.
Nota
Le librerie Hive e OpenX prevedono che i dati JSON siano su una singola riga (non formattati), con registri separati da un carattere di nuova riga.
Poiché Amazon Ion è un superset di JSON, puoi utilizzare Amazon Ion Hive SerDe per interrogare set di dati JSON non Amazon Ion. A differenza delle librerie SerDe JSON Hive e OpenX, Amazon SerDe Ion non prevede che ogni riga di dati si trovi su una singola riga. Questa funzione è utile se si desidera eseguire query su set di dati JSON in formato «pretty print» o se si desidera suddividere i campi di una riga con caratteri di nuova riga.
Nomi delle librerie
Utilizzare una delle seguenti operazioni:
org.apache.hive.hcatalog.data. JsonSerDe
org.openx.data.jsonserde. JsonSerDe
com.amazon.ionhiveserde. IonHiveSerDe
Risorse aggiuntive
Per ulteriori informazioni sull'utilizzo di JSON e JSON nidificato in Athena, vedere le risorse seguenti:
-
Crea tabelle in Amazon Athena da JSON e mappature annidate utilizzando JSONSer
De (Big Data Blog)AWS -
Ricevo errori quando cerco di leggere dati JSON in Amazon Athena
AWS (articolo del Knowledge Center) -
hive-json-schema
(GitHub) — Strumento scritto in Java che genera CREATE TABLE
istruzioni a partire da documenti JSON di esempio. Le istruzioniCREATE TABLE
generate utilizzano SerDe JSON OpenX.