JSON SerDe ライブラリ
Athena では、SerDe ライブラリを使用して、JSON データを逆シリアル化できます。逆シリアル化では、JSON データを変換し、Parquet や ORC のような別の形式にシリアル化 (書き出し) できるようにします。
注記
Hive および OpenX ライブラリでは、JSON データが単一行で (フォーマットされていない)、そのレコードは改行文字で区切られていることが想定されています。
Amazon Ion は JSON のスーパーセットであるため、Amazon Ion Hive SerDe を使用して Amazon Ion 以外の JSON データセットをクエリできます。Hive および OpenX JSON SerDe ライブラリとは異なり、Amazon Ion SerDe ではデータの各行が 1 行にあるとは想定していません。この機能は、「プリティ印刷」形式の JSON データセットをクエリする場合や、改行文字で行のフィールドを分割する場合に便利です。
ライブラリ名
以下のいずれかを使用します。
org.apache.hive.hcatalog.data.JsonSerDe
org.openx.data.jsonserde.JsonSerDe
com.amazon.ionhiveserde.IonHiveSerDe
追加リソース
Athena での JSON およびネストされた JSON の使用の詳細については、以下のリソースを参照してください。
-
JSONSerDe を使用してネストされた JSON とマッピングから Amazon Athena でテーブルを作成する
(AWS ビッグデータブログ) -
Amazon Athena で JSON データを読み込もうとするとエラーが発生する
(AWS ナレッジセンターの記事) -
hive-json-schema
(GitHub) – JSON ドキュメント例から CREATE TABLE
ステートメントを生成する、Java で記述されたツールです。生成されるCREATE TABLE
ステートメントは、OpenX JSON Serde を使用します。