本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
JSON SerDe 程式庫
在 Athena 中,您可以使用 SerDe 程式庫來還原序列化 JSON 資料。還原序列化會轉換 JSON 資料,讓這些資料能夠序列化 (寫出) 至 Parquet 或 ORC 等不同格式。
注意
Hive 和 OpenX 程式庫預期 JSON 資料位於單行上 (未格式化),且記錄由換行字元分隔。
由於 Amazon Ion 是 JSON 的超集,因此您可以使用 Amazon Ion Hive SerDe 來查詢非 Amazon Ion JSON 資料集。與 Hive 和 OpenX JSON SerDe 程式庫不同,Amazon Ion SerDe 不會預期每一列的資料都位於單行。如果您想查詢使用「美化顯示」格式的 JSON 資料集,或以其他方式用新行字元分解資料列中的欄位,則此功能非常有用。
程式庫名稱
請使用下列其中一個:
org.apache.hive.hcatalog.data.JsonSerDe
org.openx.data.jsonserde.JsonSerDe
com.amazon.ionhiveserde.IonHiveSerDe
其他資源
如需有關在 Athena 中使用 JSON 和巢狀 JSON 的詳細資訊,請參閱下列資源:
-
從巢狀 JSON 和使用 JSONSerDe 的映射建立 Amazon Athena 中的資料表
(AWS 大資料部落格) -
當我嘗試讀取 Amazon Athena 中的 JSON 資料時,會收到錯誤
(AWS 知識中心文章) -
hive-json-schema
(GitHub) - 以 Java 撰寫的工具,會從 JSON 文件範例中產生 CREATE TABLE
陳述式。產生的CREATE TABLE
陳述式會使用 OpenX JSON Serde。