JSON SerDe 라이브러리
Athena에서는 SerDe 라이브러리를 사용하여 JSON 데이터를 역직렬화할 수 있습니다. 역직렬화는 Parquet 또는 ORC와 같은 다른 형식으로 직렬화(기록)할 수 있도록 JSON 데이터를 변환합니다.
참고
Hive 및 OpenX 라이브러리는 JSON 데이터가 줄 바꿈 문자로 구분된 레코드와 함께 한 줄(형식이 지정되지 않음)에 있을 것으로 예상합니다.
Amazon Ion은 JSON의 상위 집합이므로 Amazon Ion Hive SerDe를 사용하여 Amazon Ion JSON이 아닌 데이터 집합을 쿼리할 수 있습니다. Hive 및 OpenX JSON SerDe 라이브러리와 달리 Amazon Ion SerDe는 각 데이터 행이 한 줄에 있을 것으로 예상하지 않습니다. 이 기능은 “예쁜 인쇄” 형식의 JSON 데이터 집합을 쿼리하려 하거나 줄 바꿈 문자로 필드를 행으로 분할하려는 경우에 유용합니다.
라이브러리 이름
다음 중 하나를 사용하세요.
org.apache.hive.hcatalog.data.JsonSerDe
org.openx.data.jsonserde.JsonSerDe
com.amazon.ionhiveserde.IonHiveSerDe
추가 리소스
Athena의 JSON 및 중첩 JSON 작업에 대한 자세한 내용은 다음 리소스를 참조하세요.
-
Create tables in Amazon Athena from nested JSON and mappings using JSONSerDe
(AWS 빅 데이터 블로그) -
Amazon Athena에서 JSON 데이터를 읽으려고 할 때 오류가 발생합니다.
(AWS Knowledge Center 문서) -
hive-json-schema
(GitHub) – 예제 JSON 문서에서 CREATE TABLE
문을 생성하는 Java로 작성된 도구입니다. 생성된CREATE TABLE
문은 OpenX JSON Serde를 사용합니다.