Apache Hive - Amazon EMR

Apache Hive

Hive는 하둡 클러스터를 기반으로 실행되는 오픈 소스 데이터 웨어하우스 및 분석 패키지입니다. Hive 스크립트는 프로그래밍 모델을 추상화하고 일반적인 데이터 웨어하우스 상호 작용을 지원하는 Hive QL(쿼리 언어)이라는 SQL 유형의 언어를 사용합니다. Hive를 사용하면 Java와 같은 더 낮은 수준의 컴퓨터 언어로 MapReduce 프로그램 또는 DAG(방향성 비순환 그래프) 기반 Tez 작업을 작성하는 복잡성을 피할 수 있습니다.

Hive에서는 직렬화 형식을 포함하여 SQL 패러다임을 확장합니다. 데이터 자체를 건드리지 않고 데이터와 일치하는 테이블 스키마를 생성하여 쿼리 처리를 사용자 지정할 수도 있습니다. SQL은 기본적인 값 유형(예: 날짜, 숫자 및 문자열)만 지원하는 반면, Hive 테이블 값은 JSON 객체, 사용자 정의 데이터 유형, Java로 작성된 함수 등과 같은 구조적 요소입니다.

Hive에 대한 자세한 내용은 http://hive.apache.org/를 참조하십시오.

다음 테이블에는 Amazon EMR이 Hive를 통해 설치하는 구성 요소와 함께 Amazon EMR 7.x 시리즈의 최신 릴리스에 포함된 Hive의 버전이 나열되어 있습니다.

이 릴리스에서 Hive와 함께 설치된 구성 요소의 버전은 릴리스 7.3.0 구성 요소 버전을 참조하세요.

emr-7.3.0용 Hive 버전 정보
Amazon EMR 릴리스 레이블 Hive 버전 Hive와 함께 설치된 구성 요소

emr-7.3.0

Hive 3.1.3

emrfs, emr-ddb, emr-goodies, emr-kinesis, emr-s3-dist-cp, emr-s3-select, hadoop-client, hadoop-mapred, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-kms-server, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, hadoop-yarn-timeline-server, hive-client, hive-hbase, hcatalog-server, hive-server2, hudi, mariadb-server, tez-on-yarn, tez-on-worker, zookeeper-client, zookeeper-server

다음 테이블에는 Amazon EMR이 Hive를 통해 설치하는 구성 요소와 함께 Amazon EMR 6.x 시리즈의 최신 릴리스에 포함된 Hive의 버전이 나열되어 있습니다.

이 릴리스에서 Hive와 함께 설치된 구성 요소의 버전은 릴리스 6.15.0 구성 요소 버전을 참조하세요.

emr-6.15.0용 Hive 버전 정보
Amazon EMR 릴리스 레이블 Hive 버전 Hive와 함께 설치된 구성 요소

emr-6.15.0

Hive 3.1.3

emrfs, emr-ddb, emr-goodies, emr-kinesis, emr-s3-dist-cp, emr-s3-select, hadoop-client, hadoop-mapred, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-kms-server, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, hadoop-yarn-timeline-server, hive-client, hive-hbase, hcatalog-server, hive-server2, hudi, mariadb-server, tez-on-yarn, tez-on-worker, zookeeper-client, zookeeper-server

다음 테이블에는 Amazon EMR이 Hive를 통해 설치하는 구성 요소와 함께 Amazon EMR 5.x 시리즈의 최신 릴리스에 포함된 Hive의 버전이 나열되어 있습니다.

이 릴리스에서 Hive와 함께 설치된 구성 요소의 버전은 릴리스 5.36.2 구성 요소 버전을 참조하세요.

emr-5.36.2용 Hive 버전 정보
Amazon EMR 릴리스 레이블 Hive 버전 Hive와 함께 설치된 구성 요소

emr-5.36.2

Hive 2.3.9

emrfs, emr-ddb, emr-goodies, emr-kinesis, emr-s3-dist-cp, emr-s3-select, hadoop-client, hadoop-mapred, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-kms-server, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, hadoop-yarn-timeline-server, hive-client, hive-hbase, hcatalog-server, hive-server2, hudi, mariadb-server, tez-on-yarn

Amazon EMR 5.18.0부터 Amazon EMR 아티팩트 리포지토리를 사용하여 특정 Amazon EMR 릴리스 버전에서 사용할 수 있는 정확한 버전의 라이브러리와 종속 항목에 대해 작업 코드를 빌드할 수 있습니다. 자세한 내용은 Amazon EMR 아티팩트 리포지토리를 사용하여 종속성 확인 단원을 참조하십시오.