Apache HBase - Amazon EMR

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

Apache HBase

HBase는 Apache Software Foundation의 하둡 프로젝트의 일부로 개발된 오픈 소스 비관계형 분산 데이터베이스입니다. HBase는 하둡 분산 파일 시스템(HDFS)을 기반으로 실행되어 하둡 에코시스템을 위한 비관계형 데이터베이스 기능을 제공합니다. HBase는 Amazon EMR 릴리스 버전 4.6.0 이상에 포함되어 있습니다.

HBase는 하둡과 원활하게 작동하여 파일 시스템을 공유하고 MapReduce 프레임워크 및 실행 엔진에 직접 입력 및 출력할 수 있습니다. HBase는 또한 Apache Hive와 통합하여 HBase 테이블을 통해 SQL과 같은 쿼리를 작성하고 Hive 기반 테이블 및 Java Database Connectivity(JDBC)에 대한 지원과 결합할 수 있습니다. HBase에 대한 자세한 내용은 Apache 웹 사이트의 Apache HBaseHBase 설명서를 참조하십시오. Hive와 함께 HBase를 사용하는 방법의 예는 Amazon EMR에서 Apache HBase 및 Apache Hive를 사용하여 NoSQL 및 대규모 병렬 분석 결합 AWS 빅 데이터 블로그 게시물을 참조하세요.

Amazon EMR 기반 HBase를 사용하면 HBase 데이터를 Amazon Simple Storage Service(S3)에 직접 백업하고 HBase 클러스터를 시작할 때 이전에 생성한 백업에서 복원할 수도 있습니다. Amazon EMR은 데이터 지속성 및 재해 복구를 위해 Amazon S3와 통합할 수 있는 추가 옵션을 제공합니다.

  • Amazon S3 기반 HBase - Amazon EMR 버전 5.2.0 이상에서는 Amazon S3 기반 HBase를 사용하여 클러스터의 HBase 루트 디렉터리와 메타데이터를 Amazon S3에 직접 저장할 수 있습니다. 이후에는 Amazon S3에서 루트 디렉터리 위치를 가리켜서 새 클러스터를 시작할 수 있습니다. 읽기 전용 복제본 클러스터를 제외하고 한 번에 한 클러스터에서만 Amazon S3의 HBase 위치를 사용할 수 있습니다. 자세한 내용은 Amazon S3 기반(Amazon S3 스토리지 모드) 단원을 참조하십시오.

  • HBase 읽기 전용 복제본 - Amazon S3 기반 HBase가 있는 Amazon EMR 버전 5.7.0 이상에서는 읽기 전용 복제본 클러스터를 지원합니다. 읽기 전용 복제본 클러스터에서는 읽기 전용 작업을 위해 기본 클러스터의 스토어 파일 및 메타데이터에 읽기 전용 권한으로 액세스할 수 있습니다. 자세한 내용은 읽기 전용 복제본 클러스터 사용 단원을 참조하십시오.

  • HBase 스냅샷 - Amazon S3 기반 HBase 대신, EMR 버전 4.0 이상을 사용하여 HBase 데이터에 대한 스냅샷을 Amazon S3에 직접 생성한 다음, 스냅샷을 사용하여 데이터를 복구할 수 있습니다. 자세한 내용은 HBase 스냅샷 사용 단원을 참조하십시오.

중요

Amazon EMR HBase 클러스터 조정의 경우 HBase 클러스터의 Managed Scaling 또는 사용자 지정 정책을 통한 조정을 사용하지 않는 것이 좋습니다.

다음 테이블에는 Amazon EMR이 HBase를 통해 설치하는 구성 요소와 함께 Amazon EMR 7.x 시리즈의 최신 릴리스에 포함된 HBase의 버전이 나열되어 있습니다.

이 릴리스에서 HBase와 함께 설치된 구성 요소의 버전은 릴리스 7.6.0 구성 요소 버전을 참조하세요.

emr-7.6.0용 HBase 버전 정보
Amazon EMR 릴리스 레이블 HBase 버전 HBase와 함께 설치된 구성 요소

emr-7.6.0

HBase 2.6.1

emrfs, emr-ddb, emr-goodies, emr-kinesis, emr-s3-dist-cp, emr-wal-cli, hadoop-client, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-kms-server, hadoop-mapred, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, hadoop-yarn-timeline-server, hbase-hmaster, hbase-client, hbase-region-server, hbase-rest-server, hbase-thrift-server, hbase-operator-tools, zookeeper-client, zookeeper-server

다음 테이블에는 Amazon EMR이 HBase를 통해 설치하는 구성 요소와 함께 Amazon EMR 6.x 시리즈의 최신 릴리스에 포함된 HBase의 버전이 나열되어 있습니다.

이 릴리스에서 HBase와 함께 설치된 구성 요소의 버전은 릴리스 6.15.0 구성 요소 버전을 참조하세요.

emr-6.15.0용 HBase 버전 정보
Amazon EMR 릴리스 레이블 HBase 버전 HBase와 함께 설치된 구성 요소

emr-6.15.0

HBase 2.4.17

emrfs, emr-ddb, emr-goodies, emr-kinesis, emr-s3-dist-cp, emr-wal-cli, hadoop-client, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-kms-server, hadoop-mapred, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, hadoop-yarn-timeline-server, hbase-hmaster, hbase-client, hbase-region-server, hbase-rest-server, hbase-thrift-server, hbase-operator-tools, zookeeper-client, zookeeper-server

참고

Apache HBase HBCK2는 HBase 리전 및 시스템 테이블을 복구하기 위한 별도의 운영 도구입니다. Amazon EMR 버전 6.1.0 이상에서는 프라이머리 노드의 /usr/lib/hbase-operator-tools/에 hbase-hbck2.jar가 제공됩니다. 도구를 빌드하고 사용하는 방법에 대한 자세한 내용은 HBase HBCK2를 참조하십시오.

다음 테이블에는 Amazon EMR이 HBase를 통해 설치하는 구성 요소와 함께 Amazon EMR 5.x 시리즈의 최신 릴리스에 포함된 HBase의 버전이 나열되어 있습니다.

이 릴리스에서 HBase와 함께 설치된 구성 요소의 버전은 릴리스 5.36.2 구성 요소 버전을 참조하세요.

emr-5.36.2용 HBase 버전 정보
Amazon EMR 릴리스 레이블 HBase 버전 HBase와 함께 설치된 구성 요소

emr-5.36.2

HBase 1.4.13

emrfs, emr-ddb, emr-goodies, emr-kinesis, emr-s3-dist-cp, hadoop-client, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-kms-server, hadoop-mapred, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, hadoop-yarn-timeline-server, hbase-hmaster, hbase-client, hbase-region-server, hbase-rest-server, hbase-thrift-server, zookeeper-client, zookeeper-server