本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
HBase
HBase 可與 Hadoop 無縫搭配,不但共享檔案系統,也做為 MapReduce 架構和執行引擎的直接輸入和輸出。HBase 也與 Apache Hive 整合,在 HBase tables 上啟用 SQL 式查詢,與 Hive 為基礎的表格進行聯結,並支援 Java Database Connectivity (JDBC)。如需 HBase 的詳細資訊,請參閱 Apache 網站上的 Apache HBase
透過 Amazon EMR 上的 HBase,您也可以直接備份您的 HBase 資料至 Amazon Simple Storage Service (Amazon S3),並在啟動 HBase 叢集時,從之前建立的備份中還原。Amazon EMR 提供了與 Amazon S3 整合的額外選項,以用於資料持久性和災難復原。
-
HBase on Amazon S3 – 在 Amazon EMR 5.2.0 版及更新版本中,您可以使用 HBase on Amazon S3 直接將叢集的 HBase 根目錄和中繼資料儲存至 Amazon S3。接著您可以啟動一個新叢集,並將其指向 Amazon S3 中的根目錄位置。除了僅供讀取複本叢集外,一次只有一個叢集能使用 Amazon S3 中的 HBase 位置。如需詳細資訊,請參閱HBase on Amazon S3 (Amazon S3 儲存模式)。
-
HBase 僅供讀取複本 – 具有 HBase on Amazon S3 的 Amazon EMR 5.7.0 版及更新版本支援僅供讀取複本叢集。僅供讀取複本叢集提供叢集存放檔案的唯讀存取,和僅供讀取操作的中繼資料。如需詳細資訊,請參閱使用僅供讀取複本叢集。
HBase 快照 – 除了 HBase on Amazon S3 外,您也能使用 EMR 4.0 版及更新版本直接建立 Amazon S3 的 HBase 資料快照,然後利用該快照進行復原。如需詳細資訊,請參閱使用 HBase 快照。
以下表格列出了 Amazon EMR 7.x 系列最新版本中包含的 HBase 版本,以及 Amazon EMR 隨 HBase 一起安裝的元件。
如需此版本中與 HBase 一起安裝的元件版本,請參閱發行版本 7.8.0 元件版本。
Amazon EMR 發行標籤 | HBase 版本 | 與 HBase 一起搭配安裝的元件 |
---|---|---|
emr-7.8.0 |
HBase 2.6.1 |
emrfs, emr-ddb, emr-goodies, emr-kinesis, emr-s3-dist-cp, emr-wal-cli, hadoop-client, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-kms-server, hadoop-mapred, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, hadoop-yarn-timeline-server, hbase-hmaster, hbase-client, hbase-region-server, hbase-rest-server, hbase-thrift-server, hbase-operator-tools, zookeeper-client, zookeeper-server |
下表列出 Amazon EMR 6.x 系列最新版本中包含的 HBase 版本,以及 Amazon EMR 隨 HBase 一起安裝的元件。
如需此版本中與 HBase 一起搭配安裝的元件版本,請參閱發行版本 6.15.0 元件版本。
Amazon EMR 發行標籤 | HBase 版本 | 與 HBase 一起搭配安裝的元件 |
---|---|---|
emr-6.15.0 |
HBase 2.4.17 |
emrfs, emr-ddb, emr-goodies, emr-kinesis, emr-s3-dist-cp, emr-wal-cli, hadoop-client, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-kms-server, hadoop-mapred, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, hadoop-yarn-timeline-server, hbase-hmaster, hbase-client, hbase-region-server, hbase-rest-server, hbase-thrift-server, hbase-operator-tools, zookeeper-client, zookeeper-server |
注意
Apache HBase HBCK2 是一種單獨的操作工具,可用於修復 HBase 區域和系統資料表。在 Amazon EMR 6.1.0 版和更新版本中,hbase-hbck2.jar 會在主節點/usr/lib/hbase-operator-tools/
的 中提供。如需有關如何建置和使用工具的詳細資訊,請參閱 HBase HBCK2
下表列出 Amazon EMR 5.x 系列最新版本中包含的 HBase 版本,以及 Amazon EMR 隨 HBase 一起安裝的元件。
如需此版本中與 HBase 一起安裝的元件版本,請參閱發行版本 5.36.2 元件版本。
Amazon EMR 發行標籤 | HBase 版本 | 與 HBase 一起搭配安裝的元件 |
---|---|---|
emr-5.36.2 |
HBase 1.4.13 |
emrfs, emr-ddb, emr-goodies, emr-kinesis, emr-s3-dist-cp, hadoop-client, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-kms-server, hadoop-mapred, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, hadoop-yarn-timeline-server, hbase-hmaster, hbase-client, hbase-region-server, hbase-rest-server, hbase-thrift-server, zookeeper-client, zookeeper-server |