Apache HBase

HBase ist eine nicht relationale, verteilte Open-Source-Datenbank, die im Rahmen des Hadoop-Projekts der Apache Software Foundation entwickelt wurde. HBase wird auf Hadoop Distributed File System (HDFS) ausgeführt, um für das Hadoop-Ökosystem nicht relationale Datenbankfunktionen bereitzustellen. HBase ist in Amazon-EMR-Version 4.6.0 und höher enthalten.

HBase arbeitet nahtlos mit Hadoop zusammen, teilt sein Dateisystem und dient als direkte Eingabe und Ausgabe für das MapReduce Framework und die Ausführungs-Engine. HBase lässt sich auch in Apache Hive integrieren und ermöglicht so SQL-like Abfragen über HBase-Tabellen, Verknüpfungen mit Hive-based Tabellen und Unterstützung für Java Database Connectivity (JDBC). Weitere Informationen zu HBase finden Sie unter Apache HBase und in der HBase-Dokumentation auf der Apache-Website. Ein Beispiel für die Verwendung von HBase mit Hive finden Sie im AWS Big Data-Blogbeitrag Kombinieren von NoSQL und massively parallel analytics using Apache HBase and Apache Hive on Amazon EMR.

Mit HBase auf Amazon EMR können Sie Ihre HBase-Daten auch direkt in Amazon Simple Storage Service Amazon S3 sichern und aus einer zuvor erstellten Sicherung wiederherstellen, wenn Sie einen HBase-Cluster starten. Amazon EMR bietet zusätzliche Optionen für die Integration Amazon S3 für eine dauerhafte Datenspeicherung und die Notfallwiederherstellung.

HBase in Amazon S3 – Ab Amazon-EMR-Version 5.2.0 können Sie HBase auf Amazon S3 verwenden, um das HBase-Stammverzeichnis und die Metadaten eines Clusters direkt in Amazon S3 zu speichern. Anschließend können Sie einen neuen Cluster starten; dieser muss auf den Speicherort im Stammverzeichnis in Amazon S3 verweisen. Es kann nur jeweils ein Cluster den HBase-Standort in Amazon S3 verwenden, mit Ausnahme eines Lesereplikat-Clusters. Weitere Informationen finden Sie unter HBase auf Amazon S3 (Amazon-S3-Speichermodus).
HBase-Lesereplikate – Amazon EMR ab Version 5.7.0 mit HBase auf Amazon S3 unterstützt Lesereplikat-Cluster. Ein Read Replica-Cluster bietet schreibgeschützten Zugriff auf die Dateien und Metadaten des Speichers eines primären Clusters, um schreibgeschützte Operationen durchzuführen. Weitere Informationen finden Sie unter Verwenden eines Lesereplikat-Clusters.
HBase-Snapshots - Als Alternative zu HBase auf Amazon S3 können Sie mit EMR ab Version 4.0 Snapshots Ihrer HBase-Daten direkt in Amazon S3 erstellen und dann Daten mithilfe der Snapshots wiederherstellen. Weitere Informationen finden Sie unter Verwenden von HBase-Snapshots.

Wichtig

Für die Amazon-EMR-HBase-Clusterskalierung empfehlen wir nicht, verwaltete Skalierung oder Skalierung mit benutzerdefinierten Richtlinien mit HBase-Clustern zu verwenden.

Die folgende Tabelle listet die Version von HBase auf, die in der neuesten Version der Amazon-EMR-7.x-Serie enthalten ist, zusammen mit den Komponenten, die Amazon EMR mit HBase installiert.

Informationen zur Version der Komponenten, die in dieser Version mit HBase installiert wurden, finden Sie unter Komponentenversionen von Version 7.13.0.

HBase-Versionsinformationen für emr-7.13.0
Amazon-EMR-Versionsbezeichnung	HBase-Version	Mit HBase installierte Komponenten
emr-7.13.0	HBase 2.6.4-amzn-0	emrfs, emr-ddb, emr-goodies, emr-kinesis, emr-s3-dist-cp, emr-wal-cli, hadoop-client, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-hdfs-zkfc, hadoop-httpfs-server, hadoop-kms-server, hadoop-mapred, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, hadoop-yarn-timeline-server, hbase-hmaster, hbase-client, hbase-region-server, hbase-rest-server, hbase-thrift-server, hbase-operator-tools, zookeeper-client, zookeeper-server

Die folgende Tabelle listet die Version von Tez auf, die in der neuesten Version der Amazon-EMR-6.x-Serie enthalten ist, zusammen mit den Komponenten, die Amazon EMR mit HBase installiert.

Die Version der Komponenten, die mit HBase in dieser Version installiert wurden, finden Sie unter Komponentenversionen der Version 6.15.0.

HBase-Versionsinformationen für emr-6.15.0
Amazon-EMR-Versionsbezeichnung	HBase-Version	Mit HBase installierte Komponenten
emr-6.15.0	HBase 2.4.17-amzn-3	emrfs, emr-ddb, emr-goodies, emr-kinesis, emr-s3-dist-cp, emr-wal-cli, hadoop-client, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-kms-server, hadoop-mapred, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, hadoop-yarn-timeline-server, hbase-hmaster, hbase-client, hbase-region-server, hbase-rest-server, hbase-thrift-server, hbase-operator-tools, zookeeper-client, zookeeper-server

Anmerkung

Apache HBase HBCK2 ist ein separates Betriebstool zur Reparatur von HBase-Regionen und Systemtabellen. In Amazon EMR Version 6.1.0 und höher wird die Datei hbase-hbck2.jar /usr/lib/hbase-operator-tools/ auf dem primären Knoten bereitgestellt. Weitere Informationen zum Erstellen und Verwenden des Tools finden Sie unter HBase HBCK2.

Die folgende Tabelle listet die Version von HBase auf, die in der neuesten Version der Amazon-EMR-5.x-Serie enthalten ist, zusammen mit den Komponenten, die Amazon EMR mit HBase installiert.

Informationen zur Version der Komponenten, die in dieser Version mit HBase installiert wurden, finden Sie unter Komponentenversionen von Version 5.36.2.

HBase-Versionsinformationen für emr-5.36.2
Amazon-EMR-Versionsbezeichnung	HBase-Version	Mit HBase installierte Komponenten
emr-5.36.2	HBase 1.4.13	emrfs, emr-ddb, emr-goodies, emr-kinesis, emr-s3-dist-cp, hadoop-client, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-kms-server, hadoop-mapred, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, hadoop-yarn-timeline-server, hbase-hmaster, hbase-client, hbase-region-server, hbase-rest-server, hbase-thrift-server, zookeeper-client, zookeeper-server

Themen

Warnung JavaScript ist in Ihrem Browser nicht verfügbar oder deaktiviert.

Zur Nutzung der AWS-Dokumentation muss JavaScript aktiviert sein. Weitere Informationen finden auf den Hilfe-Seiten Ihres Browsers.

Dokumentkonventionen

Amazon EMR 6.6.0 – Hadoop-Versionshinweise

Erstellen eines Clusters mit HBase