Apache HBase - Amazon EMR

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Apache HBase

HBaseist eine nicht relationale, verteilte Open-Source-Datenbank, die im Rahmen des Hadoop-Projekts der Apache Software Foundation entwickelt wurde. HBase läuft auf dem Hadoop Distributed File System (HDFS), um nicht-relationale Datenbankfunktionen für das Hadoop-Ökosystem bereitzustellen. HBase ist in der Amazon EMR-Release-Version 4.6.0 und höher enthalten.

HBase arbeitet nahtlos mit Hadoop zusammen, nutzt das Dateisystem gemeinsam und dient als direkte Eingabe und Ausgabe für das MapReduce Framework und die Ausführungs-Engine. HBase lässt sich auch in Apache Hive integrieren und ermöglicht SQL-ähnliche Abfragen über HBase Tabellen, Verknüpfungen mit Hive-basierten Tabellen und Unterstützung für Java Database Connectivity (JDBC). Weitere Informationen dazu finden Sie unter Apache und in der HBase Dokumentation auf der Apache-Website HBase. HBase Ein Beispiel für die Verwendung HBase mit Hive finden Sie im AWS Big-Data-Blogbeitrag Kombinieren von NoSQL und massively parallel analytics using Apache HBase and Apache Hive on Amazon EMR.

Mit HBase Amazon EMR können Sie Ihre HBase Daten auch direkt auf Amazon Simple Storage Service (Amazon S3) sichern und beim Starten eines HBase Clusters aus einem zuvor erstellten Backup wiederherstellen. Amazon EMR bietet zusätzliche Optionen für die Integration Amazon S3 für eine dauerhafte Datenspeicherung und die Notfallwiederherstellung.

  • HBase auf Amazon S3 — Mit Amazon EMR Version 5.2.0 und höher können Sie HBase Amazon S3 verwenden, um das HBase Stammverzeichnis und die Metadaten eines Clusters direkt in Amazon S3 zu speichern. Anschließend können Sie einen neuen Cluster starten; dieser muss auf den Speicherort im Stammverzeichnis in Amazon S3 verweisen. Nur jeweils ein Cluster kann den HBase Standort in Amazon S3 verwenden, mit Ausnahme eines Read-Replica-Clusters. Weitere Informationen finden Sie unter HBase auf Amazon S3 (Amazon S3 S3-Speichermodus).

  • HBase Read-Replicas — Amazon EMR Version 5.7.0 und höher HBase auf Amazon S3 unterstützt Read-Replica-Cluster. Ein Read Replica-Cluster bietet schreibgeschützten Zugriff auf die Dateien und Metadaten des Speichers eines primären Clusters, um schreibgeschützte Operationen durchzuführen. Weitere Informationen finden Sie unter Verwenden eines Lesereplikat-Clusters.

  • HBase Snapshots — Als Alternative zu HBase Amazon S3 können Sie mit EMR Version 4.0 und höher Snapshots Ihrer HBase Daten direkt in Amazon S3 erstellen und dann Daten mithilfe der Snapshots wiederherstellen. Weitere Informationen finden Sie unter Schnappschüsse verwenden HBase .

Wichtig

Für die Amazon HBase EMR-Cluster-Skalierung empfehlen wir nicht, verwaltete Skalierung oder Skalierung mit benutzerdefinierten Richtlinien mit HBase Clustern zu verwenden.

In der folgenden Tabelle sind die Version von HBase aufgeführt, die in der neuesten Version der Amazon EMR 7.x-Serie enthalten ist, zusammen mit den Komponenten, mit denen Amazon EMR installiert wird. HBase

Informationen zur Version der Komponenten, mit denen HBase in dieser Version installiert wurde, finden Sie unter Komponentenversionen von Version 7.6.0.

HBase Versionsinformationen für emr-7.6.0
Amazon-EMR-Versionsbezeichnung HBase Version Komponenten, die mit installiert wurden HBase

emr-7.6.0

HBase 2.6.1

emrfs, emr-ddb, emr-goodies, emr-kinesis, emr-s3-dist-cp, emr-wal-cli, hadoop-client, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-kms-server, hadoop-mapred, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, hadoop-yarn-timeline-server, hbase-hmaster, hbase-client, hbase-region-server, hbase-rest-server, hbase-thrift-server, hbase-operator-tools, zookeeper-client, zookeeper-server

In der folgenden Tabelle sind die Version von HBase aufgeführt, die in der neuesten Version der Amazon EMR 6.x-Serie enthalten ist, zusammen mit den Komponenten, mit denen Amazon EMR installiert wird. HBase

Informationen zur Version der Komponenten, mit denen HBase in dieser Version installiert wurde, finden Sie unter Komponentenversionen von Version 6.15.0.

HBase Versionsinformationen für emr-6.15.0
Amazon-EMR-Versionsbezeichnung HBase Version Komponenten, die mit installiert wurden HBase

emr-6.15.0

HBase 2.4.17

emrfs, emr-ddb, emr-goodies, emr-kinesis, emr-s3-dist-cp, emr-wal-cli, hadoop-client, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-kms-server, hadoop-mapred, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, hadoop-yarn-timeline-server, hbase-hmaster, hbase-client, hbase-region-server, hbase-rest-server, hbase-thrift-server, hbase-operator-tools, zookeeper-client, zookeeper-server

Anmerkung

Apache HBase HBCK2 ist ein separates Betriebstool für die Reparatur von HBase Regionen und Systemtabellen. In Amazon EMR Version 6.1.0 und höher wird die Datei hbase-hbck2.jar /usr/lib/hbase-operator-tools/ auf dem primären Knoten bereitgestellt. Weitere Informationen zur Erstellung und Verwendung des Tools finden Sie unter. HBaseHBCK2

In der folgenden Tabelle sind die Version von HBase aufgeführt, die in der neuesten Version der Amazon EMR 5.x-Serie enthalten ist, zusammen mit den Komponenten, mit denen Amazon EMR installiert wird. HBase

Informationen zur Version der Komponenten, mit denen HBase in dieser Version installiert wurde, finden Sie unter Komponentenversionen von Version 5.36.2.

HBase Versionsinformationen für emr-5.36.2
Amazon-EMR-Versionsbezeichnung HBase Version Komponenten, die mit installiert wurden HBase

emr-5.36.2

HBase 1.4.13

emrfs, emr-ddb, emr-goodies, emr-kinesis, emr-s3-dist-cp, hadoop-client, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-kms-server, hadoop-mapred, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, hadoop-yarn-timeline-server, hbase-hmaster, hbase-client, hbase-region-server, hbase-rest-server, hbase-thrift-server, zookeeper-client, zookeeper-server