Apache HBase - Amazon EMR

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Apache HBase

HBaseest une base de données distribuée open source, non relationnelle, développée dans le cadre du projet Hadoop de l'Apache Software Foundation. HBase fonctionne sur le système de fichiers distribué Hadoop (HDFS) pour fournir des fonctionnalités de base de données non relationnelles à l'écosystème Hadoop. HBase est inclus dans les versions 4.6.0 et ultérieures d'Amazon EMR.

HBase fonctionne parfaitement avec Hadoop, partage son système de fichiers et sert d'entrée et de sortie directes au MapReduce framework et au moteur d'exécution. HBase s'intègre également à Apache Hive, permettant des requêtes de type SQL sur des tables, des jointures avec HBase des tables basées sur Hive et la prise en charge de la connectivité de base de données Java (JDBC). Pour plus d'informations HBase, consultez Apache HBase et HBase la documentation sur le site Web d'Apache. Pour un exemple d'utilisation HBase avec Hive, consultez le billet de blog sur le AWS Big Data Combine NoSQL et massively parallel analytics using HBase Apache and Apache Hive on Amazon EMR.

Avec Amazon EMR, vous pouvez également sauvegarder vos HBase données directement HBase sur Amazon Simple Storage Service (Amazon S3) et les restaurer à partir d'une sauvegarde créée précédemment lors du lancement d'un cluster. HBase Amazon EMR offre d'autres options d'intégration avec Amazon S3 pour la persistance des données et la reprise après sinistre.

  • HBase sur Amazon S3 - Avec Amazon EMR version 5.2.0 et versions ultérieures, vous pouvez l'utiliser sur Amazon HBase S3 pour stocker le répertoire HBase racine et les métadonnées d'un cluster directement sur Amazon S3. Vous pouvez par la suite démarrer un nouveau cluster, en le désignant à l'emplacement du répertoire racine dans Amazon S3. Un seul cluster à la fois peut utiliser l' HBase emplacement dans Amazon S3, à l'exception d'un cluster en lecture et réplication. Pour de plus amples informations, veuillez consulter HBase sur Amazon S3 (mode de stockage Amazon S3).

  • HBase read-replicas - Amazon EMR version 5.7.0 et versions ultérieures avec Amazon HBase S3 prend en charge les clusters de lecture et de réplication. Un cluster réplica en lecture offre un accès en lecture seule aux fichiers et métadonnées de stockage d'un cluster principal pour des opérations en lecture seule. Pour de plus amples informations, veuillez consulter Utilisation d'un cluster réplica en lecture.

  • HBase Instantanés : comme alternative à Amazon S3, avec EMR version 4.0 et ultérieure, vous pouvez créer des instantanés de HBase vos données directement HBase sur Amazon S3, puis récupérer les données à l'aide des instantanés. Pour de plus amples informations, veuillez consulter Utilisation de HBase snapshots.

Important

Pour le dimensionnement des HBase clusters Amazon EMR, nous vous déconseillons d'utiliser le dimensionnement géré ou le dimensionnement avec des politiques personnalisées pour les clusters. HBase

Le tableau suivant répertorie la version HBase incluse dans la dernière version de la série Amazon EMR 7.x, ainsi que les composants avec lesquels Amazon EMR est installé. HBase

Pour connaître la version des composants installés HBase dans cette version, consultez la version 7.6.0 Versions des composants.

HBase informations de version pour emr-7.6.0
Étiquette de version Amazon EMR HBase Version Composants installés avec HBase

emr-7.6.0

HBase 2.6.1

emrfs, emr-ddb, emr-goodies, emr-kinesis, emr-s3-dist-cp, emr-wal-cli, hadoop-client, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-kms-server, hadoop-mapred, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, hadoop-yarn-timeline-server, hbase-hmaster, hbase-client, hbase-region-server, hbase-rest-server, hbase-thrift-server, hbase-operator-tools, zookeeper-client, zookeeper-server

Le tableau suivant répertorie la version HBase incluse dans la dernière version de la série Amazon EMR 6.x, ainsi que les composants avec lesquels Amazon EMR est installé. HBase

Pour connaître la version des composants installés HBase dans cette version, consultez la version 6.15.0 Versions des composants.

HBase informations de version pour emr-6.15.0
Étiquette de version Amazon EMR HBase Version Composants installés avec HBase

emr-6.15.0

HBase 2.4.17

emrfs, emr-ddb, emr-goodies, emr-kinesis, emr-s3-dist-cp, emr-wal-cli, hadoop-client, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-kms-server, hadoop-mapred, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, hadoop-yarn-timeline-server, hbase-hmaster, hbase-client, hbase-region-server, hbase-rest-server, hbase-thrift-server, hbase-operator-tools, zookeeper-client, zookeeper-server

Note

Apache HBase HBCK2 est un outil opérationnel distinct pour réparer HBase les régions et les tables système. Dans Amazon EMR version 6.1.0 et versions ultérieures, le fichier hbase-hbck2.jar est fourni /usr/lib/hbase-operator-tools/ sur le nœud principal. Pour plus d'informations sur la création et l'utilisation de l'outil, consultez HBaseHBCK2.

Le tableau suivant répertorie la version HBase incluse dans la dernière version de la série Amazon EMR 5.x, ainsi que les composants avec lesquels Amazon EMR est installé. HBase

Pour la version des composants installés HBase dans cette version, voir la version 5.36.2 Versions des composants.

HBase informations de version pour emr-5.36.2
Étiquette de version Amazon EMR HBase Version Composants installés avec HBase

emr-5.36.2

HBase 1.4.13

emrfs, emr-ddb, emr-goodies, emr-kinesis, emr-s3-dist-cp, hadoop-client, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-kms-server, hadoop-mapred, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, hadoop-yarn-timeline-server, hbase-hmaster, hbase-client, hbase-region-server, hbase-rest-server, hbase-thrift-server, zookeeper-client, zookeeper-server