Apache HBase - Amazon EMR

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Apache HBase

HBaseadalah database terdistribusi open source, non-relasional, yang dikembangkan sebagai bagian dari proyek Hadoop Apache Software Foundation. HBase berjalan di atas Hadoop Distributed File System (HDFS) untuk menyediakan kemampuan database non-relasional untuk ekosistem Hadoop. HBase disertakan dengan Amazon EMR versi rilis 4.6.0 dan yang lebih baru.

HBase bekerja mulus dengan Hadoop, berbagi sistem file dan berfungsi sebagai input dan output langsung ke MapReduce kerangka kerja dan mesin eksekusi. HBase juga terintegrasi dengan Apache Hive, memungkinkan kueri seperti SQL di atas HBase tabel, bergabung dengan tabel berbasis HIVE, dan dukungan untuk Java Database Connectivity (JDBC). Untuk informasi selengkapnya HBase, lihat Apache HBase dan HBase dokumentasi di situs web Apache. Untuk contoh cara menggunakan HBase Hive, lihat posting Blog AWS Big Data Combine NoSQL dan massively parallel analytics HBase menggunakan Apache dan Apache Hive di Amazon EMR.

Dengan HBase di Amazon EMR, Anda juga dapat mencadangkan HBase data langsung ke Amazon Simple Storage Service (Amazon S3), dan memulihkan dari cadangan yang dibuat sebelumnya saat meluncurkan cluster. HBase Amazon EMR menawarkan opsi tambahan untuk mengintegrasikan dengan Amazon S3 untuk ketekunan data dan pemulihan bencana.

  • HBase di Amazon S3 - Dengan Amazon EMR versi 5.2.0 dan yang lebih baru, Anda dapat menggunakan di Amazon HBase S3 untuk menyimpan direktori HBase root cluster dan metadata langsung ke Amazon S3. Anda kemudian dapat memulai sebuah klaster baru, menunjuk ke lokasi direktori root di Amazon S3. Hanya satu cluster pada satu waktu yang dapat menggunakan HBase lokasi di Amazon S3, dengan pengecualian cluster read-replica. Untuk informasi selengkapnya, lihat HBase di Amazon S3 (mode penyimpanan Amazon S3).

  • HBase read-replicas - Amazon EMR versi 5.7.0 dan yang lebih baru dengan Amazon HBase S3 mendukung klaster read-replika. Klaster replika baca menyediakan akses baca-saja ke file penyimpanan dan metadata klaster utama untuk operasi baca-saja. Untuk informasi selengkapnya, lihat Menggunakan klaster replika baca..

  • HBase Snapshots - Sebagai alternatif untuk HBase di Amazon S3, dengan EMR versi 4.0 dan yang lebih baru Anda dapat membuat snapshot data Anda HBase langsung ke Amazon S3 dan kemudian memulihkan data menggunakan snapshot. Untuk informasi selengkapnya, lihat Menggunakan HBase snapshot.

penting

Untuk penskalaan HBase klaster EMR Amazon, sebaiknya jangan gunakan penskalaan terkelola atau penskalaan dengan kebijakan khusus dengan klaster. HBase

Tabel berikut mencantumkan versi yang HBase disertakan dalam rilis terbaru seri Amazon EMR 7.x, bersama dengan komponen yang dipasang Amazon EMR. HBase

Untuk versi komponen yang diinstal HBase dalam rilis ini, lihat Rilis Versi Komponen 7.6.0.

HBase informasi versi untuk emr-7.6.0
Label Rilis Amazon EMR HBase Versi Komponen Dipasang Dengan HBase

emr-7.6.0

HBase 2.6.1

emrfs, emr-ddb, emr-goodies, emr-kinesis, emr-s3-dist-cp, emr-wal-cli, hadoop-client, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-kms-server, hadoop-mapred, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, hadoop-yarn-timeline-server, hbase-hmaster, hbase-client, hbase-region-server, hbase-rest-server, hbase-thrift-server, hbase-operator-tools, zookeeper-client, zookeeper-server

Tabel berikut mencantumkan versi yang HBase disertakan dalam rilis terbaru seri Amazon EMR 6.x, bersama dengan komponen yang dipasang Amazon EMR. HBase

Untuk versi komponen yang diinstal HBase dalam rilis ini, lihat Rilis Versi Komponen 6.15.0.

HBase informasi versi untuk emr-6.15.0
Label Rilis Amazon EMR HBase Versi Komponen Dipasang Dengan HBase

emr-6.15.0

HBase 2.4.17

emrfs, emr-ddb, emr-goodies, emr-kinesis, emr-s3-dist-cp, emr-wal-cli, hadoop-client, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-kms-server, hadoop-mapred, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, hadoop-yarn-timeline-server, hbase-hmaster, hbase-client, hbase-region-server, hbase-rest-server, hbase-thrift-server, hbase-operator-tools, zookeeper-client, zookeeper-server

catatan

Apache HBase HBCK2 adalah alat operasional terpisah untuk memperbaiki HBase daerah dan tabel sistem. Di Amazon EMR versi 6.1.0 dan yang lebih baru, hbase-hbck2.jar disediakan /usr/lib/hbase-operator-tools/ di simpul utama. Untuk informasi selengkapnya tentang cara membuat dan menggunakan alat ini, lihat HBaseHBCK2.

Tabel berikut mencantumkan versi yang HBase disertakan dalam rilis terbaru seri Amazon EMR 5.x, bersama dengan komponen yang dipasang Amazon EMR. HBase

Untuk versi komponen yang diinstal HBase dalam rilis ini, lihat Rilis 5.36.2 Versi Komponen.

HBase informasi versi untuk emr-5.36.2
Label Rilis Amazon EMR HBase Versi Komponen Dipasang Dengan HBase

emr-5.36.2

HBase 1.4.13

emrfs, emr-ddb, emr-goodies, emr-kinesis, emr-s3-dist-cp, hadoop-client, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-kms-server, hadoop-mapred, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, hadoop-yarn-timeline-server, hbase-hmaster, hbase-client, hbase-region-server, hbase-rest-server, hbase-thrift-server, zookeeper-client, zookeeper-server