Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
HBasespesifikasi aplikasi untuk AMI versi Amazon sebelumnya EMR
Versi HBase yang didukung
HBaseversi | AMIversi | AWS CLI parameter konfigurasi | HBasedetail versi |
---|---|---|---|
0.94.18 |
3.1.0 dan versi yang lebih baru |
|
|
0.94.7 |
3.0-3.0.4 |
|
|
0,92 |
2.2 dan versi yang lebih baru |
|
HBaseprasyarat cluster
Cluster yang dibuat menggunakan Amazon EMR AMI versi 2.x dan 3.x harus memenuhi persyaratan berikut untuk. HBase
-
AWS CLI (opsional) —Untuk berinteraksi dengan HBase menggunakan baris perintah, unduh dan instal versi terbaru dari file. AWS CLI Untuk informasi selengkapnya, lihat Menginstal AWS Command Line Interface dalam Panduan Pengguna AWS Command Line Interface .
-
Setidaknya dua instance (opsional) —Node master cluster menjalankan server HBase master dan Zookeeper, dan node tugas menjalankan server wilayah. HBase Untuk kinerja terbaik, HBase cluster harus berjalan pada setidaknya dua EC2 instance, tetapi Anda dapat menjalankan HBase pada satu node untuk tujuan evaluasi.
-
Cluster yang berjalan lama— HBase hanya berjalan pada cluster yang berjalan lama. Secara default, EMR konsol CLI dan Amazon membuat cluster yang berjalan lama.
-
Kumpulan EC2 key pair Amazon (disarankan) —Untuk menggunakan protokol jaringan Secure Shell (SSH) untuk terhubung dengan master node dan menjalankan perintah HBase shell, Anda harus menggunakan EC2 key pair Amazon saat membuat cluster.
-
Versi yang benar AMI dan Hadoop— HBase cluster saat ini hanya didukung pada Hadoop 20.205 atau yang lebih baru.
-
Ganglia (opsional) —Untuk memantau metrik HBase kinerja, instal Ganglia saat Anda membuat cluster.
-
Bucket Amazon S3 untuk log (opsional) —Log untuk HBase tersedia di node master. Jika Anda ingin log ini disalin ke Amazon S3, tentukan bucket S3 untuk menerima file log saat Anda membuat kluster.
Membuat cluster dengan HBase
Tabel berikut mencantumkan opsi yang tersedia saat menggunakan konsol untuk membuat klaster dengan HBase menggunakan versi EMR AMI rilis Amazon.
Bidang | Tindakan |
---|---|
Pulihkan dari cadangan | Tentukan apakah akan memuat HBase klaster terlebih dahulu dengan data yang disimpan di Amazon S3. |
Lokasi Backup | Tentukan URI di mana cadangan untuk memulihkan berada di Amazon S3. |
Versi Backup | Opsional, tentukan nama versi cadangan di Lokasi Backup untuk digunakan. Jika Anda membiarkan bidang ini kosong, Amazon EMR menggunakan cadangan terbaru di Lokasi Cadangan untuk mengisi HBase klaster baru. |
Jadwalkan Pencadangan Reguler | Menentukan apakah untuk menjadwalkan backup tambahan otomatis. Cadangan pertama adalah cadangan penuh untuk membuat baseline untuk masa depan tambahan backup. |
Cadangan yang konsisten | Menentukan apakah backup harus konsisten. Cadangan konsisten adalah salah satu yang berhenti menulis operasi selama tahap cadangan awal, sinkronisasi di node. Setiap operasi tulis dengan demikian dijeda ditempatkan dalam antrian dan dilanjutkan saat sinkronisasi selesai. |
Frekuensi Backup | Jumlah days/hours/minutes antara backup terjadwal. |
Lokasi Backup | Amazon S3 URI tempat cadangan disimpan. Lokasi cadangan untuk setiap HBase cluster harus berbeda untuk memastikan bahwa backup diferensial tetap benar. |
Waktu mulai Backup | Tentukan kapan cadangan pertama harus terjadi. Anda dapat mengatur ini kenow , yang menyebabkan cadangan pertama dimulai segera setelah cluster berjalan, atau memasukkan tanggal dan waktu dalam ISOformat |
Contoh AWS CLI perintah berikut meluncurkan cluster dengan HBase dan aplikasi lainnya:
catatan
Karakter lanjutan baris Linux (\) disertakan agar mudah dibaca Karakter ini bisa dihapus atau digunakan dalam perintah Linux. Untuk Windows, hapus atau ganti dengan tanda sisipan (^).
aws emr create-cluster --name "
Test cluster
" --ami-version3.3
\ --applications Name=Hue
Name=Hive
Name=Pig
Name=HBase
\ --use-default-roles --ec2-attributes KeyName=myKey
\ --instance-typec1.xlarge
--instance-count3
--termination-protected
Setelah koneksi antara Hive dan HBase cluster dibuat (seperti yang ditunjukkan pada prosedur sebelumnya), Anda dapat mengakses data yang disimpan di HBase cluster dengan membuat tabel eksternal di Hive.
Contoh berikut, ketika dijalankan dari prompt Hive, membuat tabel eksternal yang mereferensikan data yang disimpan dalam HBase tabel yang disebutinputTable
. Anda kemudian dapat referensi inputTable
dalam pernyataan Hive untuk query dan memodifikasi data yang disimpan dalam HBase cluster.
catatan
Contoh berikut menggunakan protobuf-java-2.4.0a.jar di AMI 2.3.3, tetapi Anda harus memodifikasi contoh agar sesuai dengan versi Anda. Untuk memeriksa versi Protocol Buffer yang JAR Anda miliki, jalankan perintah di prompt perintah Hive:. ! ls /home/hadoop/lib;
add jar lib/emr-metrics-1.0.jar ; add jar lib/protobuf-java-2.4.0a.jar ; set hbase.zookeeper.quorum=ec2-107-21-163-157.compute-1.amazonaws.com ; create external table inputTable (key string, value string) stored by 'org.apache.hadoop.hive.hbase.HBaseStorageHandler' with serdeproperties ("hbase.columns.mapping" = ":key,f1:col1") tblproperties ("hbase.table.name" = "t1"); select count(*) from inputTable ;
Menyesuaikan konfigurasi HBase
Meskipun pengaturan default harus berfungsi untuk sebagian besar aplikasi, Anda memiliki fleksibilitas untuk mengubah pengaturan HBase konfigurasi Anda. Untuk melakukannya, jalankan salah satu dari dua skrip tindakan bootstrap:
-
configure-hbase-daemons—Mengkonfigurasi properti daemon master, regionserver, dan zookeeper. Properti ini termasuk ukuran heap dan opsi untuk diteruskan ke Java Virtual Machine (JVM) ketika HBase daemon dimulai. Anda mengatur properti ini sebagai argumen dalam tindakan bootstrap. Tindakan bootstrap ini memodifikasi file konfigurasi/home/hadoop/conf/hbase-user-env.sh pada HBase cluster.
-
configurre-hbase —Mengonfigurasi pengaturan HBase khusus situs seperti port yang harus diikat oleh HBase master dan berapa kali klien klien harus mencoba lagi suatu tindakan. CLI Anda dapat mengatur ini one-by-one, sebagai argumen dalam tindakan bootstrap, atau Anda dapat menentukan lokasi file XML konfigurasi di Amazon S3. Tindakan bootstrap ini memodifikasi file konfigurasi the /home/hadoop/conf/hbase -site.xml pada HBase cluster.
catatan
Skrip ini, seperti tindakan bootstrap lainnya, hanya dapat dijalankan ketika cluster dibuat; Anda tidak dapat menggunakannya untuk mengubah konfigurasi HBase cluster yang sedang berjalan.
Saat Anda menjalankan tindakan configurre-hbase atau configure-hbase-daemonsbootstrap, nilai yang Anda tentukan akan menggantikan nilai default. Setiap nilai yang Anda tidak secara eksplisit mengatur menerima nilai default.
Mengkonfigurasi HBase dengan tindakan bootstrap ini analog dengan menggunakan tindakan bootstrap di Amazon untuk mengonfigurasi pengaturan Hadoop dan properti EMR daemon Hadoop. Perbedaannya adalah bahwa HBase tidak memiliki opsi memori per proses. Sebagai gantinya, opsi memori diatur menggunakan --
argumen, di mana daemon
-optsdaemon
diganti dengan nama daemon untuk dikonfigurasi.
Konfigurasikan HBase daemon
Amazon EMR menyediakan tindakan bootstrap,s3://
, yang dapat Anda gunakan untuk mengubah konfigurasi HBase daemon, di mana region
.elasticmapreduce/bootstrap-actions/configure-hbase-daemonsregion
adalah wilayah tempat Anda meluncurkan HBase cluster Anda.
Untuk mengonfigurasi HBase daemon menggunakan AWS CLI, tambahkan tindakan configure-hbase-daemons
bootstrap saat Anda meluncurkan cluster untuk mengonfigurasi satu atau beberapa HBase daemon. Anda dapat mengatur properti berikut.
Properti | Deskripsi |
---|---|
hbase-master-opts |
Pilihan yang mengontrol bagaimana JVM menjalankan master daemon. Jika disetel, ini akan mengganti OPTS variabel HBASE _ MASTER _ default. |
regionserver-opts |
Opsi yang mengontrol bagaimana JVM menjalankan daemon server wilayah. Jika disetel, ini akan mengganti OPTS variabel HBASE _ REGIONSERVER _ default. |
zookeeper-opts |
Pilihan yang mengontrol bagaimana JVM menjalankan daemon zookeeper. Jika disetel, ini akan mengganti OPTS variabel HBASE _ ZOOKEEPER _ default. |
Untuk informasi selengkapnya tentang opsi ini, lihat hbase-env.sh
Sebuah tindakan bootstrap untuk mengkonfigurasi nilai-nilai untuk zookeeper-opts
dan hbase-master-opts
ditunjukkan dalam contoh berikut.
catatan
Karakter kelanjutan baris Linux (\) disertakan untuk memudahkan pembacaan. Karakter ini bisa dihapus atau digunakan dalam perintah Linux. Untuk Windows, hapus atau ganti dengan tanda sisipan (^).
aws emr create-cluster --name "
Test cluster
" --ami-version3.3
\ --applications Name=Hue
Name=Hive
Name=Pig
Name=HBase
\ --use-default-roles --ec2-attributes KeyName=myKey
\ --instance-typec1.xlarge
--instance-count3
--termination-protected \ --bootstrap-actions Path=s3://elasticmapreduce/bootstrap-actions/configure-hbase-daemons
,\ Args=["--hbase-zookeeper-opts=-Xmx1024m -XX:GCTimeRatio=19","--hbase-master-opts=-Xmx2048m","--hbase-regionserver-opts=-Xmx4096m"
]
Konfigurasikan pengaturan HBase situs
Amazon EMR menyediakan tindakan bootstrap,s3://elasticmapreduce/bootstrap-actions/configure-hbase
, yang dapat Anda gunakan untuk mengubah konfigurasiHBase. Anda dapat mengatur nilai konfigurasi one-by-one, sebagai argumen dalam tindakan bootstrap, atau Anda dapat menentukan lokasi file XML konfigurasi di Amazon S3. Pengaturan nilai konfigurasi one-by-one berguna jika Anda hanya perlu mengatur beberapa pengaturan konfigurasi. Mengaturnya menggunakan XML file berguna jika Anda memiliki banyak perubahan yang harus dilakukan, atau jika Anda ingin menyimpan pengaturan konfigurasi untuk digunakan kembali.
catatan
Anda dapat mengawali nama bucket Amazon S3 dengan awalan wilayah, seperti, where s3://
region
.elasticmapreduce/bootstrap-actions/configure-hbaseregion
adalah wilayah tempat Anda meluncurkan HBase cluster Anda.
Tindakan bootstrap ini memodifikasi file /home/hadoop/conf/hbase-site.xml
konfigurasi pada HBase cluster. Tindakan bootstrap hanya dapat dijalankan ketika HBase cluster diluncurkan.
Untuk informasi selengkapnya tentang setelan HBase situs yang dapat Anda konfigurasi, lihat Konfigurasi default
Atur tindakan configure-hbase
bootstrap saat Anda meluncurkan HBase cluster dan tentukan nilai hbase-site.xml
yang akan diubah.
Untuk menentukan pengaturan HBase situs individual menggunakan AWS CLI
-
Untuk mengubah
hbase.hregion.max.filesize
pengaturan, ketik perintah berikut dan gantimyKey
dengan nama EC2 key pair Amazon Anda.catatan
Karakter lanjutan baris Linux (\) disertakan agar mudah dibaca Karakter ini bisa dihapus atau digunakan dalam perintah Linux. Untuk Windows, hapus atau ganti dengan tanda sisipan (^).
aws emr create-cluster --name "
Test cluster
" --ami-version3.3
\ --applications Name=Hue
Name=Hive
Name=Pig
Name=HBase
\ --use-default-roles --ec2-attributes KeyName=myKey
\ --instance-typec1.xlarge
--instance-count3
--termination-protected \ --bootstrap-actions Path=s3://elasticmapreduce/bootstrap-actions/configure-hbase
,Args=["-s","hbase.hregion.max.filesize=52428800"
]
Untuk menentukan pengaturan HBase situs dengan XML file menggunakan AWS CLI
-
Buat versi khusus
hbase-site.xml
. File kustom Anda harus validXML. Untuk mengurangi kemungkinan terjadinya kesalahan, mulailah dengan salinan defaulthbase-site.xml
, yang terletak di node EMR HBase master Amazon di/home/hadoop/conf/hbase-site.xml
, dan edit salinan file itu alih-alih membuat file dari awal. Anda dapat memberikan nama baru pada file baru, atau meninggalkannya sebagaihbase-site.xml
. -
Unggah file pembuangan
hbase-site.xml
ke bucket Amazon S3 Anda. Itu harus memiliki izin yang ditetapkan sehingga AWS akun yang meluncurkan cluster dapat mengakses file. Jika AWS akun yang meluncurkan cluster juga memiliki bucket Amazon S3, ia memiliki akses. -
Atur tindakan bootstrap configurre-hbase saat Anda meluncurkan HBase cluster, dan sertakan lokasi file kustom Anda.
hbase-site.xml
Contoh berikut menetapkan nilai konfigurasi HBase situs untuk yang ditentukan dalam files3://amzn-s3-demo-bucket/my-hbase-site.xml
. Ketik perintah berikut, gantimyKey
dengan nama EC2 key pair Anda, dan gantiamzn-s3-demo-bucket
dengan nama keranjang Amazon S3.catatan
Karakter lanjutan baris Linux (\) disertakan agar mudah dibaca Karakter ini bisa dihapus atau digunakan dalam perintah Linux. Untuk Windows, hapus atau ganti dengan tanda sisipan (^).
aws emr create-cluster --name "
Test cluster
" --ami-version3.3
\ --applications Name=Hue
Name=Hive
Name=Pig
Name=HBase
\ --use-default-roles --ec2-attributes KeyName=myKey
\ --instance-typec1.xlarge
--instance-count3
--termination-protected \ --bootstrap-actions Path=s3://elasticmapreduce/bootstrap-actions/configure-hbase
,Args=["--site-config-file","s3://amzn-s3-demo-bucket/config.xml"
]Jika Anda menentukan lebih dari satu opsi untuk menyesuaikan HBase operasi, Anda harus menambahkan setiap pasangan kunci-nilai dengan sakelar
-s
opsi, seperti yang ditunjukkan pada contoh berikut:--bootstrap-actions
s3://elasticmapreduce/bootstrap-actions/configure-hbase
,Args=["-s","zookeeper.session.timeout=60000"
]
Dengan set proxy dan SSH koneksi terbuka, Anda dapat melihat HBase UI dengan membuka jendela browser dengan http://master-public-dns-name
:60010/master-status, di mana master-public-dns-name
adalah DNS alamat publik dari node master di HBase cluster.
Anda dapat melihat HBase log saat ini dengan menggunakan SSH untuk terhubung ke node master, dan menavigasi ke direktori. mnt/var/log/hbase
Log ini tidak tersedia setelah klaster dihentikan kecuali Anda mengaktifkan pencatatan ke Amazon S3 ketika klaster diluncurkan.
Cadangkan dan pulihkan HBase
Amazon EMR menyediakan kemampuan untuk mencadangkan HBase data Anda ke Amazon S3, baik secara manual atau pada jadwal otomatis. Anda dapat melakukan backup penuh dan inkremental. Setelah Anda memiliki versi HBase data yang dicadangkan, Anda dapat mengembalikan versi tersebut ke cluster. HBase Anda dapat memulihkan ke HBase klaster yang sedang berjalan, atau meluncurkan klaster baru yang telah diisi sebelumnya dengan data cadangan.
Selama proses pencadangan, HBase terus jalankan perintah tulis. Meskipun ini memastikan bahwa cluster Anda tetap tersedia di seluruh cadangan, ada risiko inkonsistensi antara data yang didukung dan operasi tulis dijalankan secara paralel. Untuk memahami ketidakkonsistenan yang mungkin timbul, Anda harus mempertimbangkan bahwa HBase mendistribusikan operasi tulis di seluruh node di klasternya. Jika operasi menulis terjadi setelah node tertentu disurvei, data yang tidak termasuk dalam arsip cadangan. Anda bahkan mungkin menemukan bahwa penulisan sebelumnya ke HBase cluster (dikirim ke node yang telah disurvei) mungkin tidak ada dalam arsip cadangan, sedangkan penulisan nanti (dikirim ke node sebelum disurvei) disertakan.
Jika cadangan yang konsisten diperlukan, Anda harus menjeda penulisan HBase selama bagian awal proses pencadangan, sinkronisasi di seluruh node. Anda dapat melakukannya dengan menentukan parameter --consistent
ketika meminta cadangan. Dengan parameter ini, menulis selama periode ini antri dan dijalankan segera setelah sinkronisasi selesai. Anda juga dapat menjadwalkan pencadangan berulang, yang menyelesaikan inkonsistensi dari waktu ke waktu, karena data yang terlewatkan pada suatu pencadangan akan dicadangkan pada sesi berikutnya.
Saat Anda mencadangkan HBase data, Anda harus menentukan direktori cadangan yang berbeda untuk setiap cluster. Cara mudah untuk melakukannya adalah dengan menggunakan pengidentifikasi cluster sebagai bagian dari jalan yang ditentukan untuk direktori cadangan. Misalnya, s3://amzn-s3-demo-bucket/backups/j-3AEXXXXXX16F2
. Ini memastikan bahwa setiap backup incremental future mengacu pada cluster yang benar. HBase
Ketika Anda siap untuk menghapus file cadangan lama yang tidak lagi diperlukan, kami sarankan Anda terlebih dahulu melakukan backup penuh HBase data Anda. Hal ini memastikan bahwa semua data dipertahankan dan menyediakan dasar untuk backup tambahan masa depan. Setelah backup penuh selesai, Anda dapat menavigasi ke lokasi cadangan dan secara manual menghapus file cadangan lama.
Proses HBase pencadangan menggunakan S3 DistCp untuk operasi penyalinan, yang memiliki batasan tertentu mengenai ruang penyimpanan file sementara.
Cadangkan dan pulihkan HBase menggunakan konsol
Konsol menyediakan kemampuan untuk meluncurkan cluster baru dan mengisinya dengan data dari HBase cadangan sebelumnya. Ini juga memberi Anda kemampuan untuk menjadwalkan pencadangan data inkremental secara berkala. HBase Fungsionalitas pencadangan dan pemulihan tambahan, seperti kemampuan untuk memulihkan data ke cluster yang sudah berjalan, melakukan pencadangan manual, dan menjadwalkan pencadangan penuh otomatis, tersedia menggunakan file. CLI
Untuk mengisi cluster baru dengan HBase data yang diarsipkan menggunakan konsol
Arahkan ke EMR konsol Amazon baru dan pilih Beralih ke konsol lama dari navigasi samping. Untuk informasi selengkapnya tentang apa yang diharapkan saat beralih ke konsol lama, lihat Menggunakan konsol lama.
-
Pilih Buat klaster.
-
Di bagian Konfigurasi Perangkat Lunak, untuk Aplikasi Tambahan, pilih HBasedan Konfigurasi dan tambahkan.
-
Pada Tambahkan Aplikasi kotak dialog, periksa Pulihkan dari Backup.
-
Untuk Lokasi Cadangan, tentukan lokasi cadangan yang akan dimuat ke dalam HBase cluster baru. Ini harus berupa Amazon S3 URL dari formulir.
s3://myawsbucket/backups/
-
Untuk Versi Backup, Anda memiliki pilihan untuk menentukan nama versi cadangan untuk dimuat dengan menetapkan nilai. Jika Anda tidak menetapkan nilai untuk Versi Cadangan, Amazon EMR memuat cadangan terbaru di lokasi yang ditentukan.
-
Pilih Tambahkan dan lanjutkan untuk membuat cluster dengan pilihan lain seperti yang diinginkan.
Untuk menjadwalkan pencadangan HBase data otomatis menggunakan konsol
-
Di bagian Konfigurasi Perangkat Lunak, untuk Aplikasi Tambahan, pilih HBasedan Konfigurasi dan tambahkan.
-
Pilih Jadwalkan Backup reguler.
-
Menentukan apakah backup harus konsisten. Cadangan konsisten adalah salah satu yang berhenti menulis operasi selama tahap cadangan awal, sinkronisasi di node. Setiap operasi tulis sehingga berhenti ditempatkan dalam antrian dan melanjutkan ketika sinkronisasi selesai.
-
Mengatur seberapa sering backup harus terjadi dengan memasukkan nomor untuk Frekuensi Backup dan memilih hari, Jam, atau Menit. Pencadangan otomatis pertama yang berjalan adalah cadangan penuh; setelah itu, Amazon EMR menyimpan cadangan tambahan berdasarkan jadwal yang Anda tentukan.
-
Tentukan lokasi di Amazon S3 tempat backup harus disimpan. Setiap HBase cluster harus dicadangkan ke lokasi terpisah di Amazon S3 untuk memastikan bahwa cadangan tambahan dihitung dengan benar.
-
Tentukan kapan cadangan pertama harus terjadi dengan menetapkan nilai untuk Waktu Mulai Backup. Anda dapat mengatur ini ke
now
, yang menyebabkan cadangan pertama dimulai segera setelah cluster berjalan, atau memasukkan tanggal dan waktu dalam ISOformat. Misalnya, 2013-09-26T 20:00 Z, menetapkan waktu mulai ke 26 September 2013 pukul 8 malam. UTC -
Pilih Tambahkan.
-
Lanjutkan dengan menciptakan cluster dengan pilihan lain seperti yang diinginkan.
Monitor HBase dengan CloudWatch
Amazon EMR melaporkan tiga metrik CloudWatch yang dapat Anda gunakan untuk memantau HBase cadangan Anda. Metrik ini didorong ke CloudWatch interval lima menit, dan disediakan tanpa biaya.
Metrik | Deskripsi |
---|---|
HBaseBackupFailed |
Apakah cadangan terakhir gagal. Ini diatur ke 0 secara default dan diperbarui ke 1 jika upaya cadangan sebelumnya gagal. Metrik ini hanya dilaporkan untuk HBase cluster. Kasus penggunaan: Pantau HBase cadangan Unit: Jumlah |
HBaseMostRecentBackupDuration |
Jumlah waktu yang dibutuhkan cadangan sebelumnya untuk menyelesaikan. Metrik ini diatur terlepas dari apakah cadangan terakhir selesai berhasil atau gagal. Saat cadangan sedang berlangsung, metrik ini akan mengembalikan jumlah menit setelah pencadangan dimulai. Metrik ini hanya dilaporkan untuk HBase cluster. Kasus penggunaan: Monitor HBase Backup Unit: Menit |
HBaseTimeSinceLastSuccessfulBackup |
Jumlah menit berlalu setelah HBase pencadangan terakhir yang berhasil dimulai di cluster Anda. Metrik ini hanya dilaporkan untuk HBase cluster. Kasus penggunaan: Pantau HBase cadangan Unit: Menit |
Konfigurasikan Ganglia untuk HBase
Anda mengkonfigurasi Ganglia untuk HBase menggunakan tindakan configure-hbase-for-gangliabootstrap. Tindakan bootstrap ini dikonfigurasi HBase untuk mempublikasikan metrik ke Ganglia.
Anda harus mengkonfigurasi HBase dan Ganglia ketika Anda meluncurkan cluster; pelaporan Ganglia tidak dapat ditambahkan ke cluster yang sedang berjalan.
Ganglia juga menyimpan file log di server di /mnt/var/log/ganglia/rrds
. Jika Anda mengonfigurasi kluster Anda untuk menahan file log ke bucket Amazon S3, log file Ganglia akan tetap berada di sana juga.
Untuk meluncurkan cluster dengan GangliaHBase, gunakan tindakan configure-hbase-for-gangliabootstrap seperti yang ditunjukkan pada contoh berikut.
catatan
Karakter lanjutan baris Linux (\) disertakan agar mudah dibaca Karakter ini bisa dihapus atau digunakan dalam perintah Linux. Untuk Windows, hapus atau ganti dengan tanda sisipan (^).
aws emr create-cluster --name "
Test cluster
" --ami-version3.3
\ --applications Name=Hue
Name=Hive
Name=Pig
Name=HBase
Name=Ganglia
\ --use-default-roles --ec2-attributes KeyName=myKey
\ --instance-typec1.xlarge
--instance-count3
--termination-protected \ --bootstrap-actions Path=s3://elasticmapreduce/bootstrap-actions/configure-hbase-for-ganglia
Setelah cluster diluncurkan dengan Ganglia dikonfigurasi, Anda dapat mengakses grafik Ganglia dan laporan menggunakan antarmuka grafis yang berjalan pada node master.