Tutorial: Menggunakan Amazon DynamoDB dan Apache Hive

Dalam tutorial ini, Anda akan meluncurkan klaster Amazon EMR, lalu menggunakan Apache Hive untuk memproses data yang disimpan dalam tabel DynamoDB.

Hive adalah aplikasi gudang data untuk Hadoop yang memungkinkan Anda memproses dan menganalisis data dari berbagai sumber. Hive menyediakan SQL-like bahasa, HiveQL, yang memungkinkan Anda bekerja dengan data yang disimpan secara lokal di kluster EMR Amazon atau di sumber data eksternal (seperti Amazon DynamoDB).

Untuk informasi selengkapnya, lihat tutorial Hive.

Topik

Sebelum Anda mulai

Dalam tutorial ini, Anda akan memerlukan berikut:

AWS Akun. Jika belum memilikinya, lihat Mendaftar untuk Akun AWS.
Klien SSH (Secure Shell). Anda akan menggunakan klien SSH untuk terhubung ke simpul pemimpin klaster Amazon EMR dan menjalankan perintah interaktif. Klien SSH tersedia secara default pada sebagian besar instalasi Linux, Unix, dan Mac OS X. Pengguna Windows dapat mengunduh dan menginstal klien PuTTY, yang memiliki dukungan SSH.

Langkah berikutnya

Langkah 1: Buat pasangan kunci Amazon EC2

Awas Javascript dinonaktifkan atau tidak tersedia di browser Anda.

Untuk menggunakan Dokumentasi AWS, Javascript harus diaktifkan. Lihat halaman Bantuan browser Anda untuk petunjuk.

Konvensi Dokumen

Mengintegrasikan dengan Amazon EMR

Langkah 1: Buat pasangan kunci Amazon EC2