Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Tutorial: Menggunakan Amazon DynamoDB dan Apache Hive
Dalam tutorial ini, Anda akan meluncurkan klaster Amazon EMR, lalu menggunakan Apache Hive untuk memproses data yang disimpan dalam tabel DynamoDB.
Hive adalah aplikasi gudang data untuk Hadoop yang memungkinkan Anda memproses dan menganalisis data dari berbagai sumber. Hive menyediakan bahasa seperti SQL, HiveQL, yang memungkinkan Anda menggunakan data yang disimpan secara lokal di klaster Amazon EMR atau sumber data eksternal (seperti Amazon DynamoDB).
Untuk informasi selengkapnya, lihat tutorial Hive
Topik
Sebelum Anda mulai
Dalam tutorial ini, Anda akan memerlukan berikut:
-
Sebuah AWS akun. Jika belum memilikinya, lihat Mendaftar untuk AWS.
-
Klien SSH (Secure Shell). Anda akan menggunakan klien SSH untuk terhubung ke simpul pemimpin klaster Amazon EMR dan menjalankan perintah interaktif. Klien SSH tersedia secara default pada sebagian besar instalasi Linux, Unix, dan Mac OS X. Pengguna Windows dapat mengunduh dan menginstal klien PuTTY
, yang memiliki dukungan SSH.
Langkah berikutnya
Langkah 1: Buat pasangan kunci Amazon EC2