Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Dalam tutorial ini, Anda akan meluncurkan EMR cluster Amazon, dan kemudian menggunakan Apache Hive untuk memproses data yang disimpan dalam tabel DynamoDB.
Hive adalah aplikasi gudang data untuk Hadoop yang memungkinkan Anda memproses dan menganalisis data dari berbagai sumber. Hive menyediakan bahasa SQL seperti, HiveQL, yang memungkinkan Anda bekerja dengan data yang disimpan secara lokal di EMR klaster Amazon atau di sumber data eksternal (seperti Amazon DynamoDB).
Untuk informasi selengkapnya, lihat tutorial Hive
Topik
Sebelum Anda mulai
Dalam tutorial ini, Anda akan memerlukan berikut:
-
Sebuah AWS akun. Jika belum memilikinya, lihat Mendaftar untuk AWS.
-
SSHKlien (Secure Shell). Anda menggunakan SSH klien untuk terhubung ke node pemimpin EMR klaster Amazon dan menjalankan perintah interaktif. SSHklien tersedia secara default di sebagian besar instalasi Linux, Unix, dan Mac OS X. Pengguna Windows dapat mengunduh dan menginstal TTY klien Pu
, yang memiliki SSH dukungan.
Langkah selanjutnya
Langkah 1: Buat EC2 key pair Amazon