Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Penyempurnaan performa
Saat membuat tabel eksternal Hive yang dipetakan ke tabel DynamoDB, Anda tidak menggunakan kapasitas baca atau tilis dari DynamoDB. Namun, aktivitas baca dan tulis pada tabel Hive (seperti INSERT
atau SELECT
) diterjemahkan langsung menjadi operasi baca dan tulis pada tabel DynamoDB yang mendasarinya.
Apache Hive di Amazon EMR mengimplementasikan logikanya sendiri untuk menyeimbangkan beban I/O pada tabel DynamoDB dan berupaya meminimalkan kemungkinan melebihi throughput tabel yang disediakan. Di akhir setiap kueri Hive, Amazon EMR mengembalikan metrik runtime, termasuk frekuensi throughput yang Anda sediakan terlampaui. Anda dapat menggunakan informasi ini, bersama dengan CloudWatch metrik pada tabel DynamoDB Anda, untuk meningkatkan kinerja dalam permintaan berikutnya.
Konsol Amazon EMR menyediakan alat pemantauan dasar untuk klaster Anda. Untuk informasi selengkapnya, lihat Melihat dan Memantau klaster di Panduan Manajemen Amazon EMR.
Anda juga dapat memantau performa klaster dan Hadoop menggunakan alat berbasis web, seperti Hue, Ganglia, dan antarmuka web Hadoop. Untuk informasi selengkapnya, lihat Melihat Antarmuka Web yang Di-hosting di Klaster Amazon EMR di Panduan Manajemen Amazon EMR.
Bagian ini menjelaskan langkah-langkah yang dapat Anda ambil untuk operasi Hive penyempurnaan performa pada tabel DynamoDB eksternal.