Penyempurnaan performa

Saat membuat tabel eksternal Hive yang dipetakan ke tabel DynamoDB, Anda tidak menggunakan kapasitas baca atau tilis dari DynamoDB. Namun, aktivitas baca dan tulis pada tabel Hive (seperti INSERT atau SELECT) diterjemahkan langsung menjadi operasi baca dan tulis pada tabel DynamoDB yang mendasarinya.

Apache Hive di Amazon EMR mengimplementasikan logikanya sendiri untuk menyeimbangkan beban I/O pada tabel DynamoDB dan berusaha meminimalkan kemungkinan melebihi throughput yang disediakan tabel. Di akhir setiap kueri Hive, Amazon EMR mengembalikan metrik runtime, termasuk frekuensi throughput yang Anda sediakan terlampaui. Anda dapat menggunakan informasi ini, bersama dengan CloudWatch metrik pada tabel DynamoDB Anda, untuk meningkatkan kinerja dalam permintaan berikutnya.

Konsol Amazon EMR menyediakan alat pemantauan dasar untuk klaster Anda. Untuk informasi selengkapnya, lihat Melihat dan Memantau klaster di Panduan Manajemen Amazon EMR.

Anda juga dapat memantau performa klaster dan Hadoop menggunakan alat berbasis web, seperti Hue, Ganglia, dan antarmuka web Hadoop. Untuk informasi selengkapnya, lihat Melihat Antarmuka Web yang Di-hosting di Klaster Amazon EMR di Panduan Manajemen Amazon EMR.

Bagian ini menjelaskan langkah-langkah yang dapat Anda ambil untuk operasi Hive penyempurnaan performa pada tabel DynamoDB eksternal.

Topik

Awas Javascript dinonaktifkan atau tidak tersedia di browser Anda.

Untuk menggunakan Dokumentasi AWS, Javascript harus diaktifkan. Lihat halaman Bantuan browser Anda untuk petunjuk.

Konvensi Dokumen

Membaca data karakter yang tidak dapat dicetak UTF-8

Throughput yang disediakan DynamoDB