Durasi percobaan ulang Permintaan data paralel Durasi proses Waktu permintaan

Topik tambahan

Berikut ini adalah beberapa cara untuk menyetel aplikasi yang menggunakan Hive untuk mengakses DynamoDB.

Durasi percobaan ulang

Secara default, Hive akan menjalankan kembali tugas Hadoop jika sama sekali belum mengembalikan hasil apa pun dari DynamoDB dalam waktu dua menit. Anda dapat menyesuaikan interval ini dengan mengubah parameter dynamodb.retry.duration:


SET dynamodb.retry.duration=2;

Nilainya harus berupa angka bulat selain nol, yang mewakili jumlah menit dalam interval percobaan ulang. Default untuk dynamodb.retry.duration adalah 2 (menit).

Permintaan data paralel

Beberapa permintaan data, baik dari lebih dari satu pengguna atau lebih dari satu aplikasi ke satu tabel dapat menguras throughput baca yang disediakan dan memperlambat performa.

Durasi proses

Konsistensi data di DynamoDB bergantung pada urutan operasi baca dan tulis pada setiap simpul. Saat kueri Hive sedang berjalan, aplikasi lain mungkin memuat data baru ke dalam tabel DynamoDB atau memodifikasi atau menghapus data yang ada. Dalam kasus ini, hasil kueri Hive mungkin tidak mencerminkan perubahan yang dilakukan pada data saat kueri sedang berjalan.

Waktu permintaan

Menjadwalkan kueri Hive yang mengakses tabel DynamoDB ketika permintaan pada tabel DynamoDB rendah akan meningkatkan performa. Misalnya, jika sebagian besar pengguna aplikasi Anda tinggal di San Francisco, Anda dapat memilih untuk mengekspor data harian pada pukul 4:00 A.M. PST ketika mayoritas pengguna tertidur dan tidak memperbarui catatan dalam database DynamoDB Anda.

Awas Javascript dinonaktifkan atau tidak tersedia di browser Anda.

Untuk menggunakan Dokumentasi AWS, Javascript harus diaktifkan. Lihat halaman Bantuan browser Anda untuk petunjuk.

Konvensi Dokumen

Menyesuaikan pemeta

Integrasi dengan S3