Memantau DAX - Amazon DynamoDB

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Memantau DAX

Anda dapat memantau metrik utama, misalnya rasio hit cache, untuk memastikan kinerja cluster DAX yang optimal, mendiagnosis masalah, dan menentukan kapan Anda perlu menskalakan klaster. Memeriksa metrik kunci secara teratur membantu Anda mempertahankan kinerja, stabilitas, dan efisiensi biaya dengan menskalakan klaster agar sesuai dengan persyaratan beban kerja Anda. Untuk informasi selengkapnya tentang pemantauan DAX, lihatPemantauan produksi.

Daftar berikut menyajikan beberapa metrik utama yang harus Anda pantau:

  • Cache hit ratio - Menunjukkan seberapa efektif DAX melayani data cache, mengurangi kebutuhan untuk mengakses tabel DynamoDB yang mendasarinya. Beberapa kesalahan cache untuk cluster menunjukkan efisiensi caching yang baik. Tetapi beberapa klik cache menunjukkan bahwa Anda mungkin perlu meninjau kembali pengaturan TTL caching atau beban kerja tidak cocok untuk caching.

    Gunakan Amazon CloudWatch untuk menghitung rasio hit cache cluster DAX Anda. BandingkanItemCacheHits,ItemCacheMisses,QueryCacheHits, dan QueryCacheMisses metrik untuk mendapatkan rasio ini. Rumus berikut menunjukkan bagaimana rasio hit cache dihitung. Untuk menghitung rasio menggunakan rumus ini, bagilah cache hits Anda dengan jumlah cache hits dan misses Anda.

    Cache hit ratio = Cache hits / (Cache hits + Cache misses)

    Rasio hit cache adalah angka antara 0 dan 1, yang direpresentasikan sebagai persentase. Persentase yang lebih tinggi menunjukkan pemanfaatan cache keseluruhan yang lebih baik.

  • ErrorRequestCount— Hitungan permintaan yang mengakibatkan kesalahan pengguna yang dilaporkan oleh node atau cluster. ErrorRequestCounttermasuk permintaan yang dibatasi oleh node atau cluster. Memantau kesalahan pengguna dapat membantu Anda mengidentifikasi kesalahan konfigurasi penskalaan atau pola item/partisi panas dalam aplikasi Anda.

  • Latensi operasi — Memantau latensi operasi baca dan tulis ke dan dari cluster DAX dapat membantu Anda dalam mengidentifikasi kemacetan kinerja. Peningkatan latensi mungkin menunjukkan masalah dengan konfigurasi cluster DAX, jaringan, atau kebutuhan untuk menskalakan.

  • Konsumsi jaringan - Awasi NetworkBytesIn dan NetworkBytesOut metrik untuk memantau lalu lintas jaringan cluster DAX Anda. Peningkatan throughput jaringan yang tidak terduga dapat berarti lebih banyak permintaan klien atau pola kueri yang tidak efisien yang menyebabkan lebih banyak data ditransfer.

    Memantau konsumsi jaringan membantu Anda mengelola biaya untuk cluster DAX Anda. Ini juga memastikan jaringan tidak menjadi hambatan untuk kinerja cluster.

  • Tingkat penggusuran - Menunjukkan seberapa sering item dihapus dari cache Anda untuk memberi ruang bagi item baru. Jika tingkat penggusuran meningkat dari waktu ke waktu, cache Anda mungkin terlalu kecil atau strategi caching Anda tidak efektif.

    Pantau EvictedSize metrik CloudWatch untuk menentukan apakah ukuran cache Anda memadai untuk beban kerja Anda. Jika ukuran total yang diusir terus bertambah, Anda mungkin perlu meningkatkan klaster DAX Anda untuk mengakomodasi cache yang lebih besar.

  • Pemanfaatan CPU — Mengacu pada persentase pemanfaatan CPU dari node atau cluster. Ini adalah metrik penting untuk memantau database atau sistem caching apa pun. Pemanfaatan CPU yang tinggi dapat berarti cluster DAX Anda mungkin kelebihan beban dan perlu penskalaan untuk menangani peningkatan permintaan.

    Pantau CPUUtilization metrik untuk cluster DAX Anda. Jika pemanfaatan CPU Anda secara konsisten mendekati atau melebihi 70-80%, pertimbangkan untuk meningkatkan kluster DAX Anda seperti yang dijelaskan di bagian berikut.

    Jika jumlah permintaan yang dikirim ke DAX melebihi kapasitas node, DAX membatasi tingkat penerimaan permintaan tambahan. Ini dilakukan dengan mengembalikan a ThrottlingException. DAX terus mengevaluasi pemanfaatan CPU klaster Anda untuk menentukan volume permintaan yang dapat diproses sambil mempertahankan status klaster yang sehat.

    Anda dapat memantau ThrottledRequestCount metrik yang diterbitkan DAX. CloudWatch Jika melihat pengecualian ini secara rutin, Anda harus mempertimbangkan untuk menaikkan skala klaster.

Menskalakan cluster DAX Anda menggunakan data pemantauan

Anda dapat menentukan apakah Anda perlu meningkatkan atau menurunkan klaster DAX Anda dengan memantau metrik kinerjanya.

  • Tingkatkan atau perkecil — Jika cluster DAX Anda memiliki pemanfaatan CPU yang tinggi, klik cache rendah (setelah mengoptimalkan strategi caching), atau latensi operasi yang tinggi, Anda harus meningkatkan skala klaster Anda. Menambahkan lebih banyak node, juga disebut scaling out, dapat membantu mendistribusikan beban secara lebih merata. Untuk beban kerja dengan peningkatan penulisan per detik, Anda mungkin perlu memilih node yang lebih kuat (meningkatkan skala).

  • Turunkan skala — Jika Anda secara konsisten melihat pemanfaatan CPU yang rendah dan latensi operasi di bawah ambang batas Anda, Anda mungkin memiliki sumber daya yang disediakan secara berlebihan. Dalam kasus seperti itu, kurangi node untuk mengurangi biaya. Anda dapat mengurangi jumlah node menjadi 1 selama periode pemanfaatan rendah, tetapi Anda tidak dapat mematikan cluster sepenuhnya.