Metrik Apa yang Harus Saya Pantau? - Amazon ElastiCache

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Metrik Apa yang Harus Saya Pantau?

CloudWatch Metrik berikut menawarkan wawasan yang baik tentang ElastiCache kinerja. Dalam kebanyakan kasus, kami menyarankan Anda menyetel CloudWatch alarm untuk metrik ini sehingga Anda dapat mengambil tindakan korektif sebelum masalah kinerja terjadi.

CPUUtilization

Ini adalah metrik tingkat host yang dilaporkan sebagai persentase. Untuk informasi selengkapnya, lihat Metrik Tingkat Host.

Valkey dan Redis OSS

Untuk tipe node yang lebih kecil dengan 2 vCPUs atau kurang, gunakan CPUUtilization metrik untuk memantau beban kerja Anda.

Secara umum, kami sarankan Anda menetapkan ambang batas Anda pada 90% dari yang tersediaCPU. Karena Valkey dan Redis OSS keduanya single-threaded, nilai ambang sebenarnya harus dihitung sebagai sebagian kecil dari total kapasitas node. Sebagai contoh, misalkan Anda menggunakan jenis simpul yang memiliki dua inti. Dalam hal ini, ambang batas untuk CPUUtilization adalah 90/2, atau 45%.

Anda akan perlu menentukan ambang batas Anda sendiri, berdasarkan jumlah inti pada simpul cache yang Anda gunakan. Jika Anda melampaui ambang batas ini, dan beban kerja utama Anda berasal dari permintaan baca, skalakan keluar klaster cache Anda dengan menambahkan replika baca. Jika beban kerja utama dari permintaan tulis, bergantung pada konfigurasi klaster Anda, sebaiknya Anda:

  • Cluster Valkey atau Redis OSS (mode cluster dinonaktifkan): tingkatkan dengan menggunakan jenis instance cache yang lebih besar.

  • Cluster Valkey atau Redis OSS (mode cluster enabled): tambahkan lebih banyak pecahan untuk mendistribusikan beban kerja tulis di lebih banyak node utama.

Tip

Alih-alih menggunakan metrik Host-LevelCPUUtilization, OSS pengguna Valkey dan Redis mungkin dapat menggunakan metrikEngineCPUUtilization, yang melaporkan persentase penggunaan pada inti mesin Valkey atau Redis. OSS Untuk melihat apakah metrik ini tersedia di node Anda dan untuk informasi selengkapnya, lihat Metrik untuk Valkey dan Redis. OSS

Untuk tipe node yang lebih besar dengan 4 vCPUs atau lebih, Anda mungkin ingin menggunakan EngineCPUUtilization metrik, yang melaporkan persentase penggunaan pada inti OSS mesin Valkey atau Redis. Untuk melihat apakah metrik ini tersedia di node Anda dan untuk informasi selengkapnya, lihat Metrik untuk OSS Redis.

Memcache

Karena Memcached bersifat multi-thread, metrik ini dapat mencapai 90%. Jika Anda melebihi ambang batas ini, skala cluster cache Anda dengan menggunakan jenis node cache yang lebih besar atau skala dengan menambahkan lebih banyak node cache.

E ngineCPUUtilization

Untuk tipe node yang lebih besar dengan 4 vCPUs atau lebih, Anda mungkin ingin menggunakan EngineCPUUtilization metrik, yang melaporkan persentase penggunaan pada inti OSS mesin Redis. Untuk melihat apakah metrik ini tersedia di node Anda dan untuk informasi selengkapnya, lihat Metrik untuk Valkey dan Redis. OSS

Untuk informasi selengkapnya, lihat CPUsbagian di Memantau praktik terbaik dengan Amazon ElastiCache (RedisOSS) menggunakan Amazon CloudWatch.

SwapUsage (Valkey dan Redis) OSS

Ini adalah metrik tingkat host yang dilaporkan dalam byte. Untuk informasi selengkapnya, lihat Metrik Tingkat Host.

FreeableMemory CloudWatch Metrik yang mendekati 0 (yaitu, di bawah 100MB) atau SwapUsage metrik lebih besar dari FreeableMemory metrik menunjukkan node berada di bawah tekanan memori. Jika tidak, lihat topik berikut:

Evictions

Ini adalah metrik mesin cache. Sebaiknya tentukan ambang batas alarm Anda sendiri untuk metrik ini berdasarkan kebutuhan aplikasi Anda.

Jika Anda menggunakan Memcached dan melebihi ambang batas yang Anda pilih, tingkatkan skala cluster Anda dengan menggunakan tipe node yang lebih besar atau skala dengan menambahkan lebih banyak node.

CurrConnections

Ini adalah metrik mesin cache. Sebaiknya tentukan ambang batas alarm Anda sendiri untuk metrik ini berdasarkan kebutuhan aplikasi Anda.

Peningkatan jumlah CurrConnectionsmungkin menunjukkan masalah dengan aplikasi Anda; Anda perlu menyelidiki perilaku aplikasi untuk mengatasi masalah ini.

Untuk informasi selengkapnya, lihat bagian Koneksi di Memantau praktik terbaik dengan Amazon ElastiCache (RedisOSS) menggunakan Amazon CloudWatch.

Memori (Valkey dan Redis) OSS

Memori adalah aspek inti dari Valkey dan OSS Redis. Memahami pemanfaatan memori dari klaster Anda diperlukan untuk menghindari kehilangan data dan mengakomodasi pertumbuhan set data Anda pada masa mendatang. Statistik tentang pemanfaatan memori node tersedia di bagian memori INFOperintah.

Untuk informasi selengkapnya, lihat bagian Memori di Memantau praktik terbaik dengan Amazon ElastiCache (RedisOSS) menggunakan Amazon CloudWatch.

Jaringan

Salah satu faktor penentu untuk kapasitas bandwidth jaringan dari klaster Anda adalah jenis simpul yang telah Anda pilih. Untuk informasi selengkapnya tentang kapasitas jaringan node Anda, lihat ElastiCache harga Amazon.

Untuk informasi selengkapnya, lihat bagian Jaringan di Memantau praktik terbaik dengan Amazon ElastiCache (RedisOSS) menggunakan Amazon CloudWatch.

Latensi

Anda dapat mengukur latensi perintah dengan satu set CloudWatch metrik yang menyediakan latensi agregat per struktur data. Metrik latensi ini dihitung menggunakan commandstats statistik dari perintah INFOValkey.

Untuk informasi selengkapnya, lihat bagian Latensi di Memantau praktik terbaik dengan Amazon ElastiCache menggunakan Amazon CloudWatch.

Replikasi

Volume data yang direplikasi akan terlihat melalui metrik ReplicationBytes. Metrik ini tidak memberikan wawasan tentang kondisi replikasi, meskipun merepresentasikan beban tulis pada grup replikasi. Untuk tujuan ini, Anda dapat menggunakan metrik ReplicationLag.

Untuk informasi selengkapnya, lihat bagian Replikasi di Memantau praktik terbaik dengan Amazon ElastiCache (RedisOSS) menggunakan Amazon. CloudWatch

Manajemen Lalu Lintas (Valkey dan Redis) OSS

ElastiCache (RedisOSS) secara otomatis mengelola lalu lintas terhadap node ketika lebih banyak perintah yang masuk dikirim ke node daripada yang dapat diproses oleh Valkey atau Redis. OSS Hal ini dilakukan untuk menjaga operasi dan stabilitas mesin yang optimal.

Ketika lalu lintas dikelola secara aktif pada simpul, metrik TrafficManagementActive akan memancarkan titik data 1. Hal ini menunjukkan bahwa simpul mungkin kurang diskalakan untuk beban kerja yang disediakan. Jika metrik ini tetap 1 untuk jangka waktu yang lama, evaluasi klaster untuk memutuskan apakah penaikan skala atau penskalaan ke luar diperlukan.

Untuk informasi selengkapnya, lihat metrik TrafficManagementActive di halaman Metrik.