Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Pemantauan produksi
Anda harus menetapkan dasar untuk DAX kinerja normal di lingkungan Anda, dengan mengukur kinerja pada berbagai waktu dan dalam kondisi beban yang berbeda. Saat Anda memantauDAX, Anda harus mempertimbangkan untuk menyimpan data pemantauan historis. Data yang disimpan ini memberi Anda acuan untuk membandingkan data performa saat ini, mengidentifikasi pola performa normal dan anomali performa, serta merancang metode untuk mengatasi masalah.
Untuk menetapkan acuan, setidaknya Anda harus memantau item-item berikut baik saat pengujian beban dan saat produksi.
-
CPUpemanfaatan dan permintaan terbatas, sehingga Anda dapat menentukan apakah Anda mungkin perlu menggunakan tipe node yang lebih besar di cluster Anda. CPUPemanfaatan cluster Anda tersedia melalui
CPUUtilization
CloudWatch metrik. Statistik rata-rata pada metrik ini memberikan tampilan CPU pemanfaatan rata-rata di semua node di cluster Anda. Untuk keputusan penskalaan klaster, kami menyarankan Anda menggunakan stat maksimum yang merupakan pemanfaatan maksimum di semua node.catatan
AWS telah meningkatkan granularitas
CPUUtilization
metrik. Anda mungkin mengamati perubahan metrik mulai dari 2024-05-17 hingga 2024-06-22. -
Latensi operasi (seperti yang diukur pada sisi klien) harus tetap konsisten dalam persyaratan latensi aplikasi Anda.
-
Tingkat kesalahan harus tetap rendah, seperti yang terlihat dari
ErrorRequestCount
,FaultRequestCount
, danFailedRequestCount
CloudWatch metrik. -
Konsumsi byte jaringan, sehingga Anda dapat menentukan apakah Anda harus menggunakan lebih banyak node atau tipe node yang lebih besar di cluster Anda. Untuk memantau konsumsi, Anda dapat mengatur peringatan
BaselineNetworkBytesInUtilization
danBaselineNetworkBytesOutUtilization
metrik yang tersedia CloudWatch, yang menunjukkan persentase konsumsi bandwidth jaringan yang tersedia untuk jenis instans Anda, masing-masing untuk lalu lintas masuk dan keluar. -
Pemanfaatan memori cache dan ukuran yang dikosongkan, sehingga Anda dapat menentukan apakah jenis simpul klaster memiliki cukup memori untuk menahan set pekerjaan, dan jika tidak, alihkan ke jenis simpul yang lebih besar.
catatan
Jika ada sejumlah besar cache miss dan penulisan cache, pemanfaatan memori cache dapat meningkat hingga 100% dan dapat menyebabkan waktu henti ketersediaan.
-
Koneksi klien, sehingga Anda dapat memantau setiap lonjakan yang tidak bisa dijelaskan dalam koneksi ke klaster.