Pemantauan produksi - Amazon DynamoDB

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Pemantauan produksi

Anda harus menetapkan acuan untuk performa DAX normal di lingkungan Anda dengan mengukur performa di berbagai waktu dan dalam kondisi beban yang berbeda. Saat memantau DAX, Anda harus mempertimbangkan untuk menyimpan data pemantauan historis. Data yang disimpan ini memberi Anda acuan untuk membandingkan data performa saat ini, mengidentifikasi pola performa normal dan anomali performa, serta merancang metode untuk mengatasi masalah.

Untuk menetapkan acuan, setidaknya Anda harus memantau item-item berikut baik saat pengujian beban dan saat produksi.

  • Pemanfaatan CPU dan permintaan yang dibatasi, sehingga Anda dapat menentukan apakah mungkin perlu menggunakan jenis simpul yang lebih besar di klaster Anda. Pemanfaatan CPU cluster Anda tersedia melalui CPUUtilization CloudWatch metrik. Statistik rata-rata pada metrik ini memberikan tampilan pemanfaatan CPU rata-rata di semua node di cluster Anda. Untuk keputusan penskalaan klaster, kami menyarankan Anda menggunakan stat maksimum yang merupakan pemanfaatan maksimum di semua node.

    catatan

    AWS telah meningkatkan granularitas CPUUtilization metrik. Anda mungkin mengamati perubahan metrik mulai dari 2024-05-17 hingga 2024-06-22.

  • Latensi operasi (seperti yang diukur pada sisi klien) harus tetap konsisten dalam persyaratan latensi aplikasi Anda.

  • Tingkat kesalahan harus tetap rendah, seperti yang terlihat dariErrorRequestCount,FaultRequestCount, dan FailedRequestCount CloudWatch metrik.

  • Konsumsi byte jaringan, sehingga Anda dapat menentukan apakah Anda harus menggunakan lebih banyak node atau tipe node yang lebih besar di cluster Anda. Untuk memantau konsumsi, Anda dapat mengatur peringatan BaselineNetworkBytesInUtilization dan BaselineNetworkBytesOutUtilization metrik yang tersedia CloudWatch, yang menunjukkan persentase konsumsi bandwidth jaringan yang tersedia untuk jenis instans Anda, masing-masing untuk lalu lintas masuk dan keluar.

  • Pemanfaatan memori cache dan ukuran yang dikosongkan, sehingga Anda dapat menentukan apakah jenis simpul klaster memiliki cukup memori untuk menahan set pekerjaan, dan jika tidak, alihkan ke jenis simpul yang lebih besar.

    catatan

    Jika ada sejumlah besar cache miss dan penulisan cache, pemanfaatan memori cache dapat meningkat hingga 100% dan dapat menyebabkan waktu henti ketersediaan.

  • Koneksi klien, sehingga Anda dapat memantau setiap lonjakan yang tidak bisa dijelaskan dalam koneksi ke klaster.