Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Anda dapat menggunakan https://console.aws.amazon.com/cloudwatch/ReplicationLatency
,MessageLag
, dan ReplicatorThroughput
pada tingkat topik dan agregat untuk setiap Replikator MSK Amazon. Metrik terlihat di bawah ReplicatorNamedi namespace “AWS/Kafka”. Anda juga dapat melihatReplicatorFailure
, AuthError
dan ThrottleTime
metrik untuk memeriksa masalah.
Konsol MSK menampilkan subset CloudWatch metrik untuk setiap Replikator MSK. Dari daftar Replicator konsol, pilih nama Replicator dan pilih tab Monitoring.
Metrik Replikator MSK
Metrik berikut menjelaskan metrik kinerja atau koneksi untuk Replikator MSK.
AuthError metrik tidak mencakup kesalahan autentikasi tingkat topik. Untuk memantau kesalahan autentikasi tingkat topik MSK Replicator Anda, pantau metrik Replicator dan ReplicationLatency metrik tingkat topik cluster sumber,. MessagesInPerSec Jika topik ReplicationLatency turun ke 0 tetapi topik masih memiliki data yang diproduksi untuk itu, ini menunjukkan bahwa Replicator memiliki masalah Auth dengan topik tersebut. Periksa apakah peran IAM eksekusi layanan Replicator memiliki izin yang cukup untuk mengakses topik.
Jenis metrik | Metrik | Deskripsi | Dimensi | Unit | Granularitas Metrik Mentah | Stat Agregasi Metrik Mentah |
---|---|---|---|---|---|---|
Kinerja | ReplicationLatency | Waktu yang dibutuhkan catatan untuk mereplikasi dari sumber ke cluster target; durasi antara waktu produksi rekaman di sumber dan direplikasi ke target. Jika ReplicationLatency meningkat, periksa apakah cluster memiliki partisi yang cukup untuk mendukung replikasi. Latensi replikasi tinggi dapat terjadi ketika jumlah partisi terlalu rendah untuk throughput tinggi. | ReplicatorName | Milidetik | Partition | Maksimum |
ReplicatorName, Topik | Milidetik | Partition | Maksimum | |||
Kinerja | MessageLag | Memantau sinkronisasi antara MSK Replicator dan cluster sumber. MessageLag menunjukkan jeda antara pesan yang dihasilkan ke cluster sumber dan pesan yang dikonsumsi oleh replikator. Ini bukan jeda antara cluster sumber dan target. Bahkan jika cluster sumber tidak tersedia/terputus, replikator akan selesai menulis pesan yang telah dikonsumsi ke cluster target. Setelah pemadaman, MessageLag menunjukkan peningkatan yang menunjukkan jumlah pesan replikator berada di belakang cluster sumber dan ini dapat dipantau hingga jumlah pesan 0, menunjukkan bahwa replikator telah menyusul cluster sumber. | ReplicatorName | Hitung | Partition | Jumlah |
ReplicatorName, Topik | Hitung | Partition | Jumlah | |||
Kinerja | ReplicatorBytesInPerSec | Jumlah rata-rata byte yang diproses oleh replikator per detik. Data yang diproses oleh MSK Replicator terdiri dari semua data yang diterima MSK Replicator yang mencakup data yang direplikasi ke cluster target dan data yang disaring oleh MSK Replicator (hanya jika Replicator Anda dikonfigurasi dengan konfigurasi nama topik yang identik) untuk mencegah data disalin kembali ke topik yang sama asalnya. Jika Replicator Anda dikonfigurasi dengan konfigurasi nama topik “Awalan”, keduanya ReplicatorBytesInPerSec dan ReplicatorThroughput metrik akan memiliki nilai yang sama karena tidak ada data yang akan difilter oleh MSK Replicator. |
ReplicatorName | BytesPerSecond | ReplicatorName | Jumlah |
Kinerja | ReplicatorThroughput | Rata-rata jumlah byte direplikasi per detik. Jika ReplicatorThroughput turun untuk topik, periksa KafkaClusterPingSuccessCount dan AuthError metrik untuk memastikan Replicator dapat berkomunikasi dengan cluster, lalu periksa metrik klaster untuk memastikan klaster tidak down. | ReplicatorName | BytesPerSecond | Partition | Jumlah |
ReplicatorName, Topik | BytesPerSecond | Partition | Jumlah | |||
Debug | AuthError | Jumlah koneksi dengan otentikasi gagal per detik. Jika metrik ini di atas 0, Anda dapat memeriksa apakah kebijakan peran eksekusi layanan untuk replikator valid dan pastikan tidak ada izin penolakan yang ditetapkan untuk izin cluster. Berdasarkan dimensi ClusterAlias, Anda dapat mengidentifikasi apakah sumber atau kluster target mengalami kesalahan autentikasi. | ReplicatorName, ClusterAlias | Hitung | Pekerja | Jumlah |
Debug | ThrottleTime | Waktu rata-rata dalam ms permintaan dibatasi oleh broker di cluster. Atur throttling untuk menghindari MSK Replicator membanjiri cluster. Jika metrik ini 0, ReplicationLatency tidak tinggi, dan ReplicatorThroughput seperti yang diharapkan, maka throttling berfungsi seperti yang diharapkan. Jika metrik ini di atas 0, Anda dapat menyesuaikan pelambatan yang sesuai. | ReplicatorName, ClusterAlias | Milidetik | Pekerja | Maksimum |
Debug | ReplicatorFailure | Jumlah kegagalan yang dialami replikator. | ReplicatorName | Hitung | Jumlah | |
Debug | KafkaClusterPingSuccessCount |
Menunjukkan kesehatan koneksi replikator ke cluster kafka. Jika nilai ini 1, koneksi sehat. Jika nilainya 0 atau tidak ada titik data, koneksi tidak sehat. Jika nilainya 0, Anda dapat memeriksa pengaturan izin jaringan atau IAM untuk cluster Kafka. Berdasarkan ClusterAlias dimensi, Anda dapat mengidentifikasi apakah metrik ini untuk sumber atau cluster target. |
ReplicatorName, ClusterAlias | Hitung | Jumlah |