

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

# Memantau klaster Amazon MSK Provisioned
<a name="monitoring"></a>

Ada beberapa cara Amazon MSK membantu Anda memantau status klaster Amazon MSK Provisioned Anda.
+ Amazon MSK mengumpulkan metrik Apache Kafka dan mengirimkannya ke Amazon CloudWatch di mana Anda dapat melihatnya. Untuk informasi selengkapnya tentang metrik Apache Kafka, termasuk metrik yang ditampilkan MSK Amazon, lihat [Pemantauan](http://kafka.apache.org/documentation/#monitoring) dalam dokumentasi Apache Kafka.
+ Anda juga dapat memantau kluster MSK Anda dengan Prometheus, aplikasi pemantauan sumber terbuka. Untuk informasi tentang Prometheus, lihat [Ikhtisar](https://prometheus.io/docs/introduction/overview/) di dokumentasi Prometheus. Untuk mempelajari cara memantau cluster MSK Provisioned Anda dengan Prometheus, lihat. [Memantau klaster MSK Provisioned dengan Prometheus](open-monitoring.md)
+ (Hanya pialang standar) Amazon MSK membantu Anda memantau kapasitas penyimpanan disk Anda dengan secara otomatis mengirimkan peringatan kapasitas penyimpanan kepada Anda saat klaster yang disediakan akan mencapai batas kapasitas penyimpanannya. Peringatan juga memberikan rekomendasi tentang langkah-langkah terbaik yang harus diambil untuk mengatasi masalah yang terdeteksi. Ini membantu Anda mengidentifikasi dan menyelesaikan masalah kapasitas disk dengan cepat sebelum menjadi kritis. Amazon MSK secara otomatis mengirimkan peringatan ini ke [konsol MSK Amazon](https://console.aws.amazon.com/msk/home?region=us-east-1#/home/), Dasbor Health Amazon EventBridge, dan kontak email untuk akun Anda. AWS Untuk informasi tentang peringatan kapasitas penyimpanan, lihat[Gunakan peringatan kapasitas penyimpanan MSK Amazon](cluster-alerts.md).

**Topics**
+ [Lihat metrik MSK Amazon menggunakan CloudWatch](cloudwatch-metrics.md)
+ [Metrik MSK Amazon untuk memantau pialang Standar dengan CloudWatch](metrics-details.md)
+ [Metrik MSK Amazon untuk memantau broker Express dengan CloudWatch](metrics-details-express.md)
+ [Memantau klaster MSK Provisioned dengan Prometheus](open-monitoring.md)
+ [Pantau kelambatan konsumen](consumer-lag.md)
+ [Gunakan peringatan kapasitas penyimpanan MSK Amazon](cluster-alerts.md)

# Lihat metrik MSK Amazon menggunakan CloudWatch
<a name="cloudwatch-metrics"></a>

Anda dapat memantau metrik untuk Amazon MSK menggunakan CloudWatch konsol, baris perintah, atau API. CloudWatch Prosedur berikut menunjukkan cara mengakses metrik menggunakan berbagai metode ini. 

**Untuk mengakses metrik menggunakan konsol CloudWatch**

Masuk ke Konsol Manajemen AWS dan buka CloudWatch konsol di [https://console.aws.amazon.com/cloudwatch/](https://console.aws.amazon.com/cloudwatch/).

1. Pada panel navigasi, silakan pilih **Metrik**.

1. Pilih tab **Semua metrik**, lalu pilih **AWS/Kafka**.

1. **Untuk melihat metrik tingkat **topik, pilih Topik, ID Broker, Nama Cluster; untuk metrik tingkat broker, pilih ID Broker, Nama Cluster****; dan untuk metrik tingkat cluster, pilih Nama Kluster**.**

1. (Opsional) Di panel grafik, pilih statistik dan periode waktu, lalu buat CloudWatch alarm menggunakan pengaturan ini.

**Untuk mengakses metrik menggunakan AWS CLI**  
Gunakan [daftar-metrik](https://docs.aws.amazon.com/cli/latest/reference/cloudwatch/list-metrics.html) dan perintah. [get-metric-statistics](https://docs.aws.amazon.com/cli/latest/reference/cloudwatch/get-metric-statistics.html)

**Untuk mengakses metrik menggunakan CLI CloudWatch**  
Gunakan [mon-list-metrics](https://docs.aws.amazon.com/AmazonCloudWatch/latest/cli/cli-mon-list-metrics.html)dan [mon-get-stats](https://docs.aws.amazon.com/AmazonCloudWatch/latest/cli/cli-mon-get-stats.html)perintah.

**Untuk mengakses metrik menggunakan API CloudWatch**  
Gunakan [ListMetrics](https://docs.aws.amazon.com/AmazonCloudWatch/latest/APIReference/API_ListMetrics.html)dan [GetMetricStatistics](https://docs.aws.amazon.com/AmazonCloudWatch/latest/APIReference/API_GetMetricStatistics.html)operasi.

# Metrik MSK Amazon untuk memantau pialang Standar dengan CloudWatch
<a name="metrics-details"></a>

Amazon MSK terintegrasi dengan Amazon CloudWatch sehingga Anda dapat mengumpulkan, melihat, dan menganalisis CloudWatch metrik untuk broker Standar MSK Anda. Metrik yang Anda konfigurasikan untuk kluster MSK Provisioned secara otomatis dikumpulkan dan didorong ke CloudWatch interval 1 menit. Anda dapat mengatur tingkat pemantauan untuk klaster MSK Provisioned ke salah satu dari berikut ini:`DEFAULT`,,`PER_BROKER`, `PER_TOPIC_PER_BROKER` atau. `PER_TOPIC_PER_PARTITION` Tabel di bagian berikut menunjukkan semua metrik yang tersedia mulai dari setiap tingkat pemantauan.

**catatan**  
Nama-nama beberapa metrik MSK Amazon untuk CloudWatch pemantauan telah berubah di versi 3.6.0 dan lebih tinggi. Gunakan nama baru untuk memantau metrik ini. Untuk metrik dengan nama yang diubah, tabel di bawah ini menunjukkan nama yang digunakan dalam versi 3.6.0 dan yang lebih tinggi, diikuti dengan nama di versi 2.8.2.tiered.

`DEFAULT`Metrik -level gratis. Harga untuk metrik lainnya dijelaskan di halaman [ CloudWatchharga Amazon](https://aws.amazon.com/cloudwatch/pricing/).

## `DEFAULT`Pemantauan tingkat
<a name="default-metrics"></a>

Metrik yang dijelaskan dalam tabel berikut tersedia di tingkat `DEFAULT` pemantauan. Mereka bebas.


| Nama | Saat terlihat | Dimensi | Deskripsi | 
| --- | --- | --- | --- | 
| ActiveControllerCount | Setelah cluster sampai ke status ACTIVE. | Nama Klaster | Hanya satu pengontrol per cluster yang harus aktif pada waktu tertentu. | 
| BurstBalance |  Setelah cluster sampai ke status ACTIVE.  |  Nama Cluster, ID Pialang  |  Saldo yang tersisa dari kredit burst input-output untuk volume EBS di cluster. Gunakan untuk menyelidiki latensi atau penurunan throughput. `BurstBalance`tidak dilaporkan untuk volume EBS ketika kinerja dasar volume lebih tinggi dari kinerja burst maksimum. Untuk informasi selengkapnya, lihat [Kredit I/O dan kinerja burst](https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/ebs-volume-types.html#IOcredit).  | 
| BytesInPerSec | Setelah Anda membuat topik. | Nama Cluster, ID Pialang, Topik | Jumlah byte per detik yang diterima dari klien. Metrik ini tersedia per broker dan juga per topik. | 
| BytesOutPerSec | Setelah Anda membuat topik. | Nama Cluster, ID Pialang, Topik | Jumlah byte per detik dikirim ke klien. Metrik ini tersedia per broker dan juga per topik. | 
| ClientConnectionCount | Setelah cluster sampai ke status ACTIVE. | Nama Cluster, ID Broker, Otentikasi Klien | Jumlah koneksi klien yang diautentikasi aktif. | 
| ConnectionCount | Setelah cluster sampai ke status ACTIVE. |  Nama Klaster, ID Broker  | Jumlah koneksi aktif yang diautentikasi, tidak diautentikasi, dan antar-broker.  | 
| CPUCreditBalance  |  Setelah cluster sampai ke status ACTIVE.  |  Nama Klaster, ID Broker  |  Jumlah kredit CPU yang diperoleh yang diperoleh broker sejak diluncurkan. Kredit diakumulasi ke saldo kredit setelah diperoleh, dan dihapus dari saldo kredit saat digunakan. Jika Anda kehabisan saldo kredit CPU, itu dapat berdampak negatif pada kinerja cluster Anda. Anda dapat mengambil langkah-langkah untuk mengurangi beban CPU. Misalnya, Anda dapat mengurangi jumlah permintaan klien atau memperbarui jenis broker ke jenis broker M5.  | 
| CpuIdle | Setelah cluster sampai ke status ACTIVE. | Nama Klaster, ID Broker | Persentase waktu idle CPU. | 
| CpuIoWait | Setelah cluster sampai ke status ACTIVE. | Nama Klaster, ID Broker | Persentase waktu idle CPU selama operasi disk yang tertunda. | 
| CpuSystem | Setelah cluster sampai ke status ACTIVE. | Nama Klaster, ID Broker | Persentase CPU di ruang kernel. | 
| CpuUser | Setelah cluster sampai ke status ACTIVE. | Nama Klaster, ID Broker | Persentase CPU di ruang pengguna. | 
| GlobalPartitionCount | Setelah cluster sampai ke status ACTIVE. | Nama Klaster | Jumlah partisi di semua topik di cluster, tidak termasuk replika. Karena GlobalPartitionCount tidak termasuk replika, jumlah PartitionCount nilai bisa lebih tinggi daripada GlobalPartitionCount jika faktor replikasi untuk suatu topik lebih besar dari 1. | 
| GlobalTopicCount | Setelah cluster sampai ke status ACTIVE. | Nama Klaster | Jumlah total topik di semua broker di cluster. | 
| EstimatedMaxTimeLag\$1 | Setelah kelompok konsumen mengkonsumsi dari suatu topik. | Nama Cluster, Grup Konsumen, Topik | Perkiraan waktu (dalam detik) untuk mengurasMaxOffsetLag. | 
| KafkaAppLogsDiskUsed | Setelah cluster sampai ke status ACTIVE. | Nama Klaster, ID Broker | Persentase ruang disk yang digunakan untuk log aplikasi. | 
| KafkaDataLogsDiskUsed(Cluster Name, Broker IDdimensi) | Setelah cluster sampai ke status ACTIVE. | Nama Klaster, ID Broker | Persentase ruang disk yang digunakan untuk log data. | 
| LeaderCount | Setelah cluster sampai ke status ACTIVE. | Nama Klaster, ID Broker | Jumlah total pemimpin partisi per broker, tidak termasuk replika. | 
| MaxOffsetLag\$1 | Setelah kelompok konsumen mengkonsumsi dari suatu topik. | Nama Cluster, Grup Konsumen, Topik | Keterlambatan offset maksimum di semua partisi dalam suatu topik. | 
| MemoryBuffered | Setelah cluster sampai ke status ACTIVE. | Nama Klaster, ID Broker | Ukuran dalam byte memori buffer untuk broker. | 
| MemoryCached | Setelah cluster sampai ke status ACTIVE. | Nama Klaster, ID Broker | Ukuran dalam byte memori cache untuk broker. | 
| MemoryFree | Setelah cluster sampai ke status ACTIVE. | Nama Klaster, ID Broker | Ukuran dalam byte memori yang gratis dan tersedia untuk broker. | 
| HeapMemoryAfterGC  |  Setelah cluster sampai ke status ACTIVE.  |  Nama Klaster, ID Broker  | Persentase total memori heap yang digunakan setelah pengumpulan sampah. | 
| MemoryUsed | Setelah cluster sampai ke status ACTIVE. | Nama Klaster, ID Broker | Ukuran dalam byte memori yang digunakan untuk broker. | 
| MessagesInPerSec | Setelah cluster sampai ke status ACTIVE. | Nama Klaster, ID Broker | Jumlah pesan masuk per detik untuk broker. | 
| NetworkRxDropped | Setelah cluster sampai ke status ACTIVE. | Nama Klaster, ID Broker | Jumlah paket penerima yang dijatuhkan. | 
| NetworkRxErrors | Setelah cluster sampai ke status ACTIVE. | Nama Klaster, ID Broker | Jumlah jaringan menerima kesalahan untuk broker. | 
| NetworkRxPackets | Setelah cluster sampai ke status ACTIVE. | Nama Klaster, ID Broker | Jumlah paket yang diterima oleh broker. | 
| NetworkTxDropped | Setelah cluster sampai ke status ACTIVE. | Nama Klaster, ID Broker | Jumlah paket pengiriman yang dijatuhkan. | 
| NetworkTxErrors | Setelah cluster sampai ke status ACTIVE. | Nama Klaster, ID Broker | Jumlah kesalahan transmisi jaringan untuk broker. | 
| NetworkTxPackets | Setelah cluster sampai ke status ACTIVE. | Nama Klaster, ID Broker | Jumlah paket yang dikirimkan oleh broker. | 
| OfflinePartitionsCount | Setelah cluster sampai ke status ACTIVE. | Nama Klaster | Jumlah total partisi yang offline di cluster. | 
| PartitionCount | Setelah cluster sampai ke status ACTIVE. | Nama Klaster, ID Broker | Jumlah total partisi topik per broker, termasuk replika. | 
| ProduceTotalTimeMsMean | Setelah cluster sampai ke status ACTIVE. | Nama Klaster, ID Broker | Rata-rata menghasilkan waktu dalam milidetik. | 
| RequestBytesMean | Setelah cluster sampai ke status ACTIVE. | Nama Klaster, ID Broker | Jumlah rata-rata byte permintaan untuk broker. | 
| RequestTime | Setelah permintaan throttling diterapkan. | Nama Klaster, ID Broker | Rata-rata waktu dalam milidetik yang dihabiskan di jaringan broker dan utas I/O untuk memproses permintaan. | 
| RootDiskUsed | Setelah cluster sampai ke status ACTIVE. | Nama Klaster, ID Broker | Persentase disk root yang digunakan oleh broker. | 
| RollingEstimatedTimeLagMax\$1 | Setelah kelompok konsumen mengkonsumsi dari suatu topik. | Nama Cluster, Grup Konsumen, Topik | Perkiraan waktu maksimum bergulir (dalam detik) untuk menguras lag offset partisi di semua partisi dalam suatu topik. | 
| SumOffsetLag\$1 | Setelah kelompok konsumen mengkonsumsi dari suatu topik. | Nama Cluster, Grup Konsumen, Topik | Kelambatan offset agregat untuk semua partisi dalam suatu topik. | 
| SwapFree | Setelah cluster sampai ke status ACTIVE. | Nama Klaster, ID Broker | Ukuran dalam byte memori swap yang tersedia untuk broker. | 
| SwapUsed  | Setelah cluster sampai ke status ACTIVE. | Nama Klaster, ID Broker | Ukuran dalam byte memori swap yang digunakan untuk broker. | 
| TrafficShaping  |  Setelah cluster sampai ke status ACTIVE.  |  Nama Klaster, ID Broker  |  Metrik tingkat tinggi menunjukkan jumlah paket yang dibentuk (jatuh atau antri) karena melebihi alokasi jaringan. Detail yang lebih halus tersedia dengan metrik PER\$1BROKER.  | 
| UnderMinIsrPartitionCount | Setelah cluster sampai ke status ACTIVE. | Nama Klaster, ID Broker | Jumlah partisi miniSR di bawah untuk broker. | 
| UnderReplicatedPartitions | Setelah cluster sampai ke status ACTIVE. | Nama Klaster, ID Broker | Jumlah partisi yang kurang direplikasi untuk broker. | 
| UserPartitionExists | Setelah cluster sampai ke status ACTIVE. | Nama Klaster, ID Broker | Metrik Boolean yang menunjukkan adanya partisi milik pengguna pada broker. Nilai 1 menunjukkan adanya partisi pada broker. | 
| ZooKeeperRequestLatencyMsMean  | Setelah cluster sampai ke status ACTIVE. | Nama Klaster, ID Broker | Untuk cluster ZooKeeper berbasis. Latensi rata-rata dalam milidetik untuk ZooKeeper permintaan Apache dari broker. | 
| ZooKeeperSessionState | Setelah cluster sampai ke status ACTIVE. | Nama Klaster, ID Broker | Untuk cluster ZooKeeper berbasis. Status koneksi ZooKeeper sesi broker yang mungkin salah satu dari yang berikut: NOT\$1CONNECTED: '0.0', ASSOCIATING: '0.1', CONNECTING: '0.5', CONNECTEDREADONLY: '0.8', CONNECTED: '1.0', CLOSED: '5.0', AUTH\$1FAILED: '10.0'. | 

\$1 Metrik lag konsumen memerlukan nama grup konsumen khusus ASCII dan memiliki persyaratan emisi khusus. Untuk informasi selengkapnya, lihat [Pantau kelambatan konsumen](consumer-lag.md).

## `PER_BROKER`Pemantauan tingkat
<a name="broker-metrics"></a>

Saat Anda menyetel level pemantauan`PER_BROKER`, Anda mendapatkan metrik yang dijelaskan dalam tabel berikut selain semua metrik `DEFAULT` level. Anda membayar metrik dalam tabel berikut, sedangkan metrik `DEFAULT` level tetap gratis. Metrik dalam tabel ini memiliki dimensi sebagai berikut: Nama Cluster, ID Broker.


| Nama | Saat terlihat | Deskripsi | 
| --- | --- | --- | 
| BwInAllowanceExceeded | Setelah cluster sampai ke status ACTIVE. |  Jumlah paket yang dibentuk karena bandwidth agregat inbound melebihi maksimum untuk broker.  | 
| BwOutAllowanceExceeded | Setelah cluster sampai ke status ACTIVE. |  Jumlah paket yang dibentuk karena bandwidth agregat outbound melebihi maksimum untuk broker.  | 
| ConntrackAllowanceExceeded  | Setelah cluster sampai ke status ACTIVE. |  Jumlah paket yang dibentuk karena koneksi tracking melebihi maksimum untuk broker. Pelacakan koneksi terkait dengan grup keamanan yang melacak setiap koneksi yang dibuat untuk memastikan bahwa paket pengembalian dikirim seperti yang diharapkan.   | 
| ConnectionCloseRate | Setelah cluster sampai ke status ACTIVE. |  Jumlah koneksi ditutup per detik per pendengar. Jumlah ini dikumpulkan per pendengar dan disaring untuk pendengar klien.  | 
| ConnectionCreationRate | Setelah cluster sampai ke status ACTIVE. |  Jumlah koneksi baru yang dibuat per detik per pendengar. Jumlah ini dikumpulkan per pendengar dan disaring untuk pendengar klien.  | 
| CpuCreditUsage | Setelah cluster sampai ke status ACTIVE. |  Jumlah kredit CPU yang dihabiskan oleh broker. Jika Anda kehabisan saldo kredit CPU, itu dapat berdampak negatif pada kinerja cluter Anda. Anda dapat mengambil langkah-langkah untuk mengurangi beban CPU. Misalnya, Anda dapat mengurangi jumlah permintaan klien atau memperbarui jenis broker ke jenis broker M5.  | 
| FetchConsumerLocalTimeMsMean | Setelah ada produsen/konsumen. | Waktu rata-rata dalam milidetik bahwa permintaan konsumen diproses pada pemimpin. | 
| FetchConsumerRequestQueueTimeMsMean | Setelah ada produsen/konsumen. | Waktu rata-rata dalam milidetik permintaan konsumen menunggu dalam antrian permintaan. | 
| FetchConsumerResponseQueueTimeMsMean | Setelah ada produsen/konsumen. | Waktu rata-rata dalam milidetik permintaan konsumen menunggu dalam antrian respons. | 
| FetchConsumerResponseSendTimeMsMean | Setelah ada produsen/konsumen. | Waktu rata-rata dalam milidetik bagi konsumen untuk mengirim respons. | 
| FetchConsumerTotalTimeMsMean | Setelah ada produsen/konsumen. | Total waktu rata-rata dalam milidetik yang dihabiskan konsumen untuk mengambil data dari broker. | 
| FetchFollowerLocalTimeMsMean | Setelah ada produsen/konsumen. | Waktu rata-rata dalam milidetik permintaan pengikut diproses di pemimpin. | 
| FetchFollowerRequestQueueTimeMsMean | Setelah ada produsen/konsumen. | Waktu rata-rata dalam milidetik permintaan pengikut menunggu dalam antrian permintaan. | 
| FetchFollowerResponseQueueTimeMsMean | Setelah ada produsen/konsumen. | Waktu rata-rata dalam milidetik permintaan pengikut menunggu dalam antrian respons. | 
| FetchFollowerResponseSendTimeMsMean | Setelah ada produsen/konsumen. | Waktu rata-rata dalam milidetik bagi pengikut untuk mengirim respons. | 
| FetchFollowerTotalTimeMsMean | Setelah ada produsen/konsumen. | Total waktu rata-rata dalam milidetik yang dihabiskan pengikut untuk mengambil data dari broker. | 
| FetchMessageConversionsPerSec | Setelah Anda membuat topik. | Jumlah konversi pesan ambil per detik untuk broker. | 
| FetchThrottleByteRate | Setelah pembatasan bandwidth diterapkan. | Jumlah byte yang dibatasi per detik. | 
| FetchThrottleQueueSize | Setelah pembatasan bandwidth diterapkan. | Jumlah pesan dalam antrian throttle. | 
| FetchThrottleTime | Setelah pembatasan bandwidth diterapkan. | Rata-rata waktu fetch throttle dalam milidetik. | 
| IAMNumberOfConnectionRequests | Setelah cluster sampai ke status ACTIVE. | Jumlah permintaan otentikasi IAM per detik. | 
| IAMTooManyConnections | Setelah cluster sampai ke status ACTIVE. | Jumlah koneksi yang dicoba melebihi 100. 0 berarti jumlah koneksi berada dalam batas. Jika >0, batas throttle terlampaui dan Anda perlu mengurangi jumlah koneksi. | 
| LinklocalAllowanceExceeded  | Setelah cluster sampai ke status ACTIVE. |  Jumlah paket turun karena PPS lalu lintas ke layanan proksi lokal melebihi batas maksimum untuk antarmuka jaringan. Hal ini berdampak lalu lintas ke layanan DNS, Layanan Metadata Instans, dan Layanan Amazon Time Sync.  | 
| NetworkProcessorAvgIdlePercent | Setelah cluster sampai ke status ACTIVE. | Persentase rata-rata waktu prosesor jaringan menganggur. | 
| PpsAllowanceExceeded | Setelah cluster sampai ke status ACTIVE. |  Jumlah paket yang dibentuk karena PPS dua arah melebihi maksimum untuk broker.  | 
| ProduceLocalTimeMsMean | Setelah cluster sampai ke status ACTIVE. | Waktu rata-rata dalam milidetik permintaan diproses di pemimpin. | 
| ProduceMessageConversionsPerSec | Setelah Anda membuat topik. | Jumlah konversi pesan produksi per detik untuk broker. | 
| ProduceMessageConversionsTimeMsMean | Setelah cluster sampai ke status ACTIVE. | Waktu rata-rata dalam milidetik dihabiskan untuk konversi format pesan. | 
| ProduceRequestQueueTimeMsMean | Setelah cluster sampai ke status ACTIVE. | Waktu rata-rata dalam milidetik yang digunakan pesan permintaan dalam antrian. | 
| ProduceResponseQueueTimeMsMean | Setelah cluster sampai ke status ACTIVE. | Waktu rata-rata dalam milidetik yang dihabiskan pesan respons dalam antrian. | 
| ProduceResponseSendTimeMsMean | Setelah cluster sampai ke status ACTIVE. | Waktu rata-rata dalam milidetik dihabiskan untuk mengirim pesan respons. | 
| ProduceThrottleByteRate | Setelah pembatasan bandwidth diterapkan. | Jumlah byte yang dibatasi per detik. | 
| ProduceThrottleQueueSize | Setelah pembatasan bandwidth diterapkan. | Jumlah pesan dalam antrian throttle. | 
| ProduceThrottleTime | Setelah pembatasan bandwidth diterapkan. | Rata-rata menghasilkan waktu throttle dalam milidetik. | 
| ProduceTotalTimeMsMean | Setelah cluster sampai ke status ACTIVE. | Rata-rata menghasilkan waktu dalam milidetik. | 
|  `RemoteFetchBytesPerSec (RemoteBytesInPerSec in v2.8.2.tiered)`  |  Setelah ada produsen/konsumen.  |  Jumlah total byte yang ditransfer dari penyimpanan berjenjang sebagai respons terhadap pengambilan konsumen. Metrik ini mencakup semua partisi topik yang berkontribusi pada lalu lintas transfer data hilir. Kategori: Lalu lintas dan tingkat kesalahan. Ini adalah metrik [KIP-405](https://cwiki.apache.org/confluence/display/KAFKA/KIP-405%3A+Kafka+Tiered+Storage).  | 
| RemoteCopyBytesPerSec (RemoteBytesOutPerSec in v2.8.2.tiered) |  Setelah ada produsen/konsumen.  |  Jumlah total byte yang ditransfer ke penyimpanan berjenjang, termasuk data dari segmen log, indeks, dan file tambahan lainnya. Metrik ini mencakup semua partisi topik yang berkontribusi pada lalu lintas transfer data hulu. Kategori: Lalu lintas dan tingkat kesalahan. Ini adalah metrik [KIP-405](https://cwiki.apache.org/confluence/display/KAFKA/KIP-405%3A+Kafka+Tiered+Storage).  | 
| RemoteLogManagerTasksAvgIdlePercent |  Setelah cluster sampai ke status ACTIVE.  | Persentase rata-rata waktu yang dihabiskan manajer log jarak jauh untuk menganggur. Manajer log jarak jauh mentransfer data dari broker ke penyimpanan berjenjang. Kategori: Aktivitas internal. Ini adalah metrik [KIP-405](https://cwiki.apache.org/confluence/display/KAFKA/KIP-405%3A+Kafka+Tiered+Storage). | 
| RemoteLogReaderAvgIdlePercent |  Setelah cluster sampai ke status ACTIVE.  | Persentase rata-rata waktu yang dihabiskan pembaca log jarak jauh untuk menganggur. Pembaca log jarak jauh mentransfer data dari penyimpanan jarak jauh ke broker sebagai respons terhadap pengambilan konsumen. Kategori: Aktivitas internal. Ini adalah metrik [KIP-405](https://cwiki.apache.org/confluence/display/KAFKA/KIP-405%3A+Kafka+Tiered+Storage). | 
| RemoteLogReaderTaskQueueSize |  Setelah cluster sampai ke status ACTIVE.  | Jumlah tugas yang bertanggung jawab untuk membaca dari penyimpanan berjenjang yang menunggu untuk dijadwalkan. Kategori: Aktivitas internal. Ini adalah metrik [KIP-405](https://cwiki.apache.org/confluence/display/KAFKA/KIP-405%3A+Kafka+Tiered+Storage). | 
| RemoteFetchErrorsPerSec (RemoteReadErrorPerSec in v2.8.2.tiered) |  Setelah cluster sampai ke status ACTIVE.  | Tingkat total kesalahan dalam menanggapi permintaan baca yang dikirim broker tertentu ke penyimpanan berjenjang untuk mengambil data sebagai respons terhadap pengambilan konsumen. Metrik ini mencakup semua partisi topik yang berkontribusi pada lalu lintas transfer data hilir. Kategori: lalu lintas dan tingkat kesalahan. Ini adalah metrik [KIP-405](https://cwiki.apache.org/confluence/display/KAFKA/KIP-405%3A+Kafka+Tiered+Storage). | 
| RemoteFetchRequestsPerSec (RemoteReadRequestsPerSec in v2.8.2.tiered) |  Setelah cluster sampai ke status ACTIVE.  | Jumlah total permintaan baca yang dikirimkan oleh broker ke penyimpanan berjenjang untuk mengambil data sebagai tanggapan terhadap pengambilan konsumen. Metrik ini mencakup semua partisi topik yang berkontribusi pada lalu lintas transfer data hilir. Kategori: lalu lintas dan tingkat kesalahan. Ini adalah metrik [KIP-405](https://cwiki.apache.org/confluence/display/KAFKA/KIP-405%3A+Kafka+Tiered+Storage). | 
| RemoteCopyErrorsPerSec (RemoteWriteErrorPerSec in v2.8.2.tiered) |  Setelah cluster sampai ke status ACTIVE.  | Tingkat total kesalahan dalam menanggapi permintaan penulisan yang dikirim oleh broker tertentu ke penyimpanan berjenjang untuk mentransfer data ke hulu. Metrik ini mencakup semua partisi topik yang berkontribusi pada lalu lintas transfer data hulu. Kategori: lalu lintas dan tingkat kesalahan. Ini adalah metrik [KIP-405](https://cwiki.apache.org/confluence/display/KAFKA/KIP-405%3A+Kafka+Tiered+Storage). | 
| RemoteLogSizeBytes | Setelah cluster sampai ke status ACTIVE. |  Jumlah byte yang disimpan di tingkat jarak jauh. Metrik ini tersedia untuk cluster penyimpanan berjenjang dari Apache Kafka versi 3.7.x di Amazon MSK.  | 
| ReplicationBytesInPerSec | Setelah Anda membuat topik. | Jumlah byte per detik yang diterima dari broker lain. | 
| ReplicationBytesOutPerSec | Setelah Anda membuat topik. | Jumlah byte per detik dikirim ke broker lain. | 
| RequestExemptFromThrottleTime | Setelah permintaan throttling diterapkan. | Rata-rata waktu dalam milidetik yang dihabiskan di jaringan broker dan utas I/O untuk memproses permintaan yang dibebaskan dari pembatasan. | 
| RequestHandlerAvgIdlePercent | Setelah cluster sampai ke status ACTIVE. | Persentase rata-rata waktu thread handler permintaan tidak digunakan. | 
| RequestThrottleQueueSize | Setelah permintaan throttling diterapkan. | Jumlah pesan dalam antrian throttle. | 
| RequestThrottleTime | Setelah permintaan throttling diterapkan. | Rata-rata waktu permintaan throttle dalam milidetik. | 
| TcpConnections | Setelah cluster sampai ke status ACTIVE. |  Menampilkan jumlah segmen TCP masuk dan keluar dengan set bendera SYN.  | 
| RemoteCopyLagBytes (TotalTierBytesLag in v2.8.2.tiered) | Setelah Anda membuat topik. | Jumlah total byte data yang memenuhi syarat untuk tiering pada broker tetapi belum ditransfer ke penyimpanan berjenjang. Metrik ini menunjukkan efisiensi transfer data hulu. Ketika lag meningkat, jumlah data yang tidak bertahan dalam penyimpanan berjenjang meningkat. Kategori: Arsip lag. Ini bukan metrik KIP-405. | 
| TrafficBytes | Setelah cluster sampai ke status ACTIVE. |  Menunjukkan lalu lintas jaringan dalam byte keseluruhan antara klien (produsen dan konsumen) dan broker. Lalu lintas antar broker tidak dilaporkan.  | 
| VolumeQueueLength | Setelah cluster sampai ke status ACTIVE. |  Jumlah permintaan operasi baca dan tulis yang menunggu untuk diselesaikan dalam jangka waktu tertentu.  | 
|  VolumeReadBytes  | Setelah cluster sampai ke status ACTIVE. |  Jumlah byte yang dibaca dalam periode waktu tertentu.  | 
| VolumeReadOps  | Setelah cluster sampai ke status ACTIVE. |  Jumlah operasi baca dalam periode waktu tertentu.  | 
| VolumeTotalReadTime  | Setelah cluster sampai ke status ACTIVE. |  Jumlah total detik yang dihabiskan oleh semua operasi baca yang diselesaikan dalam periode waktu tertentu.  | 
| VolumeTotalWriteTime  | Setelah cluster sampai ke status ACTIVE. |  Jumlah total detik yang dihabiskan oleh semua operasi penulisan yang diselesaikan dalam periode waktu tertentu.  | 
| VolumeWriteBytes  | Setelah cluster sampai ke status ACTIVE. |  Jumlah byte yang ditulis dalam periode waktu tertentu.  | 
| VolumeWriteOps  | Setelah cluster sampai ke status ACTIVE. |  Jumlah operasi tulis dalam periode waktu tertentu.  | 

## `PER_TOPIC_PER_BROKER`Pemantauan tingkat
<a name="broker-topic-metrics"></a>

Saat Anda mengatur tingkat pemantauan`PER_TOPIC_PER_BROKER`, Anda mendapatkan metrik yang dijelaskan dalam tabel berikut, selain semua metrik dari level `PER_BROKER` dan DEFAULT. Hanya metrik `DEFAULT` level yang gratis. Metrik dalam tabel ini memiliki dimensi sebagai berikut: Nama Cluster, ID Broker, Topik.

**penting**  
Untuk kluster MSK Amazon yang menggunakan Apache Kafka 2.4.1 atau versi yang lebih baru, metrik dalam tabel berikut hanya muncul setelah nilainya menjadi bukan nol untuk pertama kalinya. Misalnya, untuk melihat`BytesInPerSec`, satu atau lebih produsen harus terlebih dahulu mengirim data ke cluster. 


| Nama | Saat terlihat | Deskripsi | 
| --- | --- | --- | 
| FetchMessageConversionsPerSec | Setelah Anda membuat topik. | Jumlah pesan yang diambil dikonversi per detik. | 
| MessagesInPerSec | Setelah Anda membuat topik. | Jumlah pesan yang diterima per detik. | 
| ProduceMessageConversionsPerSec | Setelah Anda membuat topik. | Jumlah konversi per detik untuk pesan yang dihasilkan. | 
| RemoteFetchBytesPerSec (RemoteBytesInPerSec in v2.8.2.tiered) |  Setelah Anda membuat topik dan topik tersebut menghasilkan/memakan.  |  Jumlah byte yang ditransfer dari penyimpanan berjenjang sebagai respons terhadap pengambilan konsumen untuk topik dan broker yang ditentukan. Metrik ini mencakup semua partisi dari topik yang berkontribusi pada lalu lintas transfer data hilir pada broker yang ditentukan. Kategori: lalu lintas dan tingkat kesalahan. Ini adalah metrik [KIP-405](https://cwiki.apache.org/confluence/display/KAFKA/KIP-405%3A+Kafka+Tiered+Storage).  | 
| RemoteCopyBytesPerSec (RemoteBytesOutPerSec in v2.8.2.tiered) | Setelah Anda membuat topik dan topik tersebut menghasilkan/memakan. |  Jumlah byte yang ditransfer ke penyimpanan berjenjang, untuk topik dan broker yang ditentukan. Metrik ini mencakup semua partisi dari topik yang berkontribusi pada lalu lintas transfer data hulu pada broker yang ditentukan. Kategori: lalu lintas dan tingkat kesalahan. Ini adalah metrik [KIP-405](https://cwiki.apache.org/confluence/display/KAFKA/KIP-405%3A+Kafka+Tiered+Storage).  | 
| RemoteFetchErrorsPerSec (RemoteReadErrorPerSec in v2.8.2.tiered) | Setelah Anda membuat topik dan topik tersebut menghasilkan/memakan. | Tingkat kesalahan dalam menanggapi permintaan baca yang dikirim broker tertentu ke penyimpanan berjenjang untuk mengambil data sebagai tanggapan terhadap pengambilan konsumen pada topik yang ditentukan. Metrik ini mencakup semua partisi dari topik yang berkontribusi pada lalu lintas transfer data hilir pada broker yang ditentukan. Kategori: lalu lintas dan tingkat kesalahan. Ini adalah metrik [KIP-405](https://cwiki.apache.org/confluence/display/KAFKA/KIP-405%3A+Kafka+Tiered+Storage). | 
| RemoteFetchRequestsPerSec (RemoteReadRequestsPerSec in v2.8.2.tiered) | Setelah Anda membuat topik dan topik tersebut menghasilkan/memakan. | Jumlah permintaan baca yang dikirimkan oleh broker tertentu ke penyimpanan berjenjang untuk mengambil data sebagai tanggapan terhadap pengambilan konsumen pada topik yang ditentukan. Metrik ini mencakup semua partisi dari topik yang berkontribusi pada lalu lintas transfer data hilir pada broker yang ditentukan. Kategori: lalu lintas dan tingkat kesalahan. Ini adalah metrik [KIP-405](https://cwiki.apache.org/confluence/display/KAFKA/KIP-405%3A+Kafka+Tiered+Storage). | 
| RemoteCopyErrorsPerSec (RemoteWriteErrorPerSec in v2.8.2.tiered) | Setelah Anda membuat topik dan topik tersebut menghasilkan/memakan. | Tingkat kesalahan dalam menanggapi permintaan penulisan yang dikirim broker tertentu ke penyimpanan berjenjang untuk mentransfer data ke hulu. Metrik ini mencakup semua partisi dari topik yang berkontribusi pada lalu lintas transfer data hulu pada broker yang ditentukan. Kategori: lalu lintas dan tingkat kesalahan. Ini adalah metrik [KIP-405](https://cwiki.apache.org/confluence/display/KAFKA/KIP-405%3A+Kafka+Tiered+Storage). | 
| RemoteLogSizeBytes | Setelah Anda membuat topik. |  Jumlah byte yang disimpan di tingkat jarak jauh. Metrik ini tersedia untuk cluster penyimpanan berjenjang dari Apache Kafka versi 3.7.x di Amazon MSK.  | 

## `PER_TOPIC_PER_PARTITION`Pemantauan tingkat
<a name="topic-partition-metrics"></a>

Saat Anda mengatur tingkat pemantauan`PER_TOPIC_PER_PARTITION`, Anda mendapatkan metrik yang dijelaskan dalam tabel berikut, selain semua metrik dari level`PER_TOPIC_PER_BROKER`,`PER_BROKER`, dan DEFAULT. Hanya metrik `DEFAULT` level yang gratis. Metrik dalam tabel ini memiliki dimensi sebagai berikut: Grup Konsumen, Topik, Partisi.


| Nama | Saat terlihat | Deskripsi | 
| --- | --- | --- | 
| EstimatedTimeLag\$1 | Setelah kelompok konsumen mengkonsumsi dari suatu topik. | Perkiraan waktu (dalam detik) untuk menguras lag offset partisi. | 
| OffsetLag\$1 | Setelah kelompok konsumen mengkonsumsi dari suatu topik. | Kelambatan konsumen tingkat partisi dalam jumlah offset. | 
| RollingEstimatedTimeLag\$1 | Setelah kelompok konsumen mengkonsumsi dari suatu topik. | Perkiraan waktu bergulir (dalam detik) untuk menguras lag offset partisi. | 

\$1 Metrik lag konsumen memerlukan nama grup konsumen khusus ASCII dan memiliki persyaratan emisi khusus. Untuk informasi selengkapnya, lihat [Pantau kelambatan konsumen](consumer-lag.md).

# Memahami status cluster MSK Provisioned
<a name="msk-cluster-states"></a>

Tabel berikut menunjukkan kemungkinan status klaster MSK Provisioned dan menjelaskan apa artinya. Kecuali ditentukan lain, status klaster yang disediakan MSK berlaku untuk jenis broker Standar dan Ekspres. Tabel ini juga menjelaskan tindakan apa yang dapat dan tidak dapat Anda lakukan ketika klaster MSK Provisioned berada di salah satu status ini. Untuk mengetahui keadaan cluster, Anda dapat mengunjungi Konsol Manajemen AWS. Anda juga dapat menggunakan perintah [describe-cluster-v2](https://awscli.amazonaws.com/v2/documentation/api/latest/reference/kafka/describe-cluster-v2.html) atau operasi [DescribeClusterV2](https://docs.aws.amazon.com/MSK/2.0/APIReference/v2-clusters-clusterarn.html#DescribeClusterV2) untuk menggambarkan cluster Provisioned. Deskripsi cluster mencakup keadaannya.


****  

| MSK Status cluster yang disediakan | Makna dan kemungkinan tindakan | 
| --- | --- | 
| AKTIF |  Anda dapat memproduksi dan mengkonsumsi data. Anda juga dapat melakukan Amazon MSK API dan AWS CLI operasi di cluster.  | 
| CREATING |  Amazon MSK sedang menyiapkan cluster Provisioned. Anda harus menunggu klaster mencapai status ACTIVE sebelum Anda dapat menggunakannya untuk menghasilkan atau menggunakan data atau untuk menjalankan Amazon MSK API atau AWS CLI operasi di dalamnya.  | 
| DELETING | Cluster Provisioned sedang dihapus. Anda tidak dapat menggunakannya untuk menghasilkan atau mengkonsumsi data. Anda juga tidak dapat melakukan Amazon MSK API atau AWS CLI operasi di atasnya. | 
| FAILED | Proses pembuatan atau penghapusan klaster yang disediakan gagal. Anda tidak dapat menggunakan cluster untuk menghasilkan atau mengkonsumsi data. Anda dapat menghapus cluster tetapi tidak dapat melakukan Amazon MSK API atau AWS CLI memperbarui operasi di dalamnya. | 
| SEMBUH |  Amazon MSK menjalankan operasi internal, seperti mengganti broker yang tidak sehat. Misalnya, broker mungkin tidak responsif. Anda masih dapat menggunakan klaster Provisioned untuk menghasilkan dan mengkonsumsi data. Namun, Anda tidak dapat menjalankan Amazon MSK API atau AWS CLI memperbarui operasi di klaster hingga kembali ke status AKTIF.  | 
| PERAWATAN | (Hanya pialang standar) Amazon MSK melakukan operasi pemeliharaan rutin di cluster. Operasi pemeliharaan tersebut termasuk patch keamanan. Anda masih dapat menggunakan cluster untuk memproduksi dan mengkonsumsi data. Namun, Anda tidak dapat melakukan operasi pembaruan Amazon MSK API atau AWS CLI di cluster hingga kembali ke status AKTIF. Cluster State tetap AKTIF selama pemeliharaan pada broker Express. Lihat [Penambalan pada kluster MSK Provisioned](patching-impact.md). | 
| REBOOTING\$1BROKER | Amazon MSK me-reboot broker. Anda masih dapat menggunakan klaster Provisioned untuk menghasilkan dan mengkonsumsi data. Namun, Anda tidak dapat menjalankan Amazon MSK API atau AWS CLI memperbarui operasi di klaster hingga kembali ke status AKTIF. | 
| UPDATING | API AWS CLI atau operasi MSK Amazon yang diprakarsai pengguna memperbarui cluster Provisioned. Anda masih dapat menggunakan klaster Provisioned untuk menghasilkan dan mengkonsumsi data. Namun, Anda tidak dapat melakukan API MSK Amazon tambahan atau operasi AWS CLI pembaruan di klaster hingga kembali ke status AKTIF. | 

# Metrik MSK Amazon untuk memantau broker Express dengan CloudWatch
<a name="metrics-details-express"></a>

Amazon MSK terintegrasi dengan CloudWatch sehingga Anda dapat mengumpulkan, melihat, dan menganalisis CloudWatch metrik untuk broker MSK Express Anda. Metrik yang Anda konfigurasikan untuk kluster MSK Provisioned secara otomatis dikumpulkan dan didorong ke CloudWatch interval 1 menit. Anda dapat mengatur tingkat pemantauan untuk klaster MSK Provisioned ke salah satu dari berikut ini:`DEFAULT`,,`PER_BROKER`, `PER_TOPIC_PER_BROKER` atau. `PER_TOPIC_PER_PARTITION` Tabel di bagian berikut menunjukkan metrik yang tersedia mulai dari setiap tingkat pemantauan.

`DEFAULT`Metrik -level gratis. Harga untuk metrik lainnya dijelaskan di halaman [ CloudWatchharga Amazon](https://aws.amazon.com/cloudwatch/pricing/).

## `DEFAULT`Pemantauan tingkat untuk broker Express
<a name="express-default-metrics"></a>

Metrik yang dijelaskan dalam tabel berikut tersedia gratis di tingkat `DEFAULT` pemantauan.


| Nama | Saat terlihat | Dimensi | Deskripsi | 
| --- | --- | --- | --- | 
| ActiveControllerCount | Setelah cluster sampai ke status ACTIVE. | Nama Klaster | Hanya satu pengontrol per cluster yang harus aktif pada waktu tertentu. | 
| BytesInPerSec | Setelah Anda membuat topik. | Nama Cluster, ID Pialang, Topik | Jumlah byte per detik yang diterima dari klien. Metrik ini tersedia per broker dan juga per topik. | 
| BytesOutPerSec | Setelah Anda membuat topik. | Nama Cluster, ID Pialang, Topik | Jumlah byte per detik dikirim ke klien. Metrik ini tersedia per broker dan juga per topik. | 
| ClientConnectionCount | Setelah cluster sampai ke status ACTIVE. | Nama Cluster, ID Broker, Otentikasi Klien | Jumlah koneksi klien yang diautentikasi aktif. | 
| ConnectionCount | Setelah cluster sampai ke status ACTIVE. | Nama Klaster, ID Broker | Jumlah koneksi aktif yang diautentikasi, tidak diautentikasi, dan antar-broker. | 
| CpuIdle | Setelah cluster sampai ke status ACTIVE. | Nama Klaster, ID Broker | Persentase waktu idle CPU. | 
| CpuSystem | Setelah cluster sampai ke status ACTIVE. | Nama Klaster, ID Broker | Persentase CPU di ruang kernel. | 
| CpuUser | Setelah cluster sampai ke status ACTIVE. | Nama Klaster, ID Broker | Persentase CPU di ruang pengguna. | 
| GlobalPartitionCount | Setelah cluster sampai ke status ACTIVE. | Nama Klaster | Jumlah partisi di semua topik di cluster, tidak termasuk replika. Karena `GlobalPartitionCount` tidak termasuk replika, jumlah `PartitionCount` nilai bisa lebih tinggi daripada `GlobalPartitionCount` jika faktor replikasi untuk suatu topik lebih besar dari. `1` | 
| GlobalTopicCount | Setelah cluster sampai ke status ACTIVE. | Nama Klaster | Jumlah total topik di semua broker di cluster. | 
| EstimatedMaxTimeLag\$1 | Setelah kelompok konsumen mengkonsumsi dari suatu topik. | Grup Konsumen, Topik | Perkiraan waktu (dalam detik) untuk menguras`MaxOffsetLag`. | 
| LeaderCount | Setelah cluster sampai ke status ACTIVE. | Nama Klaster, ID Broker | Jumlah total pemimpin partisi per broker, tidak termasuk replika. | 
| MaxOffsetLag\$1 | Setelah kelompok konsumen mengkonsumsi dari suatu topik. | Grup Konsumen, Topik | Keterlambatan offset maksimum di semua partisi dalam suatu topik. | 
| MemoryBuffered | Setelah cluster sampai ke status ACTIVE. | Nama Klaster, ID Broker | Ukuran dalam byte memori buffer untuk broker. | 
| MemoryCached | Setelah cluster sampai ke status ACTIVE. | Nama Klaster, ID Broker | Ukuran dalam byte memori cache untuk broker. | 
| MemoryFree | Setelah cluster sampai ke status ACTIVE. | Nama Klaster, ID Broker | Ukuran dalam byte memori yang gratis dan tersedia untuk broker. | 
| MemoryUsed | Setelah cluster sampai ke status ACTIVE. | Nama Klaster, ID Broker | Ukuran dalam byte memori yang digunakan untuk broker. | 
| MessagesInPerSec | Setelah cluster sampai ke status ACTIVE. | Nama Klaster, ID Broker | Jumlah pesan masuk per detik untuk broker. | 
| NetworkRxDropped | Setelah cluster sampai ke status ACTIVE. | Nama Klaster, ID Broker | Jumlah paket penerima yang dijatuhkan. | 
| NetworkRxErrors | Setelah cluster sampai ke status ACTIVE. | Nama Klaster, ID Broker | Jumlah jaringan menerima kesalahan untuk broker. | 
| NetworkRxPackets | Setelah cluster sampai ke status ACTIVE. | Nama Klaster, ID Broker | Jumlah paket yang diterima oleh broker. | 
| NetworkTxDropped | Setelah cluster sampai ke status ACTIVE. | Nama Klaster, ID Broker | Jumlah paket pengiriman yang dijatuhkan. | 
| NetworkTxErrors | Setelah cluster sampai ke status ACTIVE. | Nama Klaster, ID Broker | Jumlah kesalahan transmisi jaringan untuk broker. | 
| NetworkTxPackets | Setelah cluster sampai ke status ACTIVE. | Nama Klaster, ID Broker | Jumlah paket yang dikirimkan oleh broker. | 
| PartitionCount | Setelah cluster sampai ke status ACTIVE. | Nama Klaster, ID Broker | Jumlah total partisi topik per broker, termasuk replika. | 
| ProduceTotalTimeMsMean | Setelah cluster sampai ke status ACTIVE. | Nama Klaster, ID Broker | Rata-rata menghasilkan waktu dalam milidetik. | 
| RequestBytesMean | Setelah cluster sampai ke status ACTIVE. | Nama Klaster, ID Broker | Jumlah rata-rata byte permintaan untuk broker. | 
| RequestTime | Setelah permintaan throttling diterapkan. | Nama Klaster, ID Broker | Rata-rata waktu dalam milidetik yang dihabiskan di jaringan broker dan I/O utas untuk memproses permintaan. | 
| RollingEstimatedTimeLagMax\$1 | Setelah kelompok konsumen mengkonsumsi dari suatu topik. | Grup Konsumen, Topik | Perkiraan waktu maksimum bergulir (dalam detik) untuk menguras lag offset partisi di semua partisi dalam suatu topik. | 
| StorageUsed | Setelah cluster sampai ke status ACTIVE. | Nama Klaster | Total penyimpanan yang digunakan di semua partisi di cluster, tidak termasuk replika. | 
| SumOffsetLag\$1 | Setelah kelompok konsumen mengkonsumsi dari suatu topik. | Grup Konsumen, Topik | Kelambatan offset agregat untuk semua partisi dalam suatu topik. | 
| UserPartitionExists | Setelah cluster sampai ke status ACTIVE. | Nama Klaster, ID Broker | Metrik Boolean yang menunjukkan adanya partisi milik pengguna pada broker. Nilai 1 menunjukkan adanya partisi pada broker. | 

\$1 Metrik lag konsumen memerlukan nama grup konsumen khusus ASCII dan memiliki persyaratan emisi khusus. Untuk informasi selengkapnya, lihat [Pantau kelambatan konsumen](consumer-lag.md).

## `PER_BROKER`Pemantauan tingkat untuk broker Express
<a name="express-per-broker-metrics"></a>

Saat Anda menyetel level pemantauan`PER_BROKER`, Anda mendapatkan metrik yang dijelaskan dalam tabel berikut selain semua metrik `DEFAULT` level. Anda membayar metrik dalam tabel berikut, sedangkan metrik `DEFAULT` level tetap gratis. Metrik dalam tabel ini memiliki dimensi sebagai berikut: Nama Cluster, ID Broker.


| Nama | Saat terlihat | Deskripsi | 
| --- | --- | --- | 
| ConnectionCloseRate | Setelah cluster sampai ke status ACTIVE. | Jumlah koneksi ditutup per detik per pendengar. Jumlah ini dikumpulkan per pendengar dan disaring untuk pendengar klien. | 
| ConnectionCreationRate | Setelah cluster sampai ke status ACTIVE. | Jumlah koneksi baru yang dibuat per detik per pendengar. Jumlah ini dikumpulkan per pendengar dan disaring untuk pendengar klien. | 
| FetchConsumerLocalTimeMsMean | Setelah ada produsen/konsumen. | Waktu rata-rata dalam milidetik bahwa permintaan konsumen diproses pada pemimpin. | 
| FetchConsumerRequestQueueTimeMsMean | Setelah ada produsen/konsumen. | Waktu rata-rata dalam milidetik permintaan konsumen menunggu dalam antrian permintaan. | 
| FetchConsumerResponseQueueTimeMsMean | Setelah ada produsen/konsumen. | Waktu rata-rata dalam milidetik permintaan konsumen menunggu dalam antrian respons. | 
| FetchConsumerResponseSendTimeMsMean | Setelah ada produsen/konsumen. | Waktu rata-rata dalam milidetik bagi konsumen untuk mengirim respons. | 
| FetchConsumerTotalTimeMsMean | Setelah ada produsen/konsumen. | Total waktu rata-rata dalam milidetik yang dihabiskan konsumen untuk mengambil data dari broker. | 
| FetchFollowerLocalTimeMsMean | Setelah ada produsen/konsumen. | Waktu rata-rata dalam milidetik permintaan pengikut diproses di pemimpin. | 
| FetchFollowerRequestQueueTimeMsMean | Setelah ada produsen/konsumen. | Waktu rata-rata dalam milidetik permintaan pengikut menunggu dalam antrian permintaan. | 
| FetchFollowerResponseQueueTimeMsMean | Setelah ada produsen/konsumen. | Waktu rata-rata dalam milidetik permintaan pengikut menunggu dalam antrian respons. | 
| FetchFollowerResponseSendTimeMsMean | Setelah ada produsen/konsumen. | Waktu rata-rata dalam milidetik bagi pengikut untuk mengirim respons. | 
| FetchFollowerTotalTimeMsMean | Setelah ada produsen/konsumen. | Total waktu rata-rata dalam milidetik yang dihabiskan pengikut untuk mengambil data dari broker. | 
| FetchThrottleByteRate | Setelah pembatasan bandwidth diterapkan. | Jumlah byte yang dibatasi per detik. | 
| FetchThrottleQueueSize | Setelah pembatasan bandwidth diterapkan. | Jumlah pesan dalam antrian throttle. | 
| FetchThrottleTime | Setelah pembatasan bandwidth diterapkan. | Rata-rata waktu fetch throttle dalam milidetik. | 
| IAMNumberOfConnectionRequests | Setelah cluster sampai ke status ACTIVE. | Jumlah permintaan otentikasi IAM per detik. | 
| IAMTooManyConnections | Setelah cluster sampai ke status ACTIVE. | Jumlah koneksi yang dicoba melebihi 100. `0`berarti jumlah koneksi berada dalam batas. Jika`>0`, batas throttle terlampaui dan Anda perlu mengurangi jumlah koneksi. | 
| NetworkProcessorAvgIdlePercent | Setelah cluster sampai ke status ACTIVE. | Persentase rata-rata waktu prosesor jaringan menganggur. | 
| ProduceLocalTimeMsMean | Setelah cluster sampai ke status ACTIVE. | Waktu rata-rata dalam milidetik permintaan diproses di pemimpin. | 
| ProduceRequestQueueTimeMsMean | Setelah cluster sampai ke status ACTIVE. | Waktu rata-rata dalam milidetik yang digunakan pesan permintaan dalam antrian. | 
| ProduceResponseQueueTimeMsMean | Setelah cluster sampai ke status ACTIVE. | Waktu rata-rata dalam milidetik yang dihabiskan pesan respons dalam antrian. | 
| ProduceResponseSendTimeMsMean | Setelah cluster sampai ke status ACTIVE. | Waktu rata-rata dalam milidetik dihabiskan untuk mengirim pesan respons. | 
| ProduceThrottleByteRate | Setelah pembatasan bandwidth diterapkan. | Jumlah byte yang dibatasi per detik. | 
| ProduceThrottleQueueSize | Setelah pembatasan bandwidth diterapkan. | Jumlah pesan dalam antrian throttle. | 
| ProduceThrottleTime | Setelah pembatasan bandwidth diterapkan. | Rata-rata menghasilkan waktu throttle dalam milidetik. | 
| ProduceTotalTimeMsMean | Setelah cluster sampai ke status ACTIVE. | Rata-rata menghasilkan waktu dalam milidetik. | 
| ReplicationBytesInPerSec | Setelah Anda membuat topik. | Jumlah byte per detik yang diterima dari broker lain. | 
| ReplicationBytesOutPerSec | Setelah Anda membuat topik. | Jumlah byte per detik dikirim ke broker lain. | 
| RequestExemptFromThrottleTime | Setelah permintaan throttling diterapkan. | Rata-rata waktu dalam milidetik yang dihabiskan di jaringan broker dan I/O utas untuk memproses permintaan yang dibebaskan dari pembatasan. | 
| RequestHandlerAvgIdlePercent | Setelah cluster sampai ke status ACTIVE. | Persentase rata-rata waktu thread handler permintaan tidak digunakan. | 
| RequestThrottleQueueSize | Setelah permintaan throttling diterapkan. | Jumlah pesan dalam antrian throttle. | 
| RequestThrottleTime | Setelah permintaan throttling diterapkan. | Rata-rata waktu permintaan throttle dalam milidetik. | 
| TcpConnections | Setelah cluster sampai ke status ACTIVE. | Menampilkan jumlah segmen TCP masuk dan keluar dengan set bendera SYN. | 
| TrafficBytes | Setelah cluster sampai ke status ACTIVE. | Menunjukkan lalu lintas jaringan dalam byte keseluruhan antara klien (produsen dan konsumen) dan broker. Lalu lintas antar broker tidak dilaporkan. | 

## `PER_TOPIC_PER_PARTITION`pemantauan tingkat untuk broker Express
<a name="express-per-topic-per-partition-metrics"></a>

Saat Anda mengatur level pemantauan`PER_TOPIC_PER_PARTITION`, Anda mendapatkan metrik yang dijelaskan dalam tabel berikut, selain semua metrik dari`PER_TOPIC_PER_BROKER`,`PER_BROKER`, dan `DEFAULT` level. Hanya metrik `DEFAULT` level yang gratis. Metrik dalam tabel ini memiliki dimensi sebagai berikut: Grup Konsumen, Topik, Partisi.


| Nama | Saat terlihat | Deskripsi | 
| --- | --- | --- | 
| EstimatedTimeLag\$1 | Setelah kelompok konsumen mengkonsumsi dari suatu topik. | Perkiraan waktu (dalam detik) untuk menguras lag offset partisi. | 
| OffsetLag\$1 | Setelah kelompok konsumen mengkonsumsi dari suatu topik. | Kelambatan konsumen tingkat partisi dalam jumlah offset. | 
| RollingEstimatedTimeLag\$1 | Setelah kelompok konsumen mengkonsumsi dari suatu topik. | Perkiraan waktu bergulir (dalam detik) untuk menguras lag offset partisi. | 

\$1 Metrik lag konsumen memerlukan nama grup konsumen khusus ASCII dan memiliki persyaratan emisi khusus. Untuk informasi selengkapnya, lihat [Pantau kelambatan konsumen](consumer-lag.md).

## `PER_TOPIC_PER_BROKER`pemantauan tingkat untuk broker Express
<a name="express-per-topic-per-broker-metrics"></a>

Saat Anda mengatur tingkat pemantauan`PER_TOPIC_PER_BROKER`, Anda mendapatkan metrik yang dijelaskan dalam tabel berikut, selain semua metrik dari `PER_BROKER` dan `DEFAULT` level. Hanya metrik `DEFAULT` level yang gratis. Metrik dalam tabel ini memiliki dimensi sebagai berikut: Nama Cluster, ID Broker, Topik.

**penting**  
Metrik dalam tabel berikut muncul hanya setelah nilainya menjadi bukan nol untuk pertama kalinya. Misalnya, untuk melihat BytesInPerSec, satu atau lebih produsen harus terlebih dahulu mengirim data ke cluster.


| Nama | Saat terlihat | Deskripsi | 
| --- | --- | --- | 
| MessagesInPerSec | Setelah Anda membuat topik. | Jumlah pesan yang diterima per detik. | 

# Memantau klaster MSK Provisioned dengan Prometheus
<a name="open-monitoring"></a>

Anda dapat memantau klaster MSK Provisioned Anda dengan Prometheus, sistem pemantauan sumber terbuka untuk data metrik deret waktu. Anda dapat mempublikasikan data ini ke Amazon Managed Service untuk Prometheus menggunakan fitur tulis jarak jauh Prometheus. [https://docs.lenses.io/latest/deployment/configuration/agent/automation/kafka/aws-msk](https://docs.lenses.io/latest/deployment/configuration/agent/automation/kafka/aws-msk) Pemantauan terbuka tersedia secara gratis tetapi biaya berlaku untuk transfer data di seluruh Availability Zone.

[Untuk informasi tentang Prometheus, lihat dokumentasi Prometheus.](https://prometheus.io/docs)

Untuk informasi tentang penggunaan Prometheus, lihat [Meningkatkan wawasan operasional untuk MSK Amazon menggunakan Layanan Terkelola Amazon untuk Prometheus dan Grafana yang Dikelola Amazon](https://aws.amazon.com/blogs//big-data/enhance-operational-insights-for-amazon-msk-using-amazon-managed-service-for-prometheus-and-amazon-managed-grafana/).

**catatan**  
KRaft mode metadata dan broker MSK Express tidak dapat mengaktifkan pemantauan terbuka dan akses publik.

# Aktifkan pemantauan terbuka pada kluster MSK Provisioned baru
<a name="enable-open-monitoring-at-creation"></a>

Prosedur ini menjelaskan cara mengaktifkan pemantauan terbuka pada kluster MSK baru menggunakan Konsol Manajemen AWS, AWS CLI, atau Amazon MSK API.

**Menggunakan Konsol Manajemen AWS**

1. Masuk ke Konsol Manajemen AWS, dan buka konsol MSK Amazon di [https://console.aws.amazon.com/msk/rumah? region=us-east-1\$1/home/](https://console.aws.amazon.com/msk/home?region=us-east-1#/home/).

1. Di bagian **Pemantauan**, pilih kotak centang di sebelah **Aktifkan pemantauan terbuka dengan Prometheus**.

1. Berikan informasi yang diperlukan di semua bagian halaman, dan tinjau semua opsi yang tersedia.

1. Pilih **Buat klaster**.

**Menggunakan AWS CLI**
+ Panggil perintah [create-cluster](https://docs.aws.amazon.com/cli/latest/reference/kafka/create-cluster.html) dan tentukan opsinya. `open-monitoring` Aktifkan`JmxExporter`, yang`NodeExporter`, atau keduanya. Jika Anda menentukan`open-monitoring`, kedua eksportir tidak dapat dinonaktifkan pada saat yang sama.

**Menggunakan API**
+ Memanggil [CreateCluster](https://docs.aws.amazon.com/msk/1.0/apireference/clusters.html#CreateCluster)operasi dan menentukan`OpenMonitoring`. Aktifkan`jmxExporter`, yang`nodeExporter`, atau keduanya. Jika Anda menentukan`OpenMonitoring`, kedua eksportir tidak dapat dinonaktifkan pada saat yang sama.

# Aktifkan pemantauan terbuka pada klaster MSK Provisioned yang ada
<a name="enable-open-monitoring-after-creation"></a>

Untuk mengaktifkan pemantauan terbuka, pastikan klaster MSK Provisioned dalam keadaan. `ACTIVE`

**Menggunakan Konsol Manajemen AWS**

1. Masuk ke Konsol Manajemen AWS, dan buka konsol MSK Amazon di [https://console.aws.amazon.com/msk/rumah? region=us-east-1\$1/home/](https://console.aws.amazon.com/msk/home?region=us-east-1#/home/).

1. Pilih nama cluster yang ingin Anda perbarui. Ini membawa Anda ke halaman yang berisi detail untuk cluster.

1. Pada tab **Properties**, gulir ke bawah untuk menemukan bagian **Monitoring**.

1. Pilih **Edit**.

1. Pilih kotak centang di sebelah **Aktifkan pemantauan terbuka dengan Prometheus**.

1. Pilih **Simpan perubahan**.

**Menggunakan AWS CLI**
+ Panggil perintah [pembaruan-pemantauan](https://docs.aws.amazon.com/cli/latest/reference/kafka/update-monitoring.html) dan tentukan opsinya. `open-monitoring` Aktifkan`JmxExporter`, yang`NodeExporter`, atau keduanya. Jika Anda menentukan`open-monitoring`, kedua eksportir tidak dapat dinonaktifkan pada saat yang sama.

**Menggunakan API**
+ Memanggil [UpdateMonitoring](https://docs.aws.amazon.com/msk/1.0/apireference/clusters-clusterarn-monitoring.html#UpdateMonitoring)operasi dan menentukan`OpenMonitoring`. Aktifkan`jmxExporter`, yang`nodeExporter`, atau keduanya. Jika Anda menentukan`OpenMonitoring`, kedua eksportir tidak dapat dinonaktifkan pada saat yang sama.

# Siapkan host Prometheus di instans Amazon EC2
<a name="set-up-prometheus-host"></a>

Prosedur ini menjelaskan cara mengatur host Prometheus menggunakan file prometheus.yl.

1. Unduh server Prometheus dari ke instans Amazon EC2 [https://prometheus.io/download/#prometheus](https://prometheus.io/download/#prometheus) Anda.

1. Ekstrak file yang diunduh ke direktori dan pergi ke direktori itu.

1. Buat file dengan konten berikut dan beri nama`prometheus.yml`.

   ```
   # file: prometheus.yml
   # my global config
   global:
     scrape_interval:     60s
   
   # A scrape configuration containing exactly one endpoint to scrape:
   # Here it's Prometheus itself.
   scrape_configs:
     # The job name is added as a label `job=<job_name>` to any timeseries scraped from this config.
     - job_name: 'prometheus'
       static_configs:
       # 9090 is the prometheus server port
       - targets: ['localhost:9090']
     - job_name: 'broker'
       file_sd_configs:
       - files:
         - 'targets.json'
   ```

1. Gunakan [ListNodes](https://docs.aws.amazon.com//msk/1.0/apireference/clusters-clusterarn-nodes.html#ListNodes)operasi untuk mendapatkan daftar broker cluster Anda.

1. Buat file bernama `targets.json` dengan JSON berikut. Ganti *broker\$1dns\$11**broker\$1dns\$12*,, dan sisa nama DNS broker dengan nama DNS yang Anda peroleh untuk broker Anda di langkah sebelumnya. Sertakan semua broker yang Anda peroleh pada langkah sebelumnya. Amazon MSK menggunakan port 11001 untuk JMX Exporter dan port 11002 untuk Node Exporter.

------
#### [ ZooKeeper mode targets.json ]

   ```
   [
     {
       "labels": {
         "job": "jmx"
       },
       "targets": [
         "broker_dns_1:11001",
         "broker_dns_2:11001",
         .
         .
         .
         "broker_dns_N:11001"
       ]
     },
     {
       "labels": {
         "job": "node"
       },
       "targets": [
         "broker_dns_1:11002",
         "broker_dns_2:11002",
         .
         .
         .
         "broker_dns_N:11002"
       ]
     }
   ]
   ```

------
#### [ KRaft mode targets.json ]

   ```
   [
     {
       "labels": {
         "job": "jmx"
       },
       "targets": [
         "broker_dns_1:11001",
         "broker_dns_2:11001",
         .
         .
         .
         "broker_dns_N:11001",
         "controller_dns_1:11001",
         "controller_dns_2:11001",
         "controller_dns_3:11001"
       ]
     },
     {
       "labels": {
         "job": "node"
       },
       "targets": [
         "broker_dns_1:11002",
         "broker_dns_2:11002",
         .
         .
         .
         "broker_dns_N:11002"
       ]
     }
   ]
   ```

------
**catatan**  
Untuk mengikis metrik JMX dari KRaft pengontrol, tambahkan nama DNS pengontrol sebagai target dalam file JSON. Misalnya:`controller_dns_1:11001`, mengganti `controller_dns_1` dengan nama DNS controller yang sebenarnya.

1. Untuk memulai server Prometheus di instans Amazon EC2 Anda, jalankan perintah berikut di direktori tempat Anda mengekstrak file Prometheus dan disimpan dan. `prometheus.yml` `targets.json`

   ```
   ./prometheus
   ```

1. Temukan alamat IP publik IPv4 dari instans Amazon EC2 tempat Anda menjalankan Prometheus pada langkah sebelumnya. Anda memerlukan alamat IP publik ini pada langkah berikut.

1. Untuk mengakses UI web Prometheus, buka browser yang dapat mengakses instans Amazon EC2 Anda, dan buka`Prometheus-Instance-Public-IP:9090`, *Prometheus-Instance-Public-IP* di mana alamat IP publik yang Anda dapatkan pada langkah sebelumnya.

# Gunakan metrik Prometheus
<a name="prometheus-metrics"></a>

Semua metrik yang dipancarkan oleh Apache Kafka ke JMX dapat diakses menggunakan pemantauan terbuka dengan Prometheus. Untuk informasi tentang metrik Apache Kafka, lihat [Pemantauan](https://kafka.apache.org/documentation/#monitoring) dalam dokumentasi Apache Kafka. Seiring dengan metrik Apache Kafka, metrik lag konsumen juga tersedia di port 11001 dengan nama JMX. MBean `kafka.consumer.group:type=ConsumerLagMetrics` Anda juga dapat menggunakan Prometheus Node Exporter untuk mendapatkan metrik CPU dan disk untuk broker Anda di port 11002.

# Simpan metrik Prometheus di Layanan Terkelola Amazon untuk Prometheus
<a name="managed-service-prometheus"></a>

Amazon Managed Service for Prometheus adalah layanan pemantauan dan peringatan yang kompatibel dengan Prometheus yang dapat Anda gunakan untuk memantau kluster MSK Amazon. Ini adalah layanan yang dikelola sepenuhnya yang secara otomatis menskalakan konsumsi, penyimpanan, kueri, dan peringatan metrik Anda. Ini juga terintegrasi dengan layanan AWS keamanan untuk memberi Anda akses cepat dan aman ke data Anda. Anda dapat menggunakan bahasa kueri PromQL sumber terbuka untuk menanyakan metrik dan memperingatkannya.

Untuk informasi selengkapnya, lihat [Memulai Layanan Terkelola Amazon untuk Prometheus](https://docs.aws.amazon.com/prometheus/latest/userguide/AMP-getting-started.html).

# Pantau kelambatan konsumen
<a name="consumer-lag"></a>

Memantau kelambatan konsumen memungkinkan Anda mengidentifikasi konsumen yang lambat atau macet yang tidak mengikuti data terbaru yang tersedia dalam suatu topik. Bila perlu, Anda kemudian dapat mengambil tindakan perbaikan, seperti menskalakan atau me-reboot konsumen tersebut. Untuk memantau kelambatan konsumen, Anda dapat menggunakan Amazon CloudWatch atau pemantauan terbuka dengan Prometheus.

Metrik lag konsumen mengukur perbedaan antara data terbaru yang ditulis ke topik Anda dan data yang dibaca oleh aplikasi Anda. Amazon MSK menyediakan metrik kelambatan konsumen berikut, yang dapat Anda dapatkan melalui Amazon CloudWatch atau melalui pemantauan terbuka dengan Prometheus:,,,, dan. `EstimatedMaxTimeLag` `EstimatedTimeLag` `MaxOffsetLag` `OffsetLag` `SumOffsetLag` Untuk informasi selengkapnya tentang metrik ini, lihat [Metrik MSK Amazon untuk memantau pialang Standar dengan CloudWatch](metrics-details.md).

Amazon MSK mendukung metrik lag konsumen untuk cluster dengan Apache Kafka 2.2.1 atau versi yang lebih baru. Pertimbangkan poin-poin berikut saat Anda bekerja dengan Kafka dan CloudWatch metrik:
+ Metrik lag konsumen dipancarkan hanya jika grup konsumen berada dalam keadaan STABIL atau KOSONG. Grup konsumen STABIL setelah berhasil menyelesaikan penyeimbangan ulang, memastikan bahwa partisi didistribusikan secara merata di antara konsumen.
+ Metrik lag konsumen tidak ada dalam skenario berikut:
  + Jika kelompok konsumen tidak stabil.
  + Nama grup konsumen berisi titik dua (:).
  + Anda belum menetapkan offset konsumen untuk grup konsumen.
+ Nama grup konsumen digunakan sebagai dimensi untuk metrik lag konsumen di CloudWatch. [Sementara Kafka mendukung karakter UTF-8 dalam nama grup konsumen, hanya CloudWatch mendukung karakter ASCII untuk nilai dimensi.](https://docs.aws.amazon.com/AmazonCloudWatch/latest/APIReference/API_Dimension.html) Jika Anda menggunakan karakter non-ASCII dalam nama grup konsumen, hapus metrik CloudWatch lag konsumen. Untuk memastikan bahwa metrik lag konsumen Anda ditangkap dengan benar CloudWatch, Anda harus menggunakan hanya karakter ASCII dalam nama grup konsumen Anda.

# Gunakan peringatan kapasitas penyimpanan MSK Amazon
<a name="cluster-alerts"></a>

Di kluster yang disediakan MSK Amazon, Anda memilih kapasitas penyimpanan utama klaster. Jika Anda menghabiskan kapasitas penyimpanan pada broker di cluster yang disediakan, itu dapat memengaruhi kemampuannya untuk memproduksi dan mengkonsumsi data, yang menyebabkan waktu henti yang mahal. Amazon MSK menawarkan CloudWatch metrik untuk membantu Anda memantau kapasitas penyimpanan klaster Anda. Namun, untuk memudahkan Anda mendeteksi dan menyelesaikan masalah kapasitas penyimpanan, Amazon MSK secara otomatis mengirimkan peringatan kapasitas penyimpanan klaster dinamis kepada Anda. Peringatan kapasitas penyimpanan mencakup rekomendasi untuk langkah-langkah jangka pendek dan jangka panjang untuk mengelola kapasitas penyimpanan klaster Anda. Dari [konsol MSK Amazon](https://console.aws.amazon.com/msk/home?region=us-east-1#/home/), Anda dapat menggunakan tautan cepat di dalam peringatan untuk segera mengambil tindakan yang disarankan.

Ada dua jenis peringatan kapasitas penyimpanan MSK: proaktif dan remedial.
+ Peringatan kapasitas penyimpanan proaktif (“Diperlukan tindakan”) memperingatkan Anda tentang potensi masalah penyimpanan dengan klaster Anda. Ketika broker di kluster MSK telah menggunakan lebih dari 60% atau 80% dari kapasitas penyimpanan disknya, Anda akan menerima peringatan proaktif untuk broker yang terpengaruh. 
+ Peringatan kapasitas penyimpanan remedial (“Tindakan kritis diperlukan”) mengharuskan Anda untuk mengambil tindakan perbaikan untuk memperbaiki masalah klaster kritis ketika salah satu broker di klaster MSK Anda kehabisan kapasitas penyimpanan disk.

Amazon MSK secara otomatis mengirimkan peringatan ini ke konsol [MSK Amazon, Dasbor AWS](https://console.aws.amazon.com/msk/home?region=us-east-1#/home/) [Kesehatan, [Amazon EventBridge](https://aws.amazon.com/pm/eventbridge/),](https://aws.amazon.com/premiumsupport/technology/aws-health/) dan kontak email untuk akun Anda. AWS Anda juga dapat [mengonfigurasi Amazon EventBridge](https://docs.aws.amazon.com/eventbridge/latest/userguide/eb-api-destination-partners.html) untuk mengirimkan peringatan ini ke Slack atau ke alat seperti New Relic, dan Datadog. 

Peringatan kapasitas penyimpanan diaktifkan secara default untuk semua kluster yang disediakan MSK dan tidak dapat dimatikan. Fitur ini didukung di semua wilayah di mana MSK tersedia.

## Pantau peringatan kapasitas penyimpanan
<a name="cluster-alerts-monitoring"></a>

Anda dapat memeriksa peringatan kapasitas penyimpanan dengan beberapa cara:
+ Pergi ke [konsol MSK Amazon](https://console.aws.amazon.com/msk/home?region=us-east-1#/home/). Peringatan kapasitas penyimpanan ditampilkan di panel peringatan klaster selama 90 hari. Peringatan berisi rekomendasi dan tindakan tautan klik tunggal untuk mengatasi masalah kapasitas penyimpanan disk.
+ Gunakan [ListClusters](https://docs.aws.amazon.com/msk/1.0/apireference/clusters.html#ListClusters), [ListClustersV2 [DescribeCluster](https://docs.aws.amazon.com/msk/1.0/apireference/clusters-clusterarn.html#DescribeCluster)](https://docs.aws.amazon.com/MSK/2.0/APIReference/v2-clusters.html#ListClustersV2),, atau [DescribeClusterV2](https://docs.aws.amazon.com/MSK/2.0/APIReference/v2-clusters-clusterarn.html#DescribeClusterV2) APIs untuk melihat `CustomerActionStatus` dan semua peringatan untuk sebuah cluster.
+ Buka [Dasbor AWS Kesehatan](https://aws.amazon.com/premiumsupport/technology/aws-health/) untuk melihat peringatan dari MSK dan layanan lainnya AWS .
+ Siapkan [AWS Health API](https://docs.aws.amazon.com/health/latest/ug/health-api.html) dan [Amazon EventBridge](https://docs.aws.amazon.com/eventbridge/latest/userguide/eb-api-destination-partners.html) untuk merutekan pemberitahuan peringatan ke platform pihak ketiga seperti Datadog, NewRelic, dan Slack.