Jawaban atas pertanyaan umum tentang konfigurasi ketersediaan tinggi di Amazon Managed Service untuk Prometheus - Layanan Terkelola Amazon untuk Prometheus

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Jawaban atas pertanyaan umum tentang konfigurasi ketersediaan tinggi di Amazon Managed Service untuk Prometheus

Haruskah saya memasukkan nilai __replica__ ke label lain untuk melacak titik sampel?

Dalam pengaturan ketersediaan tinggi, Amazon Managed Service untuk Prometheus memastikan sampel data tidak diduplikasi dengan memilih pemimpin dalam cluster instance Prometheus. Jika replika pemimpin berhenti mengirim sampel data selama 30 detik, Layanan Terkelola Amazon untuk Prometheus secara otomatis menjadikan instance Prometheus lain sebagai replika pemimpin dan menyerap data dari pemimpin baru, termasuk data yang terlewat. Karena itu, jawabannya tidak, tidak disarankan.  Melakukannya dapat menyebabkan masalah seperti:

  • Meminta a count di PromQL dapat mengembalikan nilai yang lebih tinggi dari yang diharapkan selama periode pemilihan pemimpin baru.

  • Jumlah active series akan meningkat selama periode memilih pemimpin baru dan mencapai. active series limits Lihat AMPKuota untuk info lebih lanjut.

Kubernetes tampaknya memiliki label klaster sendiri, dan tidak menghapus duplikasi metrik saya. Bagaimana saya bisa memperbaikinya?

Sebuah metrik baru, apiserver_storage_size_bytes diperkenalkan di Kubernetes 1.28, dengan label. cluster Hal ini dapat menyebabkan masalah dengan deduplikasi di Amazon Managed Service untuk Prometheus, yang bergantung pada label. cluster Di Kubernetes 1.3, label diubah namanya menjadi storage-cluster_id (juga diganti namanya di tambalan selanjutnya dari 1,28 dan 1,29). Jika klaster Anda memancarkan metrik ini dengan cluster label, Amazon Managed Service untuk Prometheus tidak dapat men-dedupe deret waktu terkait. Kami menyarankan Anda meningkatkan cluster Kubernetes Anda ke versi patch terbaru untuk menghindari masalah ini. Sebagai alternatif, Anda dapat memberi label ulang cluster label pada apiserver_storage_size_bytes metrik Anda sebelum memasukkannya ke Amazon Managed Service for Prometheus.

catatan

Untuk detail selengkapnya tentang perubahan ke Kubernetes, lihat Mengganti nama klaster Label menjadi storage_cluster_id untuk metrik apiserver_storage_size_bytes dalam proyek Kubernetes. GitHub