Prometheus용 Amazon 매니지드 서비스의 고가용성 구성에 대한 일반적인 질문에 대한 답변 - Amazon Managed Service for Prometheus

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

Prometheus용 Amazon 매니지드 서비스의 고가용성 구성에 대한 일반적인 질문에 대한 답변

샘플 포인트를 추적하려면 __replica__ 값을 다른 레이블에 포함해야 하나요?

고가용성 설정에서 Amazon Managed Service for Prometheus는 Prometheus 인스턴스 클러스터의 리더를 선택하여 데이터 샘플이 중복되지 않도록 합니다. 리더 복제본이 30초 동안 데이터 샘플 전송을 중단하면 Amazon Managed Service for Prometheus는 자동으로 다른 Prometheus 인스턴스를 리더 복제본으로 만들고 새 리더로부터 누락된 데이터를 비롯한 데이터를 수집합니다. 따라서 대답은 '아니요'로, 이 작업은 권장되지 않습니다.  이렇게 하면 다음과 같은 문제가 발생할 수 있습니다.

  • 새 리더를 선택하는 기간 동안 PromQL에서 count를 쿼리하면 예상보다 높은 값이 반환될 수 있습니다.

  • 새 리더를 선택하는 기간 동안 active series 수가 증가하여 active series limits에 도달합니다. 자세한 내용은 AMP할당량을 참조하십시오.

Kubernetes는 자체 클러스터 레이블이 있는 것 같고 메트릭의 중복을 제거하지는 않습니다. 이 문제를 해결하려면 어떻게 해야 하나요?

쿠버네티스 1.28에 레이블이 붙은 새 메트릭이 apiserver_storage_size_bytes 도입되었습니다. cluster 이로 인해 Prometheus용 Amazon Managed Service for Prometheus의 중복 제거에 문제가 발생할 수 있으며, 이 문제는 레이블에 따라 다릅니다. cluster Kubernetes 1.3에서는 레이블 이름이 로 변경됩니다 storage-cluster_id (이후 패치 1.28 및 1.29에서는 이름도 변경됨). 클러스터가 cluster 레이블과 함께 이 지표를 내보내는 경우 Prometheus용 Amazon Managed Service에서는 관련 시계열을 중복 제거할 수 없습니다. 이 문제를 방지하려면 Kubernetes 클러스터를 최신 패치 버전으로 업그레이드하는 것이 좋습니다. 또는, Amazon Managed Service for cluster Prometheus에 수집하기 전에 apiserver_storage_size_bytes 메트릭의 레이블을 다시 지정할 수도 있습니다.

참고

쿠버네티스 변경에 대한 자세한 내용은 쿠버네티스 프로젝트의 apiserver_storage_size_bytes 지표에 대한 레이블 클러스터 이름을 storage_cluster_id로 변경을 참조하십시오. GitHub