샘플 포인트를 추적하려면 __replica__ 값을 다른 레이블에 포함해야 하나요?Kubernetes에 자체 클러스터 레이블이 있는 것으로 보이며 내 지표의 중복을 제거하지 않습니다. 해결하려면 어떻게 해야 합니까?

Amazon Managed Service for Prometheus의 고가용성 구성에 대한 일반적인 질문과 답변

샘플 포인트를 추적하려면 replica 값을 다른 레이블에 포함해야 하나요?

고가용성 설정에서 Amazon Managed Service for Prometheus는 Prometheus 인스턴스 클러스터의 리더를 선택하여 데이터 샘플이 중복되지 않도록 합니다. 리더 복제본이 30초 동안 데이터 샘플 전송을 중단하면 Amazon Managed Service for Prometheus는 자동으로 다른 Prometheus 인스턴스를 리더 복제본으로 만들고 새 리더로부터 누락된 데이터를 비롯한 데이터를 수집합니다. 따라서 대답은 '아니요'로, 이 작업은 권장되지 않습니다. 이렇게 하면 다음과 같은 문제가 발생할 수 있습니다.

새 리더를 선택하는 기간 동안 PromQL에서 count를 쿼리하면 예상보다 높은 값이 반환될 수 있습니다.
새 리더를 선택하는 기간 동안 active series 수가 증가하여 active series limits에 도달합니다. 자세한 내용은 AMP 할당량을 참조하세요.

Kubernetes에 자체 클러스터 레이블이 있는 것으로 보이며 내 지표의 중복을 제거하지 않습니다. 해결하려면 어떻게 해야 합니까?

Kubernetes 1.28에 cluster 레이블이 있는 새로운 지표 apiserver_storage_size_bytes가 도입되었습니다. 이로 인해 cluster 레이블에 따라 Amazon Managed Service for Prometheus에서 중복 제거 문제가 발생할 수 있습니다. Kubernetes 1.3에서는 레이블의 이름이 storage-cluster_id로 변경됩니다(이름은 이후 패치인 1.28 및 1.29에서도 변경됩니다). 클러스터가 cluster 레이블이 있는 이 지표를 내보내는 경우 Amazon Managed Service for Prometheus는 연결된 시계열을 중복 제거할 수 없습니다. 이 문제를 방지하려면 Kubernetes 클러스터를 최신 패치 버전으로 업그레이드하는 것이 좋습니다. 또는 Amazon Managed Service for Prometheus에 수집하기 전에 apiserver_storage_size_bytes 지표의 cluster 레이블을 다시 지정할 수 있습니다.

참고

Kubernetes 변경에 대한 자세한 내용은 Kubernetes GitHub 프로젝트의 apiserver_storage_size_bytes 지표에 대한 레이블 클러스터 이름을 storage_cluster_id로 변경을 참조하세요.

javascript가 브라우저에서 비활성화되거나 사용이 불가합니다.

AWS 설명서를 사용하려면 Javascript가 활성화되어야 합니다. 지침을 보려면 브라우저의 도움말 페이지를 참조하십시오.

문서 규칙

Prometheus 커뮤니티 Helm 차트를 사용하여 고가용성 데이터 전송

교차 리전 가용성