

 **이 페이지 개선에 도움 주기** 

이 사용자 가이드에 기여하려면 모든 페이지의 오른쪽 창에 있는 **GitHub에서 이 페이지 편집** 링크를 선택합니다.

# 관찰성 대시보드를 사용하여 클러스터 모니터링
<a name="observability-dashboard"></a>

Amazon EKS 콘솔에는 클러스터의 성능에 대한 가시성을 제공하는 관찰성 대시보드가 포함되어 있습니다. 제공되는 정보는 문제를 신속하게 탐지하고 해결하는 데 도움이 됩니다. **상태 및 성능 요약**에서 항목을 선택하여 관찰성 대시보드의 해당 섹션을 열 수 있습니다. 이 요약은 **관찰성** 탭을 포함하여 여러 곳에 포함되어 있습니다.

관찰성 대시보드는 여러 탭으로 나뉩니다.

## 요약
<a name="observability-summary"></a>

**상태 및 성능 요약**에는 다양한 범주의 항목 수량이 나열됩니다. 각 숫자는 해당 범주의 목록이 있는 관찰성 대시보드의 위치에 대한 하이퍼링크 역할을 합니다.

## 클러스터 상태
<a name="observability-cluster-health"></a>

 **클러스터 상태**는 알아야 할 중요한 알림을 제공하며, 그 중 일부는 가능한 한 빨리 조치가 필요할 수 있습니다. 이 목록을 사용하면 설명과 영향을 받는 리소스를 볼 수 있습니다. 클러스터 상태에는 **상태 문제**와 **구성 인사이트**라는 2개의 테이블이 포함됩니다. **상태 문제**의 상태를 새로 고치려면 새로 고침 버튼( ↻ )을 선택합니다. **구성 인사이트**는 24시간마다 한 번씩 자동으로 업데이트되며 수동으로 새로 고칠 수 없습니다.

**상태 문제**에 대한 자세한 내용은 [클러스터 상태 FAQ 및 오류 코드(해결 경로 포함)](troubleshooting.md#cluster-health-status) 섹션을 참조하세요. **구성 인사이트**에 대한 자세한 내용은 [클러스터 인사이트를 사용한 Kubernetes 버전 업그레이드 준비 및 잘못된 구성 문제 해결](cluster-insights.md) 섹션을 참조하세요.

## 컨트롤 플레인 모니터링
<a name="observability-control-plane"></a>

**컨트롤 플레인 모니터링** 탭은 세 개의 섹션으로 나뉘며, 각 섹션은 클러스터의 컨트롤 플레인을 모니터링하고 문제를 해결하는 데 도움이 됩니다.

### 지표
<a name="observability-metrics"></a>

Kubernetes 버전 `1.28` 이상인 클러스터의 경우 **지표** 섹션에는 다양한 컨트롤 플레인 구성 요소에 대해 수집된 여러 지표의 그래프가 표시됩니다.

섹션 상단에서 선택하여 모든 그래프의 X축에 사용되는 기간을 설정할 수 있습니다. 새로 고침 버튼( ↻ )을 사용하여 데이터를 새로 고칠 수 있습니다. 개별 그래프에 대해 세로 줄임표 버튼( ⋮ )은 CloudWatch의 옵션이 있는 메뉴를 엽니다.

이러한 지표 등은 CloudWatch의 `AWS/EKS` 네임스페이스에서 기본 모니터링 지표로 자동으로 사용 가능합니다. 자세한 내용은 *Amazon CloudWatch 사용 설명서*에서 [기본 모니터링 및 세부 모니터링](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/cloudwatch-metrics-basic-detailed.html)을 참조하세요. 자세한 지표, 시각화, 인사이트는 *Amazon CloudWatch 사용 설명서*에서 [Container Insights](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/ContainerInsights.html)를 참조하세요. 또는 Prometheus 기반 모니터링을 선호하는 경우 [Prometheus를 사용한 클러스터 지표 모니터링](prometheus.md) 섹션을 참조하세요.

다음 표에서는 이용 가능한 지표를 설명합니다.


| 지표 | 설명 | 
| --- | --- | 
|  APIServer 요청  |  API 서버에 대한 분당 요청 수입니다.  | 
|  APIServer 총 요청 4XX  |  HTTP 4XX 응답 코드(클라이언트 측 오류)가 있는 분당 API 서버 요청 수입니다.  | 
|  APIServer 총 요청 5XX  |  HTTP 5XX 응답 코드(서버 측 오류)가 있는 분당 API 서버 요청 수입니다.  | 
|  APIServer 총 요청 429  |  HTTP 429 응답 코드(요청이 너무 많음)가 있는 분당 API 서버 요청 수입니다.  | 
|  스토리지 크기  |  스토리지 데이터베이스(`etcd`) 크기입니다.  | 
|  스케줄러 시도  |  '예약 불가' '오류', '예약됨' 결과를 기준으로 포드를 예약하려는 시도 횟수입니다.  | 
|  보류 중인 포드  |  '활성', '백오프', '예약 불가', '제한적'의 대기 유형별로 구분한 대기 중인 포드 수입니다.  | 
|  API 서버 요청 지연 시간  |  API 서버 요청의 지연 시간입니다.  | 
|  API 서버 현재 진행 중인 요청  |  API 서버에 대한 현재 전송 중 요청입니다.  | 
|  웹후크 요청  |  분당 웹후크 요청 수입니다.  | 
|  웹후크 요청 거부  |  거부된 웹후크 요청 수입니다.  | 
|  웹후크 요청 지연 시간 P99  |  외부 타사 웹후크 요청의 99번째 백분위수 지연 시간입니다.  | 

### CloudWatch Log Insights
<a name="observability-log-insights"></a>

**CloudWatch Log Insights** 섹션에는 컨트롤 플레인 감사 로그를 기반으로 하는 다양한 목록이 표시됩니다. 이 기능을 사용하려면 **CloudWatch의 컨트롤 플레인 로그 보기** 섹션에서 Amazon EKS 컨트롤 플레인 로그를 활성화해야 합니다.

데이터를 수집하는 데 충분한 시간이 경과하면 **모든 쿼리를 실행**하거나 한 번에 단일 목록에 대한 **쿼리 실행**을 선택할 수 있습니다. 쿼리를 실행할 때마다 CloudWatch에서 추가 비용이 발생합니다. 섹션 상단에서 확인할 결과의 기간을 선택합니다. 쿼리에 대한 고급 제어를 원하는 경우 **CloudWatch에서 보기**를 선택할 수 있습니다. 이렇게 하면 필요에 따라 CloudWatch에서 쿼리를 업데이트할 수 있습니다.

자세한 내용은 Amazon CloudWatch Logs 사용 설명서에서 [CloudWatch Logs Insights를 사용한 로그 데이터 분석](https://docs.aws.amazon.com/AmazonCloudWatch/latest/logs/AnalyzingLogData.html)을 참조하세요.

### CloudWatch에서 컨트롤 플레인 로그 확인
<a name="observability-cp-logs"></a>

**로깅 관리**를 선택하여 사용 가능한 로그 유형을 업데이트합니다. 로깅을 활성화한 후 CloudWatch Logs에 로그가 표시되는 데 몇 분 정도 걸립니다. 충분한 시간이 지나면이 섹션의 **보기** 링크 중 하나를 선택하여 해당 로그로 이동합니다.

자세한 내용은 [CloudWatch Logs에 컨트롤 플레인 로그 전송](control-plane-logs.md) 섹션을 참조하세요.

## 클러스터 인사이트
<a name="observability-cluster-insights"></a>

**업그레이드 인사이트** 표는 문제를 모두 표시하고 수정 조치를 권장하며, 새 Kubernetes 버전으로 업그레이드하기 위한 검증 프로세스를 가속화합니다. Amazon EKS는 문제에 영향을 미치는 가능한 Kubernetes 버전 업그레이드 목록을 대상으로 클러스터를 자동으로 스캔합니다. **업그레이드 인사이트** 표에는 이 클러스터에 대해 Amazon EKS에서 수행한 인사이트 확인과 관련 상태가 나열됩니다.

Amazon EKS는 Kubernetes 프로젝트의 변경 사항 및 새 버전과 연결된 Amazon EKS 서비스 변경 사항에 대한 평가를 기반으로 수행할 인사이트 검사 목록을 유지 관리하고 주기적으로 새로 고칩니다. Amazon EKS 콘솔은 마지막 새로 고침 시간 열에서 볼 수 있는 각 인사이트의 상태를 자동으로 새로 고칩니다.

자세한 내용은 [클러스터 인사이트를 사용한 Kubernetes 버전 업그레이드 준비 및 잘못된 구성 문제 해결](cluster-insights.md) 섹션을 참조하세요.

## 노드 상태 문제
<a name="observability-node-health-issues"></a>

Amazon EKS 노드 모니터링 에이전트는 노드 로그를 자동으로 읽어 상태 문제를 감지합니다. 자동 복구 설정과 관계없이 필요에 따라 조사할 수 있도록 모든 노드 상태 문제가 보고됩니다. 문제 유형이 설명 없이 나열된 경우 해당 팝오버 요소에서 설명을 읽을 수 있습니다.

페이지를 새로 고치면 해결된 문제가 목록에서 사라집니다. 자동 복구가 활성화된 경우 일부 상태 문제가 일시적으로 표시될 수 있으며, 이 문제는 사용자의 조치 없이 해결됩니다. 자동 복구로 지원되지 않는 문제는 유형에 따라 수동 작업이 필요할 수 있습니다.

노드 상태 문제를 보고하려면 클러스터가 Amazon EKS Auto Mode를 사용하거나 노드 모니터링 에이전트 추가 기능이 있어야 합니다. 자세한 내용은 [노드 상태 문제 감지 및 노드 자동 복구 활성화](node-health.md) 섹션을 참조하세요.

## EKS 기능
<a name="observability-capabilities"></a>

**기능** 섹션에서는 클러스터에 있는 EKS 기능 리소스의 상태를 표시합니다. 여기에서 클러스터에 있는 기능 및 관리형 Kubernetes 리소스 모두에 대한 상태 알림을 모니터링할 수 있습니다. 페이지를 새로 고치면 해결된 문제가 목록에서 사라집니다.

자세한 내용은 [기능 리소스 작업](working-with-capabilities.md) 섹션을 참조하세요.