OPS08-BP03 워크로드 추적 데이터 분석
추적 데이터를 분석하는 것은 애플리케이션의 운영 여정을 포괄적으로 파악하는 데 매우 중요합니다. 다양한 구성 요소 간의 상호 작용을 시각화하고 이해함으로써 성능을 미세 조정하고 병목 현상을 식별하며 사용자 경험을 개선할 수 있습니다.
원하는 성과: 애플리케이션의 분산 운영에 대한 명확한 가시성을 확보하여 더 빠른 문제 해결과 향상된 사용자 경험을 제공합니다.
일반적인 안티 패턴:
-
로그와 지표에만 의존하고 추적 데이터는 간과합니다.
-
추적 데이터를 관련 로그와 연관시키지 않습니다.
-
지연 시간 및 장애율과 같은 추적에서 도출된 지표를 무시합니다.
이 모범 사례 확립의 이점:
-
문제 해결을 개선하고 평균 문제 해결 시간(MTTR)을 줄입니다.
-
종속성과 그 영향에 대한 인사이트를 얻습니다.
-
성능 문제를 신속하게 식별하고 수정합니다.
-
정보에 입각한 의사 결정을 위해 추적에서 도출된 지표를 활용합니다.
-
최적화된 구성 요소 상호 작용을 통해 사용자 경험을 개선합니다.
이 모범 사례가 확립되지 않을 경우 노출되는 위험 수준: 중간
구현 가이드
AWS X-Ray
구현 단계
아래 단계는 AWS 서비스를 사용하여 추적 데이터 분석을 효과적으로 구현하기 위한 체계적인 접근 방식을 제공합니다.
-
AWS X-Ray 통합: 애플리케이션과 X-Ray가 통합되어 추적 데이터를 캡처할 수 있도록 보장합니다.
-
X-Ray 지표 분석: 서비스 맵으로 애플리케이션 상태를 모니터링하여 지연 시간, 요청률, 장애율, 응답 시간 분포와 같은 X-Ray 추적에서 파생된 지표를 자세히 살펴봅니다.
-
ServiceLens 사용: ServiceLens 맵을 활용하여 서비스 및 애플리케이션의 관찰성을 개선합니다. 이를 통해 추적, 지표, 로그, 경보 및 기타 건강 정보를 통합적으로 볼 수 있습니다.
-
X-Ray Insights 활성화:
-
추적에서 자동 이상 탐지를 위해 X-Ray Insights를 켭니다.
-
인사이트를 검토하여 패턴을 정확히 찾아내고 장애율 또는 지연 시간 증가와 같은 근본 원인을 파악합니다.
-
인사이트 타임라인을 참조하여 감지된 문제를 시간순으로 분석합니다.
-
-
X-Ray Analytics 사용: X-Ray Analytics를 사용하면 추적 데이터를 철저히 탐색하고, 패턴을 정확히 찾아내며, 인사이트를 추출할 수 있습니다.
-
X-Ray에서 그룹 사용: X-Ray에서 그룹을 생성하여 높은 지연 시간과 같은 기준에 따라 추적을 필터링하여 보다 표적화된 분석을 수행할 수 있습니다.
-
Amazon DevOps Guru 통합: Amazon DevOps Guru
를 통해 추적에서 운영 이상을 찾아내는 기계 학습 모델의 이점을 활용합니다. -
CloudWatch Synthetics 사용: CloudWatch Synthetics를 사용하여 엔드포인트 및 워크플로를 지속적으로 모니터링하기 위한 canary를 생성합니다. 이러한 canary를 X-Ray와 통합하여 테스트 대상 애플리케이션의 심층 분석을 위한 추적 데이터를 제공할 수 있습니다.
-
실제 사용자 모니터링(RUM) 사용: AWS X-Ray 및 CloudWatch RUM을 사용하면 애플리케이션의 최종 사용자부터 시작하여 다운스트림 AWS 관리형 서비스까지 요청 경로를 분석하고 디버그할 수 있습니다. 이를 통해 최종 사용자에게 영향을 미치는 지연 시간 추세와 오류를 파악할 수 있습니다.
-
로그와의 상관관계 파악: 애플리케이션 동작을 세부적으로 파악할 수 있도록 X-Ray 추적 보기 내에서 추적 데이터와 관련 로그의 상관관계를 분석합니다. 이렇게 하면 추적된 트랜잭션과 직접 관련된 로그 이벤트를 볼 수 있습니다.
-
CloudWatch 크로스 계정 관찰성 구현: 한 리전 내 여러 계정에 걸쳐 있는 애플리케이션을 모니터링하고 문제를 해결합니다.
구현 계획의 작업 수준: 중간
리소스
관련 모범 사례:
관련 문서:
관련 비디오:
관련 예제: