Application Signals를 사용하여 애플리케이션의 운영 상태 모니터링 - Amazon CloudWatch

Application Signals를 사용하여 애플리케이션의 운영 상태 모니터링

Application Signals는 평가판 릴리스입니다. 이 기능에 대한 피드백이 있는 경우 app-signals-feedback@amazon.com으로 문의해 주세요.

CloudWatch 콘솔 내에서 Application Signals를 사용하여 애플리케이션의 운영 상태를 모니터링하고 문제를 해결합니다.

  • 애플리케이션 서비스 모니터링 - 일일 운영 모니터링의 일환으로 서비스 페이지를 사용하여 모든 서비스의 요약을 확인합니다. 장애 발생률 또는 지연 시간이 가장 긴 서비스를 확인하고 비정상 서비스 수준 지표(SLI)가 있는 서비스를 확인합니다. 서비스를 선택하여 서비스 세부 정보 페이지를 열고 세부 지표, 서비스 작업, Synthetics canary 및 클라이언트 요청을 확인합니다. 이는 운영 문제의 근본 원인을 해결하고 식별하는 데 도움이 될 수 있습니다.

  • 애플리케이션 토폴로지 검사 - 서비스 맵을 사용하여 클라이언트, Synthetics canary, 서비스 및 종속성 간의 관계를 포함하여 시간 경과에 따른 애플리케이션 토폴로지를 이해하고 모니터링할 수 있습니다. 즉시 서비스 수준 지표(SLI) 상태를 확인하고 호출 볼륨, 장애 발생률, 지연 시간과 같은 주요 지표를 볼 수 있습니다. 드릴다운하여 서비스 세부 정보 페이지에서 더 자세한 정보를 확인합니다.

이러한 페이지를 사용하여 초기 탐지에서 근본 원인 식별에 이르기까지 운영 서비스 상태 문제를 신속하게 해결하는 방법을 보여주는 예제 시나리오를 살펴봅니다.

Application Signals가 운영 상태 모니터링을 활성화하는 방법

Application Signals에 대해 애플리케이션을 활성화하면 애플리케이션 서비스, API 및 해당 종속성이 자동으로 검색되어 서비스, 서비스 세부 정보서비스 맵 페이지에 표시됩니다. Application Signals는 여러 소스에서 정보를 수집하여 서비스 검색 및 운영 상태 모니터링을 활성화합니다.

  • AWS Distro for OpenTelemetry (ADOT) - Application Signals 활성화의 일환으로 OpenTelemetry Java 자동 계측 라이브러리는 CloudWatch 에이전트에서 수집한 지표와 트레이스를 내보내도록 구성됩니다. 지표와 트레이스는 서비스, 운영, 종속성 및 기타 서비스 정보를 검색하는 데 사용됩니다.

  • 서비스 수준 목표(SLO) - 서비스에 대한 서비스 수준 목표를 생성하면 서비스, 서비스 세부 정보 및 서비스 맵 페이지에 서비스 수준 지표(SLI) 상태가 표시됩니다. SLI는 지연 시간, 가용성 및 기타 운영 지표를 모니터링할 수 있습니다.

  • CloudWatch Synthetics canary - canary에서 X-Ray 추적을 구성하면 canary 스크립트에서 서비스에 대한 호출이 서비스와 연결되고 서비스 세부 정보 페이지 내에 표시됩니다.

  • CloudWatch 실제 사용자 모니터링(RUM) - CloudWatch RUM 웹 클라이언트에서 X-Ray 추적을 활성화하면 서비스에 대한 요청이 자동으로 연결되어 서비스 세부 정보 페이지 내에 표시됩니다.

  • AWS Service Catalog AppRegistry - Application Signals는 계정 내에서 AWS 리소스를 자동으로 검색하고 AppRegistry에서 생성된 논리적 애플리케이션으로 그룹화할 수 있도록 합니다. 서비스 페이지에 표시되는 애플리케이션 이름은 서비스가 실행되는 기본 컴퓨팅 리소스를 기반으로 합니다.

참고

Application Signals는 선택한 현재 시간 필터 내에서 내보낸 지표와 트레이스를 기반으로 서비스와 작업을 표시합니다. 기본적으로 지난 3시간입니다. 서비스, 작업, 종속성, Synthetics canary 또는 클라이언트 페이지에 대한 현재 시간 필터 내에 활동이 없는 경우 해당 활동은 표시되지 않습니다.

현재 최대 1,000개의 서비스를 표시할 수 있습니다. 서비스 및 서비스 토폴로지 검색은 최대 10분까지 지연될 수 있습니다. 서비스 수준 지표(SLI) 상태 평가가 최대 15분까지 지연될 수 있습니다.