View a markdown version of this page

CloudWatch RUM 대시보드 보기 - Amazon CloudWatch

CloudWatch RUM 대시보드 보기

CloudWatch RUM은 대화형 대시보드를 통해 사용자 세션에서 애플리케이션 성능 데이터를 수집하고 시각화합니다. 팀은 로드 시간, Apdex 점수, 디바이스 정보, 지리적 위치 및 오류 패턴을 캡처하여 성능 병목 현상을 신속하게 식별하고, 실제 사용자 영향을 기반으로 수정의 우선순위를 지정하며, 다양한 브라우저, 디바이스 및 지리 기반 리전에서 최적의 경험을 보장할 수 있으므로 조직이 사용자 행동을 더 잘 이해하여 최종 사용자의 불만을 줄이고 애플리케이션 신뢰성을 개선할 수 있습니다.

CloudWatch RUM 시작하기

  1. https://console.aws.amazon.com/cloudwatch/에서 CloudWatch 콘솔을 엽니다.

  2. 탐색 창에서 Application Signals(APM), RUM을 선택하세요.

RUM 콘솔에는 모든 앱 모니터, 해당 상태 및 주요 운영 지표에 대한 통합 보기를 제공하는 개요 페이지가 표시됩니다. 개요 페이지에서 앱 모니터를 선택하여 성능, 오류, 세션, 지표, 구성 탭을 포함하는 세부 보기에 액세스합니다.

개요

개요 페이지는 CloudWatch RUM 콘솔의 랜딩 페이지입니다. 모든 애플리케이션 모니터에 대한 개략적인 요약을 제공하므로 모니터링되는 여러 애플리케이션의 상태, 성능 추세 및 운영 범위를 신속하게 평가할 수 있습니다.

요약 카드, 빠른 필터 및 앱 모니터 표를 보여주는 RUM 개요 페이지

요약 카드

개요 페이지 상단에 있는 4개의 요약 카드에서는 모든 앱 모니터에 대해 한 눈에 볼 수 있는 운영 상태를 제공합니다.

  • 주의 필요(상태별) - 총계를 기준으로 주의가 필요한 앱 모니터 수(중요성능 저하 수로 구분)를 표시합니다. 진행률 표시줄은 주의가 필요한 모니터의 비율을 나타냅니다.

  • 악화 추세 - 총계를 기준으로 악화 추세를 보이는 앱 모니터 수를 표시합니다.

  • 설정 및 적용 범위 - 구성된 SLO가 없는 앱 모니터 수와 추적이 비활성화된 앱 모니터 수를 표시합니다. 이를 통해 모니터링 설정의 격차를 식별할 수 있습니다.

  • SLO 및 경보 - 총 SLI를 기반으로 위반된 SLI 수와 현재 실행 중인 경보 수를 표시합니다.

빠른 필터

왼쪽 패널에서는 다음을 기준으로 애플리케이션 목록의 범위를 좁히기 위한 빠른 필터를 제공합니다.

  • 플랫폼 - 웹, iOS 또는 Android.

  • 상태 - 정상, 중요, 성능 저하 또는 데이터 없음.

  • SLI 상태 - 정상, 비정상 또는 SLO 없음.

  • 추적 - 활성화됨 또는 비활성화됨.

  • 추세 - 악화, 개선 또는 안정.

  • 기본 문제 - 앱 모니터에 영향을 미치는 기본 문제 유형을 기준으로 필터링합니다.

모든 필터를 재설정하려면 필터 지우기를 선택합니다.

앱 모니터 표

앱 모니터 표에는 다음 열과 함께 모든 앱 모니터가 나열됩니다.

  • 이름 - 플랫폼 아이콘(웹, iOS 또는 Android)과 함께 표시되는 앱 모니터의 이름입니다.

  • 세션 - 선택한 시간 범위에 레코딩된 세션 수로, 막대 차트 시각화와 함께 표시됩니다.

  • SLI 상태 - 서비스 수준 표시기의 상태입니다. 비정상 SLI 수(예: '1/2 비정상') 또는 구성된 SLO가 없는 경우 SLO 생성 링크를 표시합니다.

  • 상태 - 애플리케이션의 상태: 정상, 중요, 성능 저하 또는 데이터 없음.

  • 인사이트 보기 - 이 링크를 선택하여 앱 모니터의 진단 사이드 패널을 엽니다(진단 사이드 패널 참조).

  • 기본 문제 - 애플리케이션에 영향을 미치는 기본 문제 유형입니다. 앱 모니터의 경우 값에는 JS 오류, 성능 또는 HTTP 오류/결함이 포함됩니다. 모바일 앱 모니터의 경우 값에는 충돌, ANR/앱 중단, 성능 또는 HTTP 오류/결함이 포함됩니다.

  • 추세 - 추세의 방향 및 규모에 대한 설명(예: 'JS 오류 +1% 악화된 세션' 또는 '성능 +81% 악화된 세션')입니다.

  • 추적 - 추적이 활성화된 경우 추적 보기 링크 또는 활성화되지 않은 경우 추적 활성화 링크입니다.

  • 서비스 - 연결된 서비스의 SLI 상태(예: '1/1 비정상') 또는 연결된 서비스가 없는 경우 대시를 표시합니다.

  • 마지막 이벤트 수신 - 마지막 원격 측정 이벤트가 수신된 이후 시간(예: '1분 전' 또는 '지난 4주 동안 수신된 이벤트 없음')입니다.

표 위의 검색 표시줄을 사용하여 이름으로 특정 앱 모니터를 찾습니다. 열 헤더를 클릭하여 표를 정렬하고 톱니 아이콘을 사용하여 표시되는 열을 사용자 지정할 수 있습니다. 작업 드롭다운 및 앱 모니터 추가 버튼을 사용하면 이 페이지에서 직접 앱 모니터를 관리할 수 있습니다.

상태 확인

상태 열에서는 선택한 시간 범위에 총 세션 수를 기준으로 오류가 있거나 페이지 로드가 느린 세션 등 영향을 받는 세션의 백분율에 따라 각 애플리케이션의 운영 상태를 한 눈에 볼 수 있습니다.

각 앱 모니터에는 다음 상태 중 하나가 표시됩니다.

Status 영향을 받는 세션 설명
정상 1% 미만 애플리케이션이 정상 파라미터 내에서 작동 중입니다.
성능 저하 1%~5% 애플리케이션에 오류 비율이 늘었거나 성능이 저하되어 주의가 필요할 수 있습니다.
위험 5% 초과 애플리케이션에 즉각적인 조사가 필요한 심각한 오류 또는 성능 문제가 발생했습니다.
데이터 없음 애플리케이션의 상태를 확인하는 데 사용할 수 있는 데이터가 부족합니다. 이러한 상태는 앱 모니터가 최근 원격 측정 데이터를 수신하지 못한 경우에 나타날 수 있습니다.

진단 사이드 패널

표에서 앱 모니터에 대한 인사이트 보기를 선택하면 페이지 오른쪽에 진단 사이드 패널이 열립니다. 패널에는 앱 모니터 이름이 표시되고 다음과 같은 두 개의 탭이 제공됩니다.

오류 분석 및 지표 그래프가 있는 상태 탭을 보여주는 진단 사이드 패널

상태 탭 - 색상으로 구분된 표시기를 사용하여 상태에 기여하는 오류(예: JS 오류, HTTP 오류(4xx) 및 HTTP 결함(5xx))의 분석을 표시합니다. 지표 섹션에는 대화형 시계열 그래프가 표시됩니다. 그래프에서 한 점을 클릭하여 상관관계가 있는 세션을 봅니다.

앱 모니터의 경우 다음 그래프가 표시됩니다.

  • 페이지 보기 - 시간 경과에 따른 페이지 보기 수입니다.

  • 페이지 로드 시간(p75) - 75번째 백분위수 페이지 로드 시간(초)입니다.

  • JS 오류 - 시간 경과에 따른 JavaScript 오류 세션 수입니다.

  • HTTP 오류 - 시간 경과에 따른 HTTP 4xx 오류 및 5xx 오류 수입니다.

모바일 앱 모니터(Android 및 iOS)의 경우 다음 그래프가 표시됩니다.

  • 화면 로드 시간 - 시간 경과에 따른 화면 로드 시간입니다.

  • 화면 로드 - 시간 경과에 따른 화면 로드 수입니다.

  • 충돌 - 시간 경과에 따른 충돌 세션 수입니다.

  • 앱 중단/ANR - 시간 경과에 따른 앱 중단(iOS) 또는 ANR(Android) 세션 수입니다.

  • HTTP 오류 - 시간 경과에 따른 HTTP 4xx 오류 및 5xx 오류 수입니다.

지표 그래프, 위반된 SLO 수 및 ALARM 상태의 경보 수를 보여주는 진단 사이드 패널

지표 아래에는 다음 패널도 표시됩니다.

  • 위반된 SLO 수 - SLO 세부 정보에 대한 링크와 함께 위반 상태의 모든 SLO를 나열하는 표입니다.

  • ALARM 상태의 경보 - 앱 모니터에 대해 현재 발행된 경보를 나열하는 표입니다.

상관관계가 있는 세션 수 탭 - 지표 그래프에서 선택한 데이터 포인트와 상관관계가 있는 세션을 표시합니다.

웹 애플리케이션 대시보드

웹 애플리케이션 모니터를 선택하면 다음과 같은 탭이 표시됩니다.

  • 성능 탭에는 로드 시간, 요청 정보, 웹 바이탈 및 시간 경과에 따른 페이지 로드를 포함한 페이지 성능 정보가 표시됩니다. 이 탭에서 페이지 로드, 리소스, 위치 사이에서 보기를 전환하여 페이지 성능에 대한 세부 정보도 확인할 수도 있습니다.

    페이즈 로드 보기에서는 대화형 웹 바이탈 그래프를 제공합니다. 여기에서 페이지에 대한 핵심 웹 바이탈의 여러 백분위수 값을 확인하고, 그래프에서 데이터 포인트를 선택하여 CloudWatch RUM에서 캡처한 상관관계가 있는 이벤트를 볼 수 있습니다. 여기에서 진단 표에 있는 링크 중 하나를 사용해 세션 탭으로 이동하여 성능 문제의 원인이 되는 특정 조건을 식별할 수 있습니다. 이 탭에서는 최종 사용자의 만족도를 나타내는 애플리케이션 성능 인덱스(Apdex) 점수도 제공합니다. 점수는 0(최소 만족)부터 1(가장 만족)까지입니다. 점수는 애플리케이션 성능만을 기준으로 합니다. Apdex 점수에 대한 자세한 내용은 CloudWatch RUM에서 Apdex 점수를 설정하는 방법 섹션을 참조하세요. 하단의 표에는 페이지 ID에 기반하여 상위 100개 페이지 로드 시간이 나와 있습니다. 표 헤더 옆의 드롭다운에서 이 속성을 변경할 수 있습니다.

    대화형 웹 바이탈 그래프, Apdex 점수 및 상위 100개 페이지 로드 시간 표가 있는 페이지 로드 보기를 보여주는 성능 탭

    마찬가지로 리소스 보기에는 리소스 요청 시간과 리소스 유형별 수가 표시됩니다. 위치 보기에는 보다 세분화된 보기로 드릴다운하고 특정 리전에서 성능 문제를 조사할 수 있는 대화형 맵이 있습니다.

    리소스 및 위치 보기를 보여주는 성능 탭

    오른쪽의 진단 패널에는 성능 문제와 관련된 상위 5개의 브라우저/디바이스를 보여주는 브라우저디바이스 탭도 있습니다. 막대 차트를 클릭해 세션 탭으로 이동하여 문제를 더 조사할 수 있습니다.

    상위 5개의 관련 브라우저 및 디바이스가 있는 브라우저 및 디바이스 탭을 보여주는 진단 패널
  • JS 오류 탭에는 오류가 가장 많은 브라우저 및 디바이스와 함께 요약 구성 요소의 JavaScript 오류 수와 비율이 표시됩니다. 이 탭에는 JS 오류가 있는 세션 수와 실패율을 보여주는 차트가 포함되어 있습니다. 차트에서 임의의 데이터 포인트를 클릭하여 진단 패널에서 상관관계가 있는 세션을 볼 수 있습니다. 하단의 표에는 상위 100개 JS 오류가 나와 있습니다. 표의 오류 수 링크를 사용하여 관련 세션을 볼 수 있는 세션 탭으로 이동할 수 있습니다.

    오류 수, 실패율 차트, 진단 패널 및 상위 100개의 JS 오류 표를 보여주는 JS 오류 탭
  • Http 요청 탭에서 상단의 HTTP 요청 요약에 는 HTTP 요청 볼륨과 오류 정보가 표시됩니다. 이 탭에는 HTTP 오류, HTTP 결함 및 네트워크 장애를 표시하는 그래프가 포함되어 있습니다. 차트에서 임의의 데이터 포인트를 클릭하여 진단 패널에서 상관관계가 있는 세션을 볼 수 있습니다. 하단의 표에는 문제가 있는 상위 100개의 네트워크 경로가 나와 있습니다. 행 중 하나를 확장하면 해당 URL에 대한 상위 오류 메시지를 확인할 수 있습니다. 표의 오류 수 링크를 사용하여 관련 세션을 볼 수 있는 세션 탭으로 이동할 수 있습니다.

    요청 요약, 오류 그래프, 진단 패널 및 상위 100개의 네트워크 라우팅 테이블을 보여주는 HTTP 요청 탭
  • 세션 탭에는 모든 세션을 시간별 내림차순으로 나열하는 테이블이 표시됩니다. 하단의 폭포 시각화는 선택한 세션의 모든 원격 분석을 보여주므로, 사용자 상호 작용을 추적하고 성능 문제를 식별하는 데 도움이 됩니다. 오류 열의 오류 링크를 클릭하여 특정 오류 이벤트에 대한 폭포 차트를 필터링할 수 있습니다. 폭포의 각 행을 선택하여 진단 패널을 열 수 있습니다. 여기서 원시 이벤트를 볼 수 있습니다.

    원격 측정 이벤트의 세션 목록 및 폭포 시각화를 보여주는 세션 탭

    HTTP 요청의 경우 추적이 활성화된 경우 추적 콘솔에 연결되는 HTTP 및 Xray 이벤트에 대한 traceId가 표시됩니다. JS 오류 또는 HTTP 오류 이벤트와 같은 이벤트의 경우 진단 패널에는 스택 추적과 함께 예외 탭이 포함되어 있습니다. 폭포의 보기 버튼을 사용하면 이러한 정보에 빠르게 액세스할 수 있습니다.

    traceId 링크와 스택 추적을 포함한 예외 탭을 보여주는 세션 진단 패널
  • 사용자 여정(User Journey) 탭에는 고객이 애플리케이션을 탐색하는 데 사용하는 경로가 표시됩니다. 고객이 애플리케이션에 들어가는 위치와 애플리케이션을 종료하는 페이지를 확인할 수 있습니다. 또한 고객이 사용하는 경로와 해당 경로를 따르는 고객의 비율도 확인할 수 있습니다. 노드에서 일시 중지하여 해당 페이지에 대한 세부 정보를 확인할 수 있습니다. 단일 경로를 선택하여 더 쉽게 볼 수 있도록 연결을 강조 표시할 수 있습니다. 페이지에는 기본적으로 두 번째 상호 작용까지의 사용자 여정이 표시됩니다. 경로 추가 버튼을 클릭하여 추가 상호 작용을 볼 수 있습니다.

    경로 추가 버튼과 함께 탐색 경로를 보여주는 사용자 여정 탭
  • 지표 탭에는 성능 웹 바이탈, 오류 지표(JavaScript 오류, HTTP 오류/장애), 볼륨, 사용자 흐름 및 apdex 지표를 비롯하여 앱 모니터에서 게시한 모든 기본 CloudWatch 지표가 표시됩니다. 애플리케이션에 대한 확장 지표를 생성한 경우, 탭에는 확장 지표 섹션에 있는 이러한 지표의 하위 집합도 포함됩니다. 이 하위 집합에는 PageViewCount, PerformanceNavigationDuration, Http4xxCount, Http5xxCount, JsErrorCount 유형의 지표가 포함됩니다. 대시보드에는 지표 유형당 3가지 지표 변형이 표시됩니다. 이는 CloudWatch 지표이므로 대시보드에 추가 옵션을 사용하면 이 탭을 사용자의 고유한 대시보드로 내보낸 후 더 많은 지표를 포함하도록 업데이트할 수도 있습니다.

    앱 모니터에서 게시한 기본 및 확장 CloudWatch 지표를 보여주는 지표 탭

(선택 사항) 처음 5개 탭 중 하나에서 상단의 필터 막대를 사용해 사용자 ID, 세션 ID 및 기타 이벤트 특정 필터를 기반으로 데이터를 필터링할 수 있습니다. 왼쪽의 빠른 필터 패널을 사용하여 페이지 ID, 페이지 그룹, 디바이스, 브라우저, 위치와 같은 속성의 하위 집합을 필터링할 수도 있습니다. 이러한 필터는 필터 저장 옵션을 사용하여 저장할 수 있으며 필터 막대 옆의 필터 선택 드롭다운을 사용하여 재사용할 수 있습니다.

빠른 필터 패널, 필터 저장 옵션 및 필터 선택 드롭다운이 있는 필터 막대

모바일 애플리케이션 대시보드

모바일 애플리케이션 모니터를 선택하면 다음과 같은 탭이 표시됩니다.

  • 성능 탭에서는 화면 로드 시간, 앱 시작 시간(콜드/웜), 성능 지표, 시간 경과에 따른 Apdex 점수 등 모바일 애플리케이션의 성능에 대한 인사이트를 제공합니다. 세부 보기에서는 화면 이름, OS 버전, 앱 버전, 디바이스, 국가별로 성능을 분류합니다. 차트에서 화면 로드 시간, 앱 시작 시간 또는 위치 데이터 포인트를 클릭하면 오른쪽에 진단 패널이 열립니다. 이 패널에서는 데이터 포인트와 관련된 추가 인사이트를 제공하는데, 이러한 데이터 포인트는 상관관계가 있는 최신 세션 및 세션 탭 연결 링크로 구성되어 문제 해결을 지원합니다.

    이 탭에서 화면 로드, 요청, 위치를 번갈아 전환하여 보면서 애플리케이션 성능에 대한 자세한 내용도 확인할 수도 있습니다.

    이 탭에서는 최종 사용자의 만족도를 나타내는 애플리케이션 성능 인덱스(Apdex) 점수도 제공합니다. 점수는 0(최소 만족)부터 1(가장 만족)까지입니다. 점수는 애플리케이션 성능만을 기준으로 합니다. Apdex 점수에 대한 자세한 내용은 CloudWatch RUM에서 Apdex 점수를 설정하는 방법 섹션을 참조하세요.

    진단 패널과 함께 화면 로드 시간, 앱 시작 시간 및 Apdex 점수를 보여주는 모바일 성능 탭
  • 오류 탭에서는 애플리케이션 문제를 네트워크 오류, 충돌, ANR(Android)/앱 중단(iOS)이라는 3가지 범주로 분류합니다. 네트워크 오류 탭에는 네트워크 지연 시간, 클라이언트 오류(4xx 상태 코드), 서버 오류(5xx 상태 코드)를 보여주는 선 차트가 있습니다. 차트에서 이러한 선에 대한 데이터 포인트를 클릭하면 진단 패널이 열립니다. 아래 표에는 가장 일반적인 네트워크 경로 100개가 나열되어 있습니다. 라디오 버튼을 클릭하면 선택한 네트워크 경로를 기준으로 선 차트가 필터링됩니다.

    이와 마찬가지로, 충돌ANRs/App Hangs 탭에는 각 오류의 개수에 대한 선 시리즈가 표시되며, 이를 추출할 수 있습니다. 아래 표에는 가장 일반적인 주요 충돌 메시지 또는 ANR/앱 중단 스택 트레이스가 나와 있습니다. 라디오 버튼을 클릭하면 차트가 필터링되고, 오류 메시지를 클릭하면 전체 스택 트레이스가 표시됩니다.

    진단 패널과 함께 네트워크 오류, 충돌 및 ANR/앱 중단 카테고리를 보여주는 모바일 오류 탭
  • 세션 탭에는 모든 세션을 시간별 내림차순으로 나열하는 테이블이 표시됩니다. 하단의 폭포 시각화는 선택한 세션의 모든 원격 분석을 보여주므로, 사용자 상호 작용을 추적하고 성능 문제를 식별하는 데 도움이 됩니다. 폭포의 각 행을 선택하여 진단 패널을 열 수 있습니다. HTTP 요청의 경우 트레이스 콘솔에 연결되는 traceId가 표시됩니다.

    2xx가 아닌 상태 코드, 충돌 또는 ANR(Android)/앱 중단(iOS)이 발생한 HTTP 요청의 경우, 진단 패널에는 스택 트레이스가 있는 예외 탭이 포함됩니다. 폭포의 보기 버튼을 사용하면 이러한 정보에 빠르게 액세스할 수 있습니다.

    traceId 및 예외 탭과 함께 폭포 시각화 및 진단 패널을 보여주는 모바일 세션 탭
  • 지표 탭에는 성능 지표(화면 로드 시간, 콜드 앱 시작 시간), 오류 지표(충돌, ANR/앱 중단, HTTP 오류/장애), 볼륨 및 apdex 지표를 비롯하여 앱 모니터에서 게시한 모든 기본 CloudWatch 지표가 표시됩니다. 애플리케이션에 대한 확장 지표를 생성한 경우, 탭에는 확장 지표 섹션에 있는 이러한 지표의 하위 집합도 포함됩니다. 이 하위 집합에는 ScreenLoadTime, ScreenLoadCount, CrashCount, Http4xxCount, Http5xxCount, ANRCount/AppHangCount, ColdLaunchTime, WarmLaunchTime 유형의 지표가 포함됩니다. 대시보드에는 지표 유형당 3가지 지표 변형이 표시됩니다. 이는 CloudWatch 지표이므로 대시보드에 추가 옵션을 사용하면 이 탭을 사용자의 고유한 대시보드로 내보낸 후 더 많은 지표를 포함하도록 업데이트할 수도 있습니다.

  • 구성 탭에서는 앱 모니터의 일반 설정 및 구성 세부 정보에 액세스할 수 있습니다. 또한 코드 조각 탭에 액세스할 수 있습니다. 이 탭에는 수동 계측 및 제로 코드 계측 옵션을 비롯하여, ADOT SDK를 사용해 모바일 애플리케이션을 계측하기 위한 지침이 포함되어 있습니다.

CloudWatch RUM에서 Apdex 점수를 설정하는 방법

Apdex(애플리케이션 성능 인덱스)는 애플리케이션 응답 시간을 보고, 벤치마크 및 평가하기 위한 방법을 정의하는 개방형 표준입니다. Apdex 점수는 시간이 지남에 따라 애플리케이션 성능에 미치는 영향을 이해하고 식별하는 데 도움이 됩니다.

Apdex 점수는 최종 사용자의 만족도를 나타냅니다. 점수는 0(최소 만족)부터 1(가장 만족)까지입니다. 점수는 애플리케이션 성능만을 기준으로 합니다. 사용자에게 애플리케이션을 평가하라는 메시지가 표시되지 않습니다.

각 Apdex 점수는 세 가지 임곗값 중 하나에 해당합니다. Apdex 임곗값과 실제 애플리케이션 응답 시간에 따라 다음과 같은 세 가지 종류의 성능이 있습니다.

  • 만족 - 실제 애플리케이션 응답 시간이 Apdex 임곗값 이하입니다. CloudWatch RUM의 경우 이 임곗값은 2,000ms 이하입니다.

  • 나쁘지 않음 - 실제 애플리케이션 응답 시간이 Apdex 임곗값보다 크지만 Apdex 임곗값의 4배 이하입니다. CloudWatch RUM의 경우 이 범위는 2,000~8,000ms입니다.

  • 실망 - 실제 애플리케이션 응답 시간이 Apdex 임곗값의 4배보다 큽니다. CloudWatch RUM의 경우 이 범위는 8,000ms 초과입니다.

총 0~1의 Apdex 점수는 다음 공식을 사용하여 계산됩니다.

(positive scores + tolerable scores/2)/total scores * 100