DevOps Guru 개념 - 아마존 DevOps 전문가

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

DevOps Guru 개념

다음은 Amazon DevOps Guru의 작동 방식을 이해하는 데 필요한 중요한 개념입니다.

이상 항목

이상 항목은 DevOps Guru에서 감지한 예상치 못하거나 비정상적인 하나 이상의 관련 지표를 나타냅니다. DevOps Guru는 기계 학습을 사용하여 AWS 리소스와 관련된 메트릭과 운영 데이터를 분석함으로써 이상 항목을 생성합니다. Amazon DevOps Guru를 설정할 때 분석할 AWS 리소스를 지정합니다. 자세한 내용은 아마존 DevOps 전문가 설정 섹션을 참조하세요.

인사이트

인사이트는 DevOps Guru를 설정할 때 지정한 AWS 리소스를 분석하는 동안 생성되는 이상 항목 모음입니다. 각 인사이트에는 운영 성과를 개선하는 데 사용할 수 있는 관찰, 권장 사항, 분석 데이터가 포함되어 있습니다. 다음과 같은 두 가지 유형의 인사이트가 있습니다.

  • 사후 대응:사후 대응 인사이트는 비정상적인 동작이 발생하는 즉시 이를 식별합니다. 여기에는 현재 문제를 이해하고 해결하는 데 도움이 되는 권장 사항, 관련 지표, 이벤트와 같은 이상 항목이 포함되어 있습니다.

  • 사전 예방:사전 예방 인사이트를 통해 문제가 발생하기 전에 문제를 일으킬 수 있는 행동을 파악할 수 있습니다. 여기에는 이상 항목이 문제가 발생할 것으로 예측되기 전에 문제를 해결하는 데 도움이 되는 권장 사항과 함께 포함되어 있습니다.

지표 및 운영 이벤트

인사이트를 구성하는 이상 항목은 Amazon CloudWatch에서 반환한 지표와 AWS 리소스에서 내보낸 운영 이벤트를 분석하여 생성됩니다. 애플리케이션에 있는 문제를 더 잘 이해하는 데 도움이 되는 인사이트를 생성하는 지표와 운영 이벤트를 볼 수 있습니다.

로그 그룹 및 로그 이상 항목

로그 이상 항목 감지를 활성화하면 DevOps Guru 콘솔의 DevOps Guru 인사이트 페이지에 관련 로그 그룹이 표시됩니다. 로그 그룹을 통해 리소스의 수행 및 액세스 방식에 대한 중요한 진단 정보를 알 수 있습니다.

로그 이상 항목은 로그 그룹 내에서 발견된 유사한 이상 항목 로그 이벤트의 클러스터를 나타냅니다. DevOps Guru에 표시될 수 있는 비정상적인 로그 이벤트의 예로는 키워드 이상, 형식 이상, HTTP 코드 이상 등이 있습니다.

로그 이상 항목을 사용하여 운영 문제의 근본 원인을 진단할 수 있습니다. 또한, DevOps Guru는 인사이트 권장 사항에 있는 로그 라인을 참조하여 권장되는 해결책에 대한 더 많은 컨텍스트를 제공합니다.

참고

DevOps Guru는 Amazon CloudWatch와 함께 작동하여 로그 이상 항목 감지를 지원합니다. 로그 이상 항목 감지를 활성화하면 DevOps Guru가 CloudWatch 로그 그룹에 태그를 추가합니다. 로그 이상 항목 감지를 끄면 DevOps Guru는 CloudWatch 로그 그룹에서 태그를 제거합니다.

또한, 관리자는 CloudWatch 로그를 볼 수 있는 권한이 있는 사용자만 비정상적인 CloudWatch 로그를 볼 수 있는 권한을 갖도록 해야 합니다. IAM 정책을 사용하여 ListAnomalousLogs 작업에 대한 액세스를 허용하거나 거부하는 것을 권장합니다. 자세한 내용은 DevOps Guru의 자격 증명 및 액세스 관리를 참조하십시오.

권장 사항

각 인사이트는 애플리케이션 성능을 개선하는 데 도움이 되는 제안 사항과 함께 권장 사항을 제공합니다. 권장 사항에는 다음과 같은 내용이 포함됩니다.

  • 인사이트를 구성하는 이상 항목을 해결하기 위한 권장 사항 조치에 대한 설명.

  • DevOps Guru가 비정상적인 동작을 발견한 분석된 지표 목록. 각 지표에는 메트릭과 관련된 리소스를 생성한 AWS CloudFormation 스택의 이름, 리소스 이름, 리소스와 관련된 AWS 서비스 이름이 포함됩니다.

  • 인사이트와 연결된 비정상적인 지표와 관련된 이벤트 목록. 관련된 각각의 이벤트에는 이벤트와 관련된 리소스를 생성한 AWS CloudFormation 스택의 이름, 이벤트를 생성한 리소스의 이름, 이벤트와 관련된 AWS 서비스의 이름이 포함됩니다.

  • 인사이트와 연결된 이상 동작과 관련된 로그 그룹 목록. 각 로그 그룹에는 샘플 로그 메시지, 보고된 로그 이상 항목 유형에 대한 정보, 로그 이상 항목이 발생한 시간, CloudWatch에서 로그 라인을 볼 수 있는 링크가 포함되어 있습니다.