Amazon을 사용한 로깅 및 모니터링 설계 및 구현 CloudWatch - AWS 규범적 지침

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

Amazon을 사용한 로깅 및 모니터링 설계 및 구현 CloudWatch

Khurram Nizami, Amazon Web Services(AWS)

2023년 4월(문서 기록)

이 안내서는 Amazon CloudWatch Elastic Compute Cloud(Amazon AWS) 인스턴스, Amazon Elastic Container Service(Amazon ), Amazon Elastic Kubernetes Service(Amazon ECS)AWS Lambda, 및 온프레미스 서버를 사용하는 워크로드에 대해 Amazon 및 관련 Amazon Web Services() 관리 및 거버넌스 서비스를 사용하여 로깅 및 모니터링을 설계하고 구현하는 데 도움이 됩니다. EC2 EKS 이 가이드는 AWS 클라우드에서 워크로드를 관리하는 운영 팀, DevOps 엔지니어 및 애플리케이션 엔지니어를 대상으로 합니다.

로깅 및 모니터링 접근 방식은 AWS Well-Architected Framework의 6가지 원칙을 기반으로 해야 합니다. 이러한 원칙은 운영 우수성, 보안, 신뢰성, 성능 효율성비용 최적화입니다. 잘 설계된 모니터링 및 경보 솔루션은 인프라를 사전에 분석하고 조정할 수 있도록 지원하여 안정성과 성능을 개선합니다.

이 가이드에서는 보안 또는 비용 최적화에 대한 로깅 및 모니터링에 대해 광범위하게 논의하지 않습니다. 이러한 주제는 심층 평가가 필요하기 때문입니다. AWS CloudTrail, , Amazon Inspector, Amazon DetectiveAWS Config, Amazon Amazon Macie 및를 포함하여 보안 로깅 GuardDuty및 모니터링을 지원하는 많은 AWS 서비스가 있습니다AWS Security Hub. https://docs.aws.amazon.com/detective/latest/userguide/detective-investigation-about.html 비용 최적화를 위해 AWS Cost ExplorerAWS Budgets, 및 CloudWatch 결제 지표를 사용할 수도 있습니다.

다음 표에는 로깅 및 모니터링 솔루션이 해결해야 할 6가지 영역이 요약되어 있습니다.

로그 파일 및 지표 캡처 및 수집 시스템 및 애플리케이션 로그와 지표를 AWS 식별, 구성하고 다양한 소스의 서비스에 전송합니다.
로그 검색 및 분석 운영 관리, 문제 식별, 문제 해결 및 애플리케이션 분석을 위한 로그를 검색하고 분석합니다.
지표 모니터링 및 경보 워크로드의 관찰 및 추세를 식별하고 조치를 취합니다.
애플리케이션 및 서비스 가용성 모니터링 서비스 가용성을 지속적으로 모니터링하여 가동 중지 시간을 줄이고 서비스 수준 목표를 충족하는 기능을 개선합니다.
애플리케이션 추적 시스템 및 외부 종속성에서 애플리케이션 요청을 추적하여 성능을 미세 조정하고, 근본 원인 분석을 수행하고, 문제를 해결합니다.
대시보드 및 시각화 생성 시스템 및 워크로드에 대한 관련 지표 및 관찰에 초점을 맞춘 대시보드를 생성하여 문제를 지속적으로 개선하고 선제적으로 발견할 수 있습니다.

CloudWatch 는 대부분의 로깅 및 모니터링 요구 사항을 충족할 수 있으며 안정적이고 확장 가능하며 유연한 솔루션을 제공합니다. 많은 AWS 서비스는 모니터링 및 분석을 위한 CloudWatch 로깅 통합 외에도 CloudWatch 지표를 자동으로 제공합니다. CloudWatch 또한는 서버(클라우드 및 온프레미스 모두), 컨테이너 및 서버리스 컴퓨팅과 같은 다양한 컴퓨팅 옵션을 지원하는 에이전트 및 로그 드라이버를 제공합니다. 이 안내서에서는 로깅 및 모니터링에 사용되는 다음 AWS 서비스도 다룹니다.

선택한 AWS 컴퓨팅 서비스도 로깅 및 모니터링 솔루션의 구현 및 구성에 영향을 미칩니다. 예를 들어 Amazon , Amazon EC2, Amazon EKS, Lambda에 대한 ECS CloudWatch의 구현 및 구성은 다릅니다.

애플리케이션 및 워크로드 소유자는 로깅 및 모니터링을 잊어버리거나 일관성 없이 구성하고 구현할 수 있습니다. 즉, 워크로드는 관찰 가능성이 제한되어 프로덕션에 진입하므로 문제 식별이 지연되고 문제를 해결하고 해결하는 데 걸리는 시간이 늘어납니다. 로깅 및 모니터링 솔루션은 애플리케이션 로그 및 지표에 대한 애플리케이션 계층 외에도 운영 체제(OS) 수준 로그 및 지표에 대한 시스템 계층을 해결해야 합니다. 이 가이드는 다음 표에 설명된 세 가지 컴퓨팅 유형을 포함하여 다양한 컴퓨팅 유형에서 이러한 두 계층을 해결하기 위한 권장 접근 방식을 제공합니다.

장기 실행 및 변경 불가능한 EC2 인스턴스 여러 AWS 리전 또는 계정의 여러 운영 체제(OSs)에 대한 시스템 및 애플리케이션 로그와 지표입니다.
컨테이너 다양한 구성에 대한 예를 포함하여 Amazon 및 Amazon EKS 클러스터에 대한 시스템 및 애플리케이션 로그ECS와 지표입니다.
서버리스 Lambda 함수에 대한 시스템 및 애플리케이션 로그와 지표 및 사용자 지정 고려 사항.

이 가이드는 다음 영역에서 및 관련 AWS 서비스를 처리하는 CloudWatch 로깅 및 모니터링 솔루션을 제공합니다.

구현 예제는이 가이드 전체에서 이러한 영역에 사용되며 AWS 샘플 GitHub 리포지토리에서도 사용할 수 있습니다.