Amazon EC2 리소스 모니터링
모니터링은 Amazon EC2 인스턴스 및 AWS 솔루션의 안정성, 가용성 및 성능을 유지하는 데 있어서 중요한 부분입니다. 발생하는 다중 지점 실패를 보다 쉽게 디버깅할 수 있도록 AWS 솔루션의 모든 부분으로부터 모니터링 데이터를 수집해야 합니다.
AWS는 Amazon EC2를 모니터링하는 데 사용할 수 있는 다양한 도구를 제공합니다. Amazon EC2 및 CloudWatch 콘솔 대시보드에서는 Amazon EC2 환경을 한 눈에 파악할 수 있습니다. 추가로 다음을 제공합니다.
-
시스템 상태 확인 - 인스턴스를 사용하는 데 필요한 AWS 시스템을 모니터링하여 올바르게 작동 중인지 확인합니다. 이러한 확인에서는 복구 시 AWS 개입이 필요한 인스턴스 관련 문제를 찾아냅니다. 시스템 상태 확인이 실패하는 경우, AWS에서 문제를 해결할 때까지 기다리거나, 인스턴스를 중지했다가 다시 시작하거나 종료하고 교체하는 등의 방법으로 사용자가 문제를 직접 해결할 수도 있습니다. 시스템 상태 확인이 실패하게 되는 문제의 예를 들면 다음과 같습니다.
-
네트워크 연결 끊김
-
시스템 전원 중단
-
물리적 호스트의 소프트웨어 문제
-
네트워크 연결성에 영향을 주는 물리적 호스트의 하드웨어 문제
자세한 내용은 Amazon EC2 인스턴스 상태 확인 섹션을 참조하세요.
-
-
인스턴스 상태 확인 – 개별 인스턴스에 대한 소프트웨어 및 네트워크 구성을 모니터링합니다. 이러한 확인에서는 복구 시 사용자의 개입이 필요한 문제를 찾아냅니다. 인스턴스 상태 확인이 실패할 경우 일반적으로 사용자는 인스턴스를 재부팅하거나 운영 체제를 수정하는 등의 방법으로 문제를 직접 해결해야 합니다. 인스턴스 상태 확인이 실패하게 되는 문제의 예를 들면 다음과 같습니다.
-
시스템 상태 확인 실패
-
네트워크 구성 또는 시작 구성이 잘못됨
-
메모리가 모두 사용됨
-
파일 시스템 손상
-
호환되지 않는 커널
자세한 내용은 Amazon EC2 인스턴스 상태 확인 섹션을 참조하세요.
-
-
Amazon CloudWatch 경보 – 지정하는 기간 동안 단일 지표를 관찰하고 특정 기간 동안 지정된 임계값을 기준으로 지표의 값에 따라 하나 이상의 작업을 수행합니다. 이 작업은 Amazon Simple Notification Service(Amazon SNS) 주제 또는 Amazon EC2 Auto Scaling 정책에 전송되는 알림입니다. 경보는 지속적인 상태 변경에 대해서만 작업을 호출합니다. CloudWatch 경보는 특정 상태에 있다는 이유만으로는 작업을 호출하지 않습니다. 상태가 변경되고 지정한 기간 동안 유지되어야 합니다. 자세한 내용은 CloudWatch를 사용하여 인스턴스 모니터링 단원을 참조하십시오.
-
Amazon EventBridge 이벤트 – AWS 서비스를 자동화하여 시스템 이벤트에 자동으로 응답합니다. AWS 서비스 이벤트는 거의 실시간으로 EventBridge에 전송되며, 전송된 이벤트가 사용자가 정의한 규칙과 일치할 경우 실행할 자동 작업을 지정할 수 있습니다. 자세한 내용은 EventBridge를 사용하여 Amazon EC2 자동화 단원을 참조하십시오.
-
AWS CloudTrail 로그 - Amazon EC2 API에 보낸 호출에 대한 자세한 정보를 캡처하고 Amazon S3에 로그 파일로 저장합니다. 이러한 CloudTrail 로그를 사용하여 어떤 요청이 이루어졌는지, 호출의 IP 주소, 누가 언제 호출을 요청했는지 등을 확인할 수 있습니다. 자세한 내용은 AWS CloudTrail을 사용하여 Amazon EC2 API 호출 로깅 단원을 참조하십시오.
-
CloudWatch 에이전트 – EC2 인스턴스와 온프레미스 서버의 호스트 및 게스트 모두에서 로그와 시스템 수준 지표를 수집합니다. 자세한 내용은 Amazon CloudWatch 사용 설명서의 CloudWatch 에이전트를 사용하여 Amazon EC2 인스턴스 및 온프레미스 서버로부터 지표 및 로그 수집을 참조하세요.