고급 다중 AZ 복원 패턴 - 고급 다중 AZ 복원 패턴

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

고급 다중 AZ 복원 패턴

출판 날짜: 2023년 7월 11일(문서 수정)

많은 고객이 가용성이 높은 다중 가용 영역(AZ) 구성에서 워크로드를 실행합니다. 이러한 아키텍처는 바이너리 장애 발생 시에도 잘 작동하지만 회색 장애 문제가 발생하는 경우가 많습니다. 이러한 유형의 장애는 미묘할 수 있으며 빠르고 확실하게 감지하기 어려울 수 있습니다. 이 백서는 워크로드를 계측하여 단일 가용 영역에 격리된 회색 장애로 인한 영향을 감지한 다음 가용 영역에서 그러한 영향을 완화하기 위한 조치를 취하는 방법에 대한 지침을 제공합니다.

소개

이 문서의 목적은 복원력이 뛰어난 다중 AZ 아키텍처를 보다 효과적으로 구현하도록 돕는 것입니다. Amazon Virtual Private Cloud(VPC) 네트워크에서 복원력이 뛰어난 시스템을 구축하는 모범 사례 중 하나는 각 워크로드를 여러 가용 영역에 배포하는 것입니다.

가용 영역은 중복 전원, 네트워킹 및 연결이 있는 하나 이상의 개별 데이터 센터입니다. 여러 가용 영역을 사용하면 단일 데이터 센터로 가능한 것보다 더 높은 가용성, 내결함성 및 확장성을 갖춘 워크로드를 운영할 수 있습니다.

Amazon Elastic Compute Cloud(EC2), Auto Scaling 또는 Amazon Relational Database Service(RDS)와 같은 많은 AWS 서비스가 다중 AZ 구성을 제공합니다. 이러한 서비스를 사용하면 관찰성 또는 장애 조치 도구를 추가로 구축할 필요가 없습니다. 단일 가용 영역에 영향을 미치는 AWS 리전 내에서 쉽게 감지할 수 있는 바이너리 장애 모드에서도 워크로드를 복원할 수 있습니다. 이는 완전한 물리적 하드웨어 장애, 전력 손실 또는 대다수 리소스에 영향을 미치는 잠재적 소프트웨어 버그일 수 있습니다.

그러나 회색 장애라고 하는 또 다른 범주의 장애도 있는데, 이러한 장애 유형은 미묘하고 빠르고 확실하게 감지하기 어렵습니다. 결과적으로 고장으로 인한 영향을 완화하는 데 시간이 더 오래 걸립니다. 이 백서에서는 회색 장애가 다중 AZ 아키텍처에 미칠 수 있는 영향, 이를 감지하는 방법, 마지막으로 장애를 완화하는 방법을 중점적으로 다룹니다.

이 백서에 제공된 지침은 대부분 다음과 같은 특정 워크로드 클래스에 적용됩니다.

  • 주로 영역 AWS 서비스를 사용

  • 단일 지역 복원력 개선 필요

  • 필요한 관찰성 및 복원력 패턴을 구축하기 위해 상당한 투자를 할 의향이 있음

이러한 워크로드는 회색 장애 대응에서 제시한 장단점 중 일부 또는 전부를 고려하지 않을 수도 있고 여러 지역을 사용할 수 있는 옵션이 없을 수도 있습니다. 이러한 유형의 워크로드는 전체 포트폴리오의 일부에 불과할 가능성이 높으므로 플랫폼 수준과 워크로드 수준에서 이 지침을 고려해야 합니다.