기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
복원력을 위한 공동 책임 모델
복원력은 AWS 와 사용자 간의 공동 책임입니다. 복원력의 일부인 재해 복구(DR) 및 가용성이 이 공동 모델에서 어떻게 작동하는지 이해해야 합니다.
AWS 책임 - 클라우드의 복원력
AWS 는 에서 제공하는 모든 서비스를 실행하는 인프라의 복원성을 담당합니다 AWS 클라우드. 이 인프라는 AWS 클라우드 서비스를 실행하는 하드웨어, 소프트웨어, 네트워킹 및 시설로 구성됩니다. AWS 는 서비스 가용성이 서비스 수준 계약()을 충족하거나 초과할 AWS 클라우드 수 있도록 상업적으로 합리적인 노력을 기울입니다. AWS SLAs
AWS 글로벌 클라우드 인프라
고객 책임 - 클라우드의 복원력
책임은 선택한 AWS 클라우드 서비스에 따라 결정됩니다. 서비스에 따라 복원력 책임의 일환으로서 고객이 수행해야 할 구성 작업의 양이 달라집니다. 예를 들어 Amazon Elastic Compute Cloud(Amazon EC2)와 같은 서비스를 사용하려면 고객이 필요한 모든 복원력 구성 및 관리 작업을 수행해야 합니다. Amazon EC2 인스턴스를 배포하는 고객은 여러 위치(예: 가용 영역)에 Amazon EC2 인스턴스를 배포하고, Auto Scaling과 같은 서비스를 사용하여 자체 복구를 구현하고, 인스턴스에 설치된 애플리케이션에 복원력이 뛰어난 워크로드 아키텍처 모범 사례를 사용할 책임이 있습니다. AWS Amazon S3 및 Amazon DynamoDB와 같은 관리형 서비스의 경우 인프라 계층, 운영 체제 및 플랫폼을 AWS 운영하며 고객은 엔드포인트에 액세스하여 데이터를 저장하고 검색합니다. 백업, 버전 관리 및 복제 전략을 포함하여 데이터의 복원력을 관리할 책임은 고객에게 있습니다.
의 여러 가용 영역에 워크로드를 배포하는 AWS 리전 것은 문제를 하나의 가용 영역으로 격리하여 워크로드를 보호하도록 설계된 고가용성 전략의 일부이며, 이 영역은 다른 가용 영역의 중복성을 사용하여 요청을 계속 제공합니다. 다중 AZ 아키텍처는 정전, 낙뢰, 토네이도, 지진 등과 같은 문제로부터 워크로드를 더 잘 격리하고 보호하도록 설계된 DR 전략의 일부이기도 합니다. DR 전략은 여러 AWS 리전을 사용할 수도 있습니다. 예를 들어 액티브/패시브 구성에서 액티브 리전이 더 이상 요청을 처리할 수 없는 경우 워크로드에 대한 서비스가 액티브 리전에서 DR 리전으로 장애 조치됩니다.
AWS 서비스를 사용하여 복원력 목표를 달성할 수 있습니다. 고객은 클라우드에서 복원력을 달성하기 위해 시스템의 다음 측면을 관리할 책임이 있습니다. 특히 각 서비스에 대한 자세한 내용은 AWS 설명서를 참조하세요.
네트워킹, 할당량 및 제약 조건
변경 관리 및 운영 복원력
-
변경 관리에는 환경에 변경 사항을 도입하고 관리하는 방법이 포함됩니다. 변경 사항을 구현하려면 애플리케이션 및 인프라에 대한 런북과 배포 전략을 구축하고 최신 상태로 유지해야 합니다.
-
워크로드 리소스를 모니터링하는 탄력적인 전략에서는 기술 및 비즈니스 지표, 알림, 자동화 및 분석을 포함한 모든 구성 요소를 고려합니다.
-
클라우드의 워크로드는 사용량 장애 또는 변동에 대응하여 스케일 인되는 수요 규모의 변화에 적응해야 합니다.
관찰성 및 장애 관리
-
워크로드가 구성 요소 장애를 견딜 수 있도록 복구를 자동화하려면 모니터링을 통해 장애를 관찰해야 합니다.
-
장애 관리를 위해 데이터를 백업하고, 워크로드가 구성 요소 장애를 견딜 수 있도록 모범 사례를 적용하고, 재해 복구를 계획해야 합니다.
워크로드 아키텍처
-
워크로드 아키텍처에는 비즈니스 도메인에 대한 서비스를 설계하고, 장애를 방지하기 위해 SOA 및 분산 시스템 설계를 적용하고, 제한, 재시도, 대기열 관리, 제한 시간 및 비상 레버와 같은 기능을 구축하는 방법이 포함되어 있습니다.
-
입증된 AWS 솔루션
, Amazon Builders Library 및 서버리스 패턴 을 활용하여 모범 사례에 맞춰 구현을 바로 시작할 수 있습니다. -
지속적인 개선을 통해 시스템을 분산 서비스로 분해하여 더 빠르게 규모를 조정하고 혁신합니다. AWS 마이크로서비스
지침 및 관리형 서비스 옵션을 사용하여 변경을 도입하고 혁신하는 역량을 단순화하고 가속화합니다.
중요 인프라에 대한 지속적인 테스트
-
신뢰성 테스트는 기능, 성능, 카오스 수준에서 테스트하고, 인시던트 분석 및 게임 데이 관행을 채택하여 잘 이해되지 않은 문제를 해결하는 데 필요한 전문성을 구축함을 의미합니다.
-
클라우드 올인 및 하이브리드 애플리케이션 모두에서 문제가 발생하거나 구성 요소가 중단될 때 애플리케이션이 어떻게 작동하는지 알면 중단으로부터 빠르고 신뢰할 수 있는 방식으로 복구할 수 있습니다.
-
예상대로 작동하지 않을 때 시스템이 어떻게 작동하는지 이해하기 위해 반복 가능한 실험을 만들고 문서화합니다. 이러한 테스트는 전체 복원력의 효율성을 입증하고 실제 오류 시나리오에 직면하기 전에 운영 절차에 대한 피드백 루프를 제공합니다.