AWS Resilience Hub – 복원력 관리 - AWS 복원력 허브

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

AWS Resilience Hub – 복원력 관리

AWS Resilience Hub 는 AWS 애플리케이션의 복원력을 정의, 검증 및 추적할 수 있는 중앙 위치를 제공합니다. AWS Resilience Hub 는 애플리케이션을 중단으로부터 보호하고 복구 비용을 절감하여 비즈니스 연속성을 최적화하여 규정 준수 및 규제 요구 사항을 충족할 수 있도록 지원합니다. AWS Resilience Hub 를 사용하여 다음을 수행할 수 있습니다.

  • 인프라를 분석하고 애플리케이션 복원력을 개선하기 위한 권장 사항을 얻습니다. 애플리케이션 복원력을 개선하기 위한 아키텍처 지침 외에도 권장 사항은 복원력 정책을 충족하고, 통합 및 전송(CI/CDSOPs) 파이프라인에서 애플리케이션을 배포하고 실행할 수 있는 테스트, 경보 및 표준 운영 절차()를 구현하기 위한 코드를 제공합니다.

  • 다양한 조건에서 복구 시간 목표(RTO)와 복구 시점 목표(RPO) 대상을 평가합니다.

  • 복구 비용을 줄이면서 비즈니스 연속성을 최적화합니다.

  • 프로덕션 환경에서 문제가 발생하기 전에 문제를 식별하고 해결합니다.

애플리케이션을 프로덕션에 배포한 후 CI/CD 파이프라인 AWS Resilience Hub 에 를 추가하여 프로덕션으로 릴리스되기 전에 모든 빌드를 검증할 수 있습니다.

AWS Resilience Hub 작동 방식

다음 다이어그램은 가 AWS Resilience Hub 작동하는 방식에 대한 개략적인 개요를 제공합니다.

가 어떻게 AWS Resilience Hub 작동하는지 보여주는 흐름도입니다.
설명

AWS CloudFormation 스택, Terraform 상태 파일 AWS Resource Groups, Amazon Elastic Kubernetes Service 클러스터에서 리소스를 가져와 애플리케이션을 설명하거나 에 이미 정의된 애플리케이션 중에서 선택할 수 있습니다myApplications.

정의

애플리케이션의 복원력 정책을 정의합니다. 이러한 정책에는 애플리케이션, 인프라, 가용 영역 및 리전 중단에 대한 RTO 및 RPO 대상이 포함됩니다. 이러한 목표는 애플리케이션이 복원력 정책을 충족하는지 여부를 추정하는 데 사용됩니다.

평가

애플리케이션을 설명하고 애플리케이션에 복원력 정책을 추가한 후 복원력 평가를 실행합니다. AWS Resilience Hub 평가는 Well-Architected Framework의 모범 사례를 AWS 사용하여 애플리케이션의 구성 요소를 분석하고 잠재적 복원력 약점을 찾아냅니다. 이러한 약점은 불완전한 인프라 설정, 잘못된 구성 또는 추가 구성 개선이 필요한 상황으로 인해 발생할 수 있습니다. 복원력을 개선하려면 평가 보고서의 권장 사항에 따라 애플리케이션 및 복원력 정책을 업데이트하세요. 권장 사항에는 구성 요소, 경보, 테스트 및 복구 구성이 포함됩니다SOPs. 그런 다음 다른 평가를 실행하고 결과를 이전 보고서와 비교하여 복원력이 얼마나 향상되는지 확인할 수 있습니다. 예상 워크로드RTO와 예상 워크로드가 RTO 및 RPO 목표를 RPO 충족할 때까지 이 프로세스를 반복합니다.

Validate

테스트를 실행하여 AWS 리소스의 복원력과 애플리케이션, 인프라, 가용 영역 및 AWS 리전 인시던트에서 복구하는 데 걸리는 시간을 측정합니다. 복원력을 측정하기 위해 이러한 테스트는 AWS 리소스 중단을 시뮬레이션합니다. 중단의 예로는 네트워크 사용 불가 오류, 장애 조치, 중지된 프로세스, Amazon RDS 부팅 복구 및 가용 영역 관련 문제가 있습니다.

보기 및 추적

AWS 애플리케이션을 프로덕션에 배포한 후 AWS Resilience Hub 를 사용하여 애플리케이션의 복원력을 계속 추적할 수 있습니다. 중단이 발생하면 운영자는 에서 중단을 보고 연결된 복구 프로세스를 AWS Resilience Hub 시작할 수 있습니다.