기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
영역 자동 전환을 구성할 때의 모범 사례
Amazon Application Recovery Controller()에서 영역 자동 전환을 활성화할 때 다음 모범 사례 및 고려 사항에 유의하세요ARC.
영역 자동 전환에는 자동 전환과 연습 실행 영역 전환의 두 가지 유형의 트래픽 전환이 포함됩니다.
Autoshift를 사용하면 AWS 가 이벤트 중에 애플리케이션 리소스 트래픽을 가용 영역에서 사용자 대신 이동시켜 복구 시간을 단축할 수 있습니다.
연습 실행에서는 사용자를 대신하여 영역 전환을 ARC 시작합니다. 영역 전환은 트래픽을 리소스의 가용 영역에서 멀리 이동한 다음 매주 다시 돌아옵니다. 연습 실행을 통해 애플리케이션이 하나의 가용 영역이 손실되더라도 견딜 수 있도록 한 리전의 가용 영역 용량을 충분히 스케일 업했는지 확인할 수 있습니다.
자동 전환 및 연습 실행에 유의해야 할 몇 가지 모범 사례와 고려 사항이 있습니다. 리소스에 대한 영역 자동 전환을 활성화하거나 연습 실행을 구성하기 전에 다음 항목을 검토하세요.
주제
- 클라이언트가 엔드포인트에 연결된 상태를 유지하는 시간 제한
-
Amazon Application Recovery Controller(ARC)가 영역 전환 또는 영역 자동 전환 등을 사용하여 트래픽을 장애로부터 멀어지게 전환하면가 애플리케이션 트래픽을 이동하는 데 ARC 사용하는 메커니즘은 DNS 업데이트입니다. DNS 업데이트로 인해 모든 새 연결이 손상된 위치에서 멀리 이동하게 됩니다. 그러나 기존에 열려 있는 연결이 있는 클라이언트는 클라이언트가 다시 연결될 때까지 손상된 위치에 대해 계속 요청할 수 있습니다. 빠른 복구를 위해 클라이언트가 엔드포인트에 연결된 상태를 유지하는 시간을 제한하는 것이 좋습니다.
Application Load Balancer를 사용하는 경우
keepalive
옵션을 사용하여 연결 지속 시간을 구성할 수 있습니다. 예를 들어 300초와 같이 애플리케이션의 복구 시간 목표에 맞게keepalive
값을 낮추는 것이 좋습니다.keepalive
시간을 선택할 때이 값은 일반적으로 더 자주 재연결하는 것 사이의 절충점이며, 이는 지연 시간에 영향을 미칠 수 있고, 모든 클라이언트를 손상된 AZ 또는 리전에서 더 빠르게 이동시키는 것입니다.Application Load Balancer
keepalive
옵션 설정에 대한 자세한 내용은 Application Load Balancer 사용 설명서의 HTTP 클라이언트 유지 기간을 참조하세요. - 리소스 용량 사전 조정 및 트래픽 전환 테스트
-
가 영역 AWS 전환 또는 자동 전환을 위해 트래픽을 하나의 가용 영역에서 멀어지게 전환할 때는 나머지 가용 영역이 리소스에 대한 증가된 요청 속도를 지원할 수 있어야 합니다. 이 패턴을 정적 안정성이라고 합니다. 자세한 내용은 Amazon Builder’s Library의 Static stability using Availability Zones whitepaper
를 참조하세요. 예를 들어 애플리케이션에서 클라이언트에 서비스를 제공하는 데 30개의 인스턴스가 필요한 경우 3개의 가용 영역에 15개의 인스턴스를 프로비저닝하여 총 45개의 인스턴스를 프로비저닝해야 합니다. 이렇게 하면가 자동 AWS 전환 또는 연습 실행 중에 하나의 가용 영역에서 트래픽을 이동하더라도는 두 가용 영역에서 나머지 총 30개의 인스턴스를 애플리케이션 클라이언트에 제공할AWS 수 있습니다.
의 영역 자동 전환 기능은 가용 영역 하나가 손실된 상태에서 정상적으로 작동하도록 미리 조정된 리소스가 있는 애플리케이션이 있는 경우 가용 영역의 AWS 이벤트에서 빠르게 복구하는 데 ARC 도움이 됩니다. 리소스에 대한 영역 자동 전환을 활성화하기 전에 AWS 리전내에 구성된 모든 가용 영역의 리소스 용량을 모두 조정하세요. 그런 다음 리소스에 대해 영역 전환을 시작하여 트래픽이 한 가용 영역에서 벗어나도 애플리케이션이 정상적으로 실행되는지 테스트하세요.
영역 전환을 테스트한 후에는 영역 자동 전환을 활성화하고 애플리케이션 리소스에 대한 연습 실행을 구성하세요. 영역 자동 전환을 통한 정기적인 연습 실행은 용량이 여전히 적절하게 조정되고 있는지 지속적으로 확인하는 데 도움이 됩니다. 가용 영역 전체에 충분한 용량이 있으면 자동 전환 중에도 애플리케이션이 중단 없이 클라이언트에 계속 서비스를 제공할 수 있습니다.
리소스에 대한 영역 전환 시작에 대한 자세한 내용은 의 영역 전환 ARC 섹션을 참조하세요.
- 리소스 유형 및 제한 사항에 유의하세요.
영역 자동 전환은 영역 전환이 지원하는 모든 리소스의 트래픽을 가용 영역 밖으로 이동할 수 있도록 지원합니다. 일반적으로 영역 간 로드 밸런싱이 꺼진 상태의 Application Load Balancer 및 Network Load Balancer가 지원됩니다. 몇 가지 특정 리소스 시나리오에서 영역 자동 전환은 자동 전환을 위해 가용 영역의 트래픽을 이동시키지 않습니다.
예를 들어 가용 영역의 로드 밸런서 대상 그룹에 인스턴스가 없거나 모든 인스턴스가 비정상인 경우 로드 밸런서는 페일 오픈 상태에 있습니다. 이 시나리오에서가 로드 밸런서에 대한 자동 전환을 AWS 시작하면 로드 밸런서가 이미 장애 열기 상태에 있기 때문에 자동 전환이 로드 밸런서가 사용하는 가용 영역을 변경하지 않습니다. 이는 예상된 동작입니다. 모든 가용 영역이 열려 있지 않은 AWS 리전 경우(비정상) Autoshift는 한 가용 영역이 비정상이 되고 트래픽을의 다른 가용 영역으로 전환할 수 없습니다.
두 번째 시나리오는가 액셀러레이터의 엔드포인트인 Application Load Balancer의 자동 전환을 AWS 시작하는 경우입니다 AWS Global Accelerator. 영역 전환과 마찬가지로 글로벌 액셀러레이터에서 액셀러레이터의 엔드포인트인 Application Load Balancer에는 자동 전환이 지원되지 않습니다.
알아야 할 모든 요구 사항 및 예외를 포함하여 지원되는 리소스에 대한 세부 정보를 보려면 지원되는 리소스 섹션을 참조하세요.
- 연습 실행에 대한 경보 지정
-
영역 자동 전환으로 연습 실행에 대해 하나 이상의 경보(결과 경보)를 구성합니다. 선택적으로 두 번째 경보(차단 경보)를 구성할 수도 있습니다.
리소스에 대한 연습 실행에 대해 구성하는 CloudWatch 경보를 고려할 때는 다음 사항에 유의하세요.
필요한 결과 경보의 경우 리소스 또는 애플리케이션에 대한 지표에서 트래픽을 가용 영역 밖으로 이동하면 성능에 부정적인 영향을 미치는 것으로 표시될 때 CloudWatch 경보가
ALARM
상태로 전환되도록 구성하는 것이 좋습니다. 예를 들어, 리소스에 대한 요청 속도의 임계값을 결정한 다음 임계값이 초과되면ALARM
상태가 되도록 경보를 구성할 수 있습니다. AWS 가 연습 실행을 종료하고FAILED
결과를 반환하도록 하는 적절한 경보를 구성하는 것은 사용자의 책임입니다.주요 성능 지표(KPIs)를 경보로 CloudWatch 구현하도록 권장하는 AWS Well Architected Framework를 따르는 것이 좋습니다. 이렇게 하면 이러한 경보를 사용하여 안전 트리거로 사용할 복합 경보를 생성하여 애플리케이션이를 놓칠 수 있는 경우 연습 실행이 시작되지 않도록 할 수 있습니다KPI. 경보가 더 이상
ALARM
상태가 아닌 경우는 다음에 리소스에 대해 연습 실행이 예약될 때 연습 실행을 ARC 시작합니다.연습 실행 차단 경보를 구성하는 경우 연습 실행이 시작되지 않도록 표시하는 데 사용하는 특정 지표를 추적하도록 선택할 수 있습니다.
연습 실행 경보의 경우 먼저 Amazon에서 구성해야 하는 각 경보에 대해 Amazon 리소스 이름(ARN)을 지정합니다 CloudWatch. 지정하는 CloudWatch 경보는 복합 경보일 수 있으므로 경보가
ALARM
상태로 전환되도록 트리거할 수 있는 애플리케이션 및 리소스에 대한 여러 지표와 검사를 포함할 수 있습니다. 자세한 내용은 Amazon CloudWatch 사용 설명서의 경보 결합을 참조하세요.연습 실행에 지정하는 CloudWatch 경보가 연습 실행을 구성하는 리소스와 동일한 리전에 있는지 확인합니다.
- 연습 실행의 결과 평가
ARC는 각 연습 실행의 결과를 보고합니다. 연습 실행 후 결과를 평가하고 조치를 취해야 하는지 결정합니다. 예를 들어 용량을 조정하거나 경보에 대한 구성을 조정해야 할 수 있습니다.
가능한 연습 실행 결과는 다음과 같습니다.
SUCCEEDED: 연습 실행 중에 결과 경보가
ALARM
상태가 되지 않았고 연습 실행이 전체 30분 테스트 기간을 완료했습니다.FAILED: 연습 실행 중에 결과 경보가
ALARM
상태가 되었습니다.INTERRUPTED:
ALARM
상태가 되는 결과 경보가 아닌 이유로 연습 실행이 종료되었습니다. 연습 실행은 다음과 같이 여러 가지 이유로 중단될 수 있습니다.에서 자동 전환을 AWS 시작 AWS 리전 했거나 리전에 경보 조건이 있어 연습 실행이 종료되었습니다.
리소스에 대한 연습 실행 구성이 삭제되어 연습 실행이 종료되었습니다.
연습 실행 영역 전환이 트래픽을 전환시키던 소스 가용 영역의 리소스에 대해 고객 주도 영역 전환이 시작되어 연습 실행이 종료되었습니다.
연습 실행 구성에 지정된 CloudWatch 경보에 더 이상 액세스할 수 없으므로 연습 실행이 종료되었습니다.
연습 실행에 지정된 차단 경보가
ALARM
상태에 들어갔기 때문에 연습 실행이 종료되었습니다.알 수 없는 이유로 연습 실행이 종료되었습니다.
PENDING: 연습 실행이 활성 상태입니다(진행 중). 아직 반환할 결과가 없습니다.