고가용성 분산 시스템 설계 AWS - 가용성과 그 이상: 분산 시스템의 복원력에 대한 이해 및 개선 AWS

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

고가용성 분산 시스템 설계 AWS

이전 항목에서는 주로 워크로드의 이론적 가용성과 이를 통해 달성할 수 있는 것을 다루었습니다. 그것은 분산 시스템을 구축할 때 염두에 두어야 할 중요한 개념입니다. 그것을 통해 종속성 선택 프로세스와 중복성 구현 방법을 알 수 있습니다.

또한 MTTDMTTR, 및 MTBF 가용성과의 관계에 대해서도 살펴보았습니다. 이 항목은 이전 이론에 기반한 실용적인 지침을 소개합니다. 간단히 말해, 고가용성을 위한 엔지니어링 워크로드의 목표는 가용성을 높이거나 낮추는 것입니다MTTD. MTBF MTTR

모든 고장을 제거하는 것이 이상적이기는 하지만 현실적이지는 않습니다. 종속성이 깊이 쌓여 있는 대규모 분산 시스템에서는 고장이 발생하기 마련입니다. “모든 것은 항상 실패한다” (Werner Vogels, Amazon.comCTO, Amazon Web Services 10년간 쌓아온 10가지 교훈 참조). “실패에 대한 법을 제정할 수는 없으므로 빠른 탐지와 대응에 집중하십시오.” (Chris Pinkham, Amazon EC2 팀 창립 멤버, 실패를 위한 ARC335 설계: 복원력 있는 시스템 설계 기반 구축 참조) AWS

이것이 의미하는 바는 고장 발생 여부를 제어할 수 없는 경우가 많다는 것입니다. 제어할 수 있는 것은 고장을 얼마나 빨리 감지하고 조치를 취하느냐입니다. 따라서 MTBF 증가는 여전히 고가용성의 중요한 구성 요소이지만 고객이 통제할 수 있는 범위 내에서 가장 중요한 변화는 감소하는 것입니다. MTTD MTTR