在 AWS 上实现高可用性和可扩展性
大多数实时通信提供商都可提供可用性为 99.99% 至 99.999% 的服务级别。根据您想要的高可用性 (HA) 级别,您必须在应用程序的整个生命周期中采取日益复杂的措施。我们建议遵循以下准则,以实现稳健的高可用性级别:
-
将系统设计为没有单点故障。对无状态组件和有状态组件使用自动监控、故障检测和故障转移机制
-
通常使用 N+1 或 2N 冗余配置消除单点故障 (SPOF),其中 N+1 是通过活动-活动节点之间的负载均衡来实现的,而 2N 是通过采用活动-备用配置的一对节点来实现的。
-
AWS 有多种方法可以通过这两种方式来实现高可用性,例如通过可扩展、负载均衡的集群或采用活动-备用对。
-
正确检测和测试系统可用性。
-
针对手动机制准备操作流程,以应对、缓解故障并从中恢复。
本节重点介绍如何使用 AWS 上提供的功能实现无单点故障。具体而言,本节介绍了一部分核心 AWS 功能和设计模式,这些功能和模式使您能够在平台上构建高度可用的实时通信应用程序。