变更管理
您必须提前为工作负载或其环境的更改做好准备,从而实现工作负载的可靠运行。此类更改包括,外部因素施加到工作负载上的更改(如需求高峰),以及内部更改(如功能部署和安全补丁)。
您可以使用 AWS 来监控工作负载的行为,并自动对 KPI 做出响应。例如,您的工作负载可以在某个工作负载的用户增加时,添加更多服务器。您可以控制谁有权进行工作负载变更并审核这些变更的历史记录。
以下问题主要针对可靠性的注意事项。
REL 6:如何监控工作负载资源? |
---|
日志和指标是深入了解工作负载运行状况的强大工具。您可以将工作负载配置为监控日志和指标,并在超过阈值或发生重大事件时发送通知。通过监控,您的工作负载可以发现超出低性能阈值和发生故障的情形,从而自动恢复以做出响应。 |
REL 7:如何设计工作负载,以适应需求变化? |
---|
可扩展工作负载提供了自动添加或删除资源的弹性,因此资源在任何给定时间点都非常符合当前需求。 |
REL 8:如何实施更改? |
---|
要部署新功能,必须对更改加以控制,以确保工作负载和操作环境正在运行已知的软件,并以可预测的方式进行修补和替换。如果这些更改不受控制,那么就很难预测这些更改的影响,也很难解决由此产生的问题。 |
当您构建工作负载来根据需求变化自动添加和删除资源时,这不仅可以提高可靠性,还可以确保业务成功不至于带来额外负担。有了监控功能后,当 KPI 偏离预期标准时,系统会自动向团队发送警报。通过自动记录环境变更,您可以审核并快速发现可能影响可靠性的操作。对变更管理的控制确保您可以实施可提供所需可靠性的规则。