OPS11-BP07 审查运营指标
定期与来自不同业务领域的跨团队参与者对运营指标进行回顾性分析。通过这些分析来确定改进机会和可能的行动方案,并分享经验教训。寻找所有环境(例如,开发、测试和生产环境)中的改进机会。
期望结果:
-
经常审查影响业务的指标
-
通过可观测性功能来检测和审查异常
-
使用数据来支持实现业务成果和目标
常见反模式:
-
维护时段导致一次重要的零售促销活动中断。如果存在其他影响业务的事件,可能延迟标准维护时段,而业务部门对此并不知晓。
-
由于组织中广泛使用了过时的库,导致长时间停机。自此之后,迁移到受支持的库。组织中的其他团队尚未意识到风险的存在。
-
您没有定期审查客户 SLA 的达成情况。您目前正趋向于无法满足客户 SLA。如果无法满足客户 SLA,将会受到经济处罚。
建立此最佳实践的好处:
-
如果能够定期开会审查运营指标、事件和意外事件,就可以在团队之间达成共识。
-
团队定期开会来审查指标和意外事件,这样可以很好地针对风险采取行动并实现客户 SLA。
-
可以分享学到的经验教训,这样能提供数据,根据业务成果确定优先事项和有针对性的改进。
在未建立这种最佳实践的情况下暴露的风险等级:中
实施指导
-
定期与来自不同业务领域的跨团队参与者对运营指标进行回顾性分析。
-
与包括业务、开发和运营团队在内的利益相关方交流,共同验证通过即时反馈和回顾性分析得到的调查发现,并分享经验教训。
-
根据他们的洞察来确定改进机会和可能的行动方案。
资源
相关最佳实践:
相关文档: