OPS04-BP01 确定关键绩效指标
要在工作负载中实现可观测性,首先要了解其状态,并根据业务要求做出数据驱动型决策。确保监控活动与业务目标相一致的最有效方法之一是,定义和监控关键绩效指标(KPI)。
期望结果:与业务目标紧密协调的高效可观测性实践,确保监控工作始终为切实的业务成果服务。
常见反模式:
-
不明确的 KPI:在没有明确 KPI 的情况下工作可能会导致监控过多或过少内容,从而缺少重要信号。
-
静态 KPI:不会随着工作负载或业务目标的发展变化而重新审视或完善 KPI。
-
不一致:重点关注与业务成果不直接相关或难以与现实问题关联的技术指标。
建立此最佳实践的好处:
-
易于发现问题:业务 KPI 通常比技术指标能够更清楚地揭示问题。与筛查众多技术指标相比,深入研究业务 KPI 有助于更有效地查明问题。
-
业务协调:确保监控活动直接支持业务目标。
-
效率:将监控资源和注意力优先放在重要的指标上。
-
积极主动:在问题对业务产生更广泛影响之前发现问题并加以解决。
在未建立这种最佳实践的情况下暴露的风险等级:高
实施指导
要有效地定义工作负载 KPI,请执行以下操作:
-
从业务成果开始:在深入研究指标之前,请先了解期望的业务成果。是销售额增加、用户参与度提高还是响应时间更短?
-
将技术指标与业务目标相关联:并非所有技术指标都会对业务成果产生直接影响。确定那些确实会产生直接影响的指标,但使用业务 KPI 来发现问题通常更为简单。
-
使用 Amazon CloudWatch:使用 CloudWatch 来定义和监控代表 KPI 的指标。
-
定期审查和更新 KPI:随着工作负载和业务的发展,请保持 KPI 的相关性。
-
让利益相关方参与其中:让技术和业务团队参与定义和审查 KPI。
实施计划的工作量级别:中
资源
相关最佳实践:
相关文档:
相关视频:
相关示例: