Diseño de la carga de trabajo para que tolere los errores de los componentes
Las cargas de trabajo con un requisito de alta disponibilidad y un tiempo de recuperación (MTTR) bajo deben diseñarse para que sean resilientes.
Prácticas recomendadas
- REL11-BP01 Supervisión de todos los componentes de la carga de trabajo para detectar errores
- REL11-BP02 Conmutación por error a recursos en buen estado
- REL11-BP03 Automatización de la reparación en todas las capas
- REL11-BP04 Confianza en el plano de datos y no en el plano de control durante la recuperación
- REL11-BP05 Uso de la estabilidad estática para evitar el comportamiento bimodal
- REL11-BP06 Envío de notificaciones cuando los eventos afecten a la disponibilidad
- REL11-BP07 Diseño de su producto para cumplir objetivos de disponibilidad y acuerdos de nivel de servicio (SLA) de tiempo de actividad