La resiliencia y los componentes de la fiabilidad
La fiabilidad de una carga de trabajo en la nube depende de varios factores, el principal de los cuales es la resiliencia:
-
La resiliencia es la capacidad de una carga de trabajo para recuperarse de interrupciones en la infraestructura o el servicio, para incorporar dinámicamente recursos computacionales que satisfagan la demanda y para mitigar las interrupciones, como errores de configuración o problemas de red temporales.
Los otros factores que influyen en la fiabilidad de la carga de trabajo son:
-
Excelencia operativa, que incluye la automatización de los cambios, el uso de manuales de estrategias para responder a los errores y las revisiones de disponibilidad operativa (ORR) para confirmar que las aplicaciones estén listas para las operaciones de producción.
-
La seguridad, que incluye la prevención de daños a los datos o a la infraestructura por parte de infractores, lo que afectaría a la disponibilidad. Por ejemplo, cifrar las copias de seguridad para garantizar la seguridad de los datos.
-
Eficiencia del rendimiento, que incluye el diseño para obtener las máximas tasas de solicitudes y minimizar las latencias para su carga de trabajo.
-
Optimización de costos, que incluye compensaciones tales como si se debe gastar más en instancias de EC2 para lograr la estabilidad estática o confiar en el escalado automático cuando se necesita más capacidad.
La resiliencia es el objetivo principal de este documento técnico.
Los otros cuatro aspectos también son importantes y están cubiertos por sus respectivos pilares del Marco de AWS Well-Architected