La resiliencia y los componentes de la fiabilidad - Pilar de fiabilidad

La resiliencia y los componentes de la fiabilidad

La fiabilidad de una carga de trabajo en la nube depende de varios factores, el principal de los cuales es la resiliencia:

  • La resiliencia es la capacidad de una carga de trabajo para recuperarse de interrupciones en la infraestructura o el servicio, para incorporar dinámicamente recursos computacionales que satisfagan la demanda y para mitigar las interrupciones, como errores de configuración o problemas de red temporales.

Los otros factores que influyen en la fiabilidad de la carga de trabajo son:

  • Excelencia operativa, que incluye la automatización de los cambios, el uso de manuales de estrategias para responder a los errores y las revisiones de disponibilidad operativa (ORR) para confirmar que las aplicaciones estén listas para las operaciones de producción.

  • La seguridad, que incluye la prevención de daños a los datos o a la infraestructura por parte de infractores, lo que afectaría a la disponibilidad. Por ejemplo, cifrar las copias de seguridad para garantizar la seguridad de los datos.

  • Eficiencia del rendimiento, que incluye el diseño para obtener las máximas tasas de solicitudes y minimizar las latencias para su carga de trabajo.

  • Optimización de costos, que incluye compensaciones tales como si se debe gastar más en instancias de EC2 para lograr la estabilidad estática o confiar en el escalado automático cuando se necesita más capacidad.

La resiliencia es el objetivo principal de este documento técnico.

Los otros cuatro aspectos también son importantes y están cubiertos por sus respectivos pilares del Marco de AWS Well-Architected. En muchas de estas prácticas recomendadas también se tratan esos aspectos de la fiabilidad, pero el enfoque se centra en la resiliencia.