Principios de diseño - Marco de AWS Well-Architected

Principios de diseño

Existen cinco principios de diseño para la fiabilidad en la nube:

  • Recuperación automática de un error: al supervisar un sistema de indicadores clave de rendimiento (KPI), se puede iniciar la automatización cuando se supera un umbral. Estos KPI deben ser una medida del valor de negocio, no de los aspectos técnicos del funcionamiento del servicio. De este modo, se hace posible la notificación y el seguimiento automático de los errores, así como los procesos de recuperación automatizada que pueden solucionar o corregir el error. Con una automatización más sofisticada, es posible anticipar y solucionar errores antes de que sucedan.

  • Prueba de los procedimientos de recuperación: en un entorno en las instalaciones, a menudo se hacen pruebas para ver si una carga de trabajo funciona en una situación concreta. Normalmente, las pruebas no se usan para comprobar estrategias de recuperación. En la nube, puede probar los errores de la carga de trabajo y validar los procedimientos de recuperación. Puede usar la automatización para simular diferentes errores o recrear escenarios que anteriormente han producido algún error. Esto expone vías de error que puede probar y arreglar antes de que se produzca una situación de error real, lo que reduce el riesgo.

  • Escalado horizontal para aumentar la disponibilidad agregada de la carga de trabajo: reemplace un gran recurso por varios recursos pequeños para reducir el efecto de un solo error en toda la carga de trabajo. Distribuya las solicitudes a través de varios recursos más pequeños para verificar que no compartan el mismo error.

  • No más conjeturas sobre la capacidad: un factor común de error de los sistemas en las instalaciones es la saturación de recursos, cuando las demandas que se hacen a una carga de trabajo superan su capacidad (este es a menudo el objetivo de los ataques de denegación de servicio). En la nube, se puede supervisar la demanda y el uso de la carga de trabajo, además de automatizar la incorporación o eliminación de recursos de forma automatizada para mantener un nivel más eficiente y satisfacer la demanda sin tener un aprovisionamiento excesivo o insuficiente. Aún hay límites, pero algunas cuotas se pueden controlar, mientras que otras se pueden administrar (consulte Manage Service Quotas and Constraints).

  • Administración de los cambios mediante la automatización: los cambios que se apliquen a la infraestructura deben hacerse mediante la automatización. Entre los cambios que se tienen que administrar se encuentran los de la automatización, de los que, posteriormente, se puede hacer un seguimiento y una revisión.