Resiliência e os componentes da confiabilidade
A confiabilidade de uma workload na nuvem depende de vários fatores, o principal deles é a Resiliência:
-
Resiliência é a capacidade de uma workload se recuperar de interrupções na infraestrutura ou nos serviços, adquirir dinamicamente recursos de computação para atender à demanda e mitigar interrupções, como configurações incorretas ou problemas transitórios de rede.
Os outros fatores que afetam a confiabilidade da workload são:
-
Excelência operacional, que inclui automação de alterações, uso de playbooks para responder a falhas e revisões de prontidão operacional (ORRs) para confirmar que as aplicações estão prontas para operações de produção.
-
Segurança, que inclui a prevenção de danos a dados ou infraestrutura de agentes mal-intencionados, o que pode afetar a disponibilidade. Por exemplo, criptografe backups para garantir que os dados estejam seguros.
-
Eficiência de performance, que inclui projetar para taxas máximas de solicitação e a minimização de latências para sua workload.
-
Otimização de custos, que inclui compensações, como se você deseja gastar mais em instâncias do EC2 para alcançar ajuste de escala automático ou confiar no ajuste de escala automático quando mais capacidade for necessária.
A resiliência é o foco principal deste whitepaper.
Os outros quatro fatores também são importantes e são cobertos por seus respectivos pilares do AWS Well-Architected Framework