Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Resilienza e componenti dell'affidabilità
L'affidabilità di un carico di lavoro nel cloud dipende da diversi fattori, il principale dei quali è la resilienza:
-
La resilienza è la capacità di un carico di lavoro di ripristinarsi a seguito di interruzioni dell'infrastruttura o del servizio, acquisire in modo dinamico le risorse di calcolo per soddisfare la domanda e mitigare le interruzioni, quali configurazioni errate o problemi di rete transitori.
Gli altri fattori che influiscono sull'affidabilità del carico di lavoro sono:
-
Eccellenza operativa, che include l'automazione delle modifiche, l'uso di playbook per rispondere ai guasti e le revisioni sulla prontezza operativa (ORR) per confermare che le applicazioni sono pronte per le operazioni di produzione.
-
Sicurezza, che include la prevenzione di danni ai dati o all'infrastruttura da parte di malintenzionati, che comprometterebbero la disponibilità. Ad esempio, crittografare i backup per garantire la sicurezza dei dati.
-
Efficienza delle prestazioni, che include la progettazione di tassi massimi di richiesta e la riduzione al minimo delle latenze per il carico di lavoro.
-
Ottimizzazione dei costi, che include compromessi quali spendere di più sulle istanze EC2 per ottenere stabilità statica oppure fare affidamento sulla scalabilità automatica quando è necessaria una maggiore capacità.
La resilienza è l'obiettivo principale di questo whitepaper.
Anche gli altri quattro aspetti sono importanti e sono illustrati nei rispettivi pilastri del Framework AWS Well-Architected