Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
REL01-BP06 Assicurarsi che esista un intervallo sufficiente tra le quote correnti e l'utilizzo massimo per consentire il failover
Il presente articolo illustra come mantenere lo spazio tra la quota di risorse e l'utilizzo e i relativi vantaggi per la tua organizzazione. Una volta terminato l'utilizzo di una risorsa, la quota di utilizzo può continuare a essere conteggiata per tale risorsa, con possibile conseguenza di una risorsa in errore o inaccessibile. Evita tale errore nelle risorse verificando che le quote tengano conto della sovrapposizione di risorse in errore o inaccessibili e della rispettiva sostituzione. Prendi in considerazioni casi come errori della rete, errori della zona di disponibilità o errori della regione durante il calcolo di questo divario.
Risultato desiderato: è possibile coprire piccoli o grandi errori nelle risorse o nell'accessibilità delle risorse entro le attuali soglie di servizio, tenendo conto degli errori delle zone, di rete o addirittura regionali nella pianificazione delle risorse.
Anti-pattern comuni:
-
Impostazione delle quote di servizio in base alle esigenze attuali senza tenere conto degli scenari di failover.
-
Calcolo della quota massima per un servizio senza tenere conto dei principali della stabilità statica.
-
Calcolo della quota totale necessaria per ogni regione senza tenere conto delle potenziali risorse inaccessibili.
-
Non sono stati presi in considerazione i limiti di isolamento dagli errori di AWS servizio per alcuni servizi e i loro potenziali modelli di utilizzo anomali.
Vantaggi dell'adozione di questa best practice: in caso di eventi di interruzione del servizio che influiscono sulla disponibilità dell'applicazione, utilizza il cloud per implementare strategie di ripristino da tali eventi. Un esempio di strategia consiste nella creazione di risorse aggiuntive per sostituire quelle inaccessibili e soddisfare le condizioni di failover senza esaurire il limite del servizio.
Livello di rischio associato se questa best practice non fosse adottata: medio
Guida all'implementazione
Nel valutare un limite di quota, tieni conto dei casi di failover che possono verificarsi a causa di un peggioramento della situazione. Considera i casi di failover seguenti:
-
Un file interrotto o inaccessibile. VPC
-
Sottorete inaccessibile.
-
Zona di disponibilità degradata che influisce sull'accessibilità delle risorse.
-
Diversi instradamenti di rete o punti di ingresso e uscita bloccati o modificati.
-
Impatto di una regione degradata sull'accessibilità delle risorse.
-
Errore in un sottoinsieme di risorse in una regione o in una zona di disponibilità.
La decisione relativa all'avvio del failover è unica per ogni situazione, in quanto l'impatto aziendale può variare. Gestisci la pianificazione della capacità delle risorse nella posizione di failover e le quote delle risorse prima di decidere di effettuare il failover di un'applicazione o di un servizio.
Prendi in considerazione i picchi di attività più elevati del normale nell'esame delle quote per ciascun servizio. Questi picchi potrebbero essere correlati a risorse ancora attive ma inaccessibili a causa di reti o autorizzazioni. Le risorse attive non terminate vengono conteggiate rispetto al limite di quota del servizio.
Passaggi dell'implementazione
-
Mantieni uno spazio sufficiente tra la quota di servizio e l'utilizzo massimo in modo da gestire un failover o la perdita di accessibilità.
-
Determina le quote di servizio. Tieni conto di modelli di implementazione tipici, requisiti di disponibilità e crescita dei consumi.
-
Richiedi aumenti delle quote, se necessario. Prevedi un tempo di attesa per la richiesta di aumento della quota.
-
Determina i requisiti di affidabilità, noti anche come numero di 9.
-
Analizza i potenziali scenari di errore, come la perdita di un componente, di una zona di disponibilità o di una regione.
-
Stabilisci la metodologia di implementazione (ad esempio, canary, blu/verde, rosso/nero e rolling).
-
Includi un buffer appropriato rispetto al limite della quota attuale. Un esempio di buffer potrebbe essere del 15%.
-
Includi calcoli per la stabilità statica (zonale e regionale) laddove appropriato.
-
Pianifica la crescita dei consumi e monitora i trend di consumo.
-
Tieni conto dell'impatto della stabilità statica per i carichi di lavoro più critici. Valuta la conformità delle risorse a un sistema statisticamente stabile in tutte le regioni e le zone di disponibilità.
-
Valuta l'utilizzo di prenotazioni della capacità on demand per pianificare la capacità in anticipo rispetto a qualsiasi failover. Si tratta di una strategia utile da implementare per le pianificazioni aziendali critiche per ridurre i possibili rischi legati all'ottenimento della quantità e del tipo di risorse corretti durante il failover.
Risorse
Best practice correlate:
-
REL01-BP02 Gestisci le quote di servizio tra account e regioni
-
REL01-BP03 Soddisfa quote e vincoli di servizio fissi tramite l'architettura
-
REL10-BP01 Implementazione del carico di lavoro in diversi luoghi
-
REL11-BP01 Monitora tutti i componenti del carico di lavoro per rilevare i guasti
-
REL12-BP04 Test della resilienza tramite l'utilizzo dell'ingegneria del caos
Documenti correlati:
-
AWS Il pilastro dell'affidabilità di Well-Architected Framework: disponibilità
-
AWS Service Quotas (precedentemente denominate limiti di servizio)
-
APNPartner: partner che possono aiutare nella gestione della configurazione
-
Gestione del ciclo di vita dell'account in ambienti SaaS account-per-tenant su AWS
-
Gestione e monitoraggio della limitazione dei carichi di API lavoro
-
Visualizza i AWS Trusted Advisor consigli su larga scala con AWS Organizations
-
Automatizzazione degli aumenti dei limiti di servizio e del supporto aziendale con AWS Control Tower
Video correlati:
Strumenti correlati: