REL07-BP02 Ottenimento di risorse quando viene rilevata la compromissione di un carico di lavoro - Pilastro dell'affidabilità

REL07-BP02 Ottenimento di risorse quando viene rilevata la compromissione di un carico di lavoro

All'occorrenza, procedi a scalare le risorse in modo reattivo se la disponibilità è influenzata per ripristinare la disponibilità del carico di lavoro.

Devi prima configurare il controllo dell'integrità e i criteri su questi controlli per indicare quando la disponibilità è influenzata dalla mancanza di risorse. Quindi invita il personale appropriato a scalare manualmente la risorsa o attivare l'automazione per dimensionarla automaticamente.

Il dimensionamento può essere regolato manualmente in base al carico di lavoro, ad esempio modificando il numero di istanze EC2 in un gruppo Auto Scaling o modificando il throughput di una tabella DynamoDB tramite la AWS Management Console o AWS CLI). Tuttavia, è opportuno ricorrere all'automazione ogni volta che è possibile (consulta Utilizzo dell'automazione per l'acquisizione o il dimensionamento delle risorse).

Risultato desiderato: avvio di operazioni di dimensionamento (in automatico o manualmente) per il ripristino della disponibilità in caso di rilevamento di un guasto o di un peggioramento dell'esperienza del cliente.

Livello di rischio associato se questa best practice non fosse adottata: medio

Guida all'implementazione

Implementa l'osservabilità e il monitoraggio su tutti i componenti del carico di lavoro, per monitorare l'esperienza del cliente e rilevare i guasti. Definisci le procedure, manuali o automatizzate, per scalare le risorse richieste. Per ulteriori informazioni, consulta REL11-BP01 Monitoraggio di tutti i componenti del carico di lavoro per la rilevazione dei guasti.

Passaggi dell'implementazione

  • Definisci le procedure (manuali o automatiche) per scalare le risorse richieste.

    • Le procedure di dimensionamento dipendono da come sono progettati i diversi componenti del carico di lavoro.

    • Le procedure di dimensionamento variano anche a seconda della tecnologia sottostante utilizzata.

      • I componenti che utilizzano AWS Auto Scaling possono impiegare piani di dimensionamento per configurare una serie di istruzioni per scalare le risorse. Se si lavora con AWS CloudFormation o si aggiungono tag a risorse AWS, è possibile impostare piani di dimensionamento per diversi set di risorse, per applicazione. Auto Scaling fornisce raccomandazioni per strategie di dimensionamento personalizzate per ogni risorsa. Dopo aver creato il piano di dimensionamento, Auto Scaling combina i metodi di dimensionamento dinamico e predittivo per supportare la tua strategia di dimensionamento. Per ulteriori informazioni, consulta How scaling plans work.

      • Amazon EC2 Auto Scaling verifica la disponibilità del numero corretto di istanze Amazon EC2 per gestire il carico dell'applicazione. È possibile creare raccolte di istanze EC2, denominate gruppi Auto Scaling. Puoi specificare il numero minimo e massimo di istanze in ogni gruppo Auto Scaling. Amazon EC2 Auto Scaling garantisce che il gruppo non superi mai o scenda al di sotto di questi limiti. Per ulteriori informazioni, consulta What is Amazon EC2 Auto Scaling?

      • La scalabilità automatica di Amazon DynamoDB utilizza il servizio Application Auto Scaling per regolare in modo dinamico la capacità effettiva di trasmissione allocata per conto tuo in risposta ai modelli di traffico effettivi. In tal modo una tabella o un indice secondario globale può aumentare la capacità di lettura e scrittura allocata per gestire improvvisi aumenti di traffico, senza limitazione (della larghezza di banda della rete). Per ulteriori dettagli, consulta Managing throughput capacity automatically with DynamoDB auto scaling.

Risorse

Best practice correlate:

Documenti correlati: