Gestione del carico con istanze basate sul tempo e sul carico - AWS OpsWorks

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Gestione del carico con istanze basate sul tempo e sul carico

Importante

Il AWS OpsWorks Stacks servizio ha raggiunto la fine del ciclo di vita il 26 maggio 2024 ed è stato disattivato sia per i clienti nuovi che per quelli esistenti. Consigliamo vivamente ai clienti di migrare i propri carichi di lavoro verso altre soluzioni il prima possibile. Se hai domande sulla migrazione, contatta il AWS Support Team su AWS re:post o tramite Premium AWS Support.

Poiché il traffico in entrata può variare, lo stack può disporre di un numero insufficiente o di un numero eccessivo di istanze per gestire il carico. Puoi risparmiare tempo e denaro utilizzando istanze basate sull'orario o istanze basate sul carico per aumentare o ridurre automaticamente le istanze di un livello in modo da avere sempre il numero sufficiente di istanze per poter gestire il traffico in entrata in modo adeguato senza dover sostenere i costi relativi a una capacità superflua. Non è necessario monitorare i carichi del server o avviare o arrestare manualmente le istanze. Inoltre, le istanze basate sull'orario e le istanze basate sul carico eseguono automaticamente le operazioni di distribuzione, dimensionamento e bilanciamento delle applicazioni su più zone di disponibilità all'interno di una regione, garantendo la ridondanza e la scalabilità a livello geografico.

Il dimensionamento automatico si basa su due tipi di istanza, che regolano le istanze online di un livello in base a criteri diversi:

  • Istanze basate sull'orario

    Consentono a uno stack di gestire i carichi in base a un modello prevedibile includendo le istanze che vengono eseguite alle ore o nei giorni specificati. Ad esempio, puoi avviare alcune istanze dopo le 18 per eseguire operazioni di backup di particolare entità oppure arrestare alcune istanze durante il fine settimana quando il traffico è meno intenso.

  • Istanze basate sul carico

    Consentono a uno stack di gestire carichi variabili avviando istanze aggiuntive quando il traffico è elevato e arrestando istanze quando il traffico è meno intenso, in base a vari parametri relativi al carico. Ad esempio, puoi fare in modo che AWS OpsWorks Stacks avvii le istanze quando l'utilizzo medio della CPU supera l'80% e interrompano le istanze quando il carico medio della CPU scende al di sotto del 60%.

Le istanze basate sull'orario e le istanze basate sul carico sono entrambe supportate per gli stack Linux, mentre per gli stack Windows sono supportate solo le istanze basate sull'orario.

A differenza delle istanze di tipo 24 ore su 24, 7 giorni su 7, che devono essere avviate e arrestate manualmente, non devi avviare o arrestare manualmente le istanze basate sull'orario o quelle basate sul carico. Invece, configuri le istanze e AWS OpsWorks Stacks le avvia o le arresta in base alla loro configurazione. Ad esempio, configuri le istanze basate sul tempo in modo che si avviino e si interrompano in base a una pianificazione specifica. AWS OpsWorks Stacks avvia e arresta quindi le istanze in base a tale configurazione.

In genere è consigliabile utilizzare congiuntamente tutti e tre i tipi di istanza, come descritto di seguito.

  • Un set di istanze 24 ore su 24, 7 giorni su 7 per gestire il carico di base. In genere devi semplicemente avviare questo tipo di istanze e lasciare in esecuzione in modo continuativo.

  • Un insieme di istanze basate sul tempo, che AWS OpsWorks Stacks avvia e interrompe per gestire variazioni prevedibili del traffico. Ad esempio, se durante l'orario di lavoro il traffico è elevato, puoi configurare le istanze basate sull'orario in modo che vengano avviate e arrestate rispettivamente all'inizio e alla fine dell'orario di lavoro.

  • Un set di istanze basate sul carico, che AWS OpsWorks Stacks avvia e interrompe per gestire variazioni di traffico imprevedibili. AWS OpsWorks Stacks le avvia quando il carico si avvicina alla capacità delle istanze degli stack 24 ore su 24, 7 giorni su 7 e basate sul tempo, e le interrompe quando il traffico torna alla normalità.

Per ulteriori informazioni su come usare questi modelli di dimensionamento, consulta Ottimizzazione del numero di server.

Nota

Se hai creato app per il livello delle istanze o creato libri di cucina personalizzati, AWS OpsWorks Stacks distribuisce automaticamente la versione più recente sulle istanze basate sul tempo e sul caricamento al primo avvio. Tuttavia, AWS OpsWorks Stacks non distribuisce necessariamente i libri di cucina più recenti su istanze offline riavviate. Per ulteriori informazioni, consulta Modifica delle app e Aggiornamento dei libri di ricette personalizzati.

In che modo il ridimensionamento basato sul carico differisce dalla riparazione automatica

Il dimensionamento automatico basato sul carico utilizza i parametri relativi al carico per i quali viene calcolata una media tra tutte le istanze in esecuzione. Se le metriche rimangono tra le soglie specificate, AWS OpsWorks Stacks non avvia né interrompe alcuna istanza. Con la correzione automatica, invece, AWS OpsWorks Stacks avvia automaticamente una nuova istanza con la stessa configurazione quando un'istanza smette di rispondere. L'istanza potrebbe non essere in grado di rispondere a causa di un problema di rete o di un problema al suo interno.

Ad esempio, supponiamo che la soglia di upscaling della CPU sia dell'80% e che un'istanza smetta di rispondere.

  • Se la riparazione automatica è disattivata e le restanti istanze in esecuzione riescono a mantenere l'utilizzo medio della CPU al di sotto dell'80%, AWS OpsWorks Stacks non avvia una nuova istanza. Avvierà un'istanza di sostituzione solo se l'utilizzo medio della CPU tra tutte le restanti istanze supera l'80%.

  • Se la riparazione automatica è abilitata, AWS OpsWorks Stacks avvia un'istanza sostitutiva indipendentemente dalle soglie di carico.