Cambio della modalità WLM Modifica della configurazione WLM

Gestione dei carichi di lavoro

È possibile configurare la funzionalità WLM di Amazon Redshift affinché venga eseguita in modalità automatica o manuale.

Con Amazon Redshift puoi gestire e assegnare la priorità alle query e ai carichi di lavoro simultanei degli utenti per ottimizzare le prestazioni e l’utilizzo delle risorse. La gestione dei carichi di lavoro consente di definire le code, i gruppi di utenti e altri costrutti per controllare le risorse allocate a diversi tipi di query o utenti.

Nella seguenti sezioni vengono descritte le funzionalità specifiche di gestione dei carichi di lavoro in Amazon Redshift e ne vengono illustrati la configurazione e il monitoraggio.

WLM automatico

Per massimizzare la velocità effettiva del sistema e utilizzare le risorse in modo efficace, è possibile consentire ad Amazon Redshift di gestire il modo in cui le risorse sono divise per l'esecuzione simultanea di query con la WLM automatica. La gestione del carico di lavoro (WLM) automatica gestisce le risorse necessarie per eseguire query. Amazon Redshift determina la quantità di query eseguite simultaneamente e la quantità di memoria allocata a ogni query inviata. Usa Auto WLM se desideri che Amazon Redshift gestisca il modo in cui le risorse sono divise per l'esecuzione simultanea di query. Per ulteriori informazioni, consulta Implementazione del WLM automatico.

Utilizzando il dimensionamento simultaneo e il WLM automatico, puoi supportare un numero virtualmente illimitato di utenti simultanei e query simultanee, con prestazioni di query a velocità costante. Per ulteriori informazioni, consulta Dimensionamento simultaneo.

Nota

Nella maggior parte dei casi consigliamo di utilizzare WLM automatica. Se utilizzi WLM manuale e desideri migrare da WLM automatica, consulta Migrazione da WLM manuale a WLM automatico.

Con WLM automatica puoi definire le priorità delle query per i carichi di lavoro in coda. Per ulteriori informazioni sulla priorità delle query, consulta Priorità delle query.

WLM manuale

Potrebbero esserci più sessioni o utenti che eseguono le query contemporaneamente. Alcune query potrebbero consumare le risorse dei cluster per lunghi periodi di tempo e influire sulle prestazioni di altre query. WLM manuale può aiutarti nella gestione nei casi d’uso specializzati. Usa Manual WLM quando desideri un maggiore controllo sulla simultaneità.

Puoi gestire le prestazioni del sistema modificando la configurazione WLM per creare code separate per le query a esecuzione prolungata e a esecuzione breve. In fase di runtime, puoi indirizzare le query a queste code in base ai gruppi di utenti o ai gruppi di query.

Puoi impostare le regole per indirizzare le query alle specifiche code in base all'utente che esegue la query o alle etichette specificate. Puoi inoltre configurare la quantità di memoria allocata a ciascuna coda, in modo che le query di grandi dimensioni vengano eseguite nelle code con più memoria rispetto alle altre code. È inoltre possibile configurare una regola di monitoraggio di query (QMR) per limitare le query con tempi di esecuzione lunghi. Per ulteriori informazioni, consultare Implementazione di WLM manuale.

Nota

Consigliamo di configurare le code di query WLM manuale con al massimo un totale di 15 slot di query. Per ulteriori informazioni, consulta Livello di simultaneità.

Si noti che per quanto riguarda una configurazione WLM manuale, il numero massimo di slot che è possibile allocare a una coda è 50. Tuttavia, ciò non significa che in una configurazione WLM automatica, un cluster di Amazon Redshift esegua sempre 50 query contemporaneamente. Questo può cambiare in base alle esigenze di memoria o ad altri tipi di allocazione delle risorse nel cluster.

Argomenti

Cambio della modalità WLM

Puoi abilitare WLM automatica o manuale utilizzando la console Amazon Redshift:

Selezionare Switch WLM mode (Cambia modalità WLM).
Per impostare WLM automatica, seleziona WLM automatica. In questo modo, vengono utilizzate fino a otto code per gestire le query ed entrambi i campi Memory (Memoria) e Concurrency on main (Simultaneità su principale) sono impostati su auto. Inoltre la priorità predefinita delle query è impostata su Normale.
Per abilitare la configurazione manuale con la console Amazon Redshift, passa a WLM manuale. In questo modo, specifichi le code utilizzate per gestire le query e i valori dei campi Memory (Memoria) e Concurrency on main (Simultaneità su principale). Con la configurazione manuale, puoi configurare fino a otto code di query e impostare il numero di query che possono essere eseguite contemporaneamente in ciascuna di queste code.

Modifica della configurazione WLM

Il modo più semplice per modificare la configurazione WLM consiste nell'usare la console Amazon Redshift. Puoi anche utilizzare l' AWS CLI API o Amazon Redshift.

Quando alterni le impostazioni del cluster tra WLM automatico e manuale, il cluster viene impostato sullo stato pending reboot. La modifica non ha effetto fino al riavvio successivo del cluster.

Per informazioni dettagliate sulla modifica delle configurazioni WLM, consulta Configurazione della gestione del carico di lavoro nella Guida alla gestione di Amazon Redshift.

Migrazione da WLM manuale a WLM automatico

Per massimizzare il troughput di sistema e utilizzare le risorse in modo più efficace, consigliamo la configurazione del WLM automatico per le code. Tieni a mente il seguente approccio per configurare una transizione senza ostacoli dal WLM manuale al WLM automatico.

Per effettuare la migrazione dal WLM manuale al WLM automatico e utilizzare le priorità di query, consigliamo di creare un nuovo gruppo di parametri e di collegarlo al cluster. Per ulteriori informazioni, consulta Gruppi di parametri di Amazon Redshift nella Guida alla gestione di Amazon Redshift.

Importante

Se modifichi il gruppo di parametri o se passi dal WLM manuale al WLM automatico, è necessario riavviare il cluster. Per ulteriori informazioni, consultare Proprietà di configurazione dinamiche e statiche WLM.

Prendiamo un esempio in cui ci sono tre code con WLM manuale. Una coda ciascuna per un carico di lavoro ETL, un carico analitico e uno di data science. Il carico di lavoro ETL viene eseguito ogni 6 ore, quello analitico durante tutto il giorno e il carico di data science può avere picchi in qualsiasi momento. Con il WLM manuale, specifichi la memoria e la simultaneità di ogni coda del carico di lavoro in base all'importanza di ogni carico per il business. Specificare la memoria e la simultaneità non è solo difficile da immaginare, ma produce anche un partizionamento statico delle risorse del cluster, che vengono così sprecate se è in esecuzione solo un sottoinsieme dei carichi di lavoro.

Puoi utilizzare il WLM automatico con priorità di query per indicare le priorità relative dei carichi di lavoro, evitando i problemi precedenti. Per questo esempio, effettua la procedura riportata di seguito:

Creare un nuovo parametro e passare alla modalità Auto WLM (WLM automatico).
Aggiungere code per ognuno dei tre carichi di lavoro: ETL, analitico e di data science. Utilizzare gli stessi gruppi di utenti per ogni carico di lavoro che è stato utilizzato con modalità Manual WLM (WLM manuale).
Impostare la priorità per il carico di lavoro ETL su High, del carico di lavoro analitico su Normal e di quello di data science su Low. Tali priorità rispecchiano le priorità aziendali dei diversi carichi di lavoro o gruppi di utenti.
Opzionalmente, si può abilitare il dimensionamento simultaneo per la coda del carico di lavoro analitico o di data science in modo che le query in queste code raggiungano prestazioni coerenti anche quando il carico di lavoro ETL viene eseguito ogni 6 ore.

Con le priorità di query, quando solo il carico di lavoro analitico è in esecuzione nel cluster, riceve tutte le risorse. Ciò garantisce una velocità di trasmissione effettiva elevata con un migliore utilizzo del sistema. Tuttavia, quando si avvia il carico di lavoro ETL, questo ha la precedenza, dal momento che ha una priorità maggiore. Le query eseguite come parte del carico di lavoro ETL hanno la priorità durante l'ammissione oltre a un'allocazione preferenziale delle risorse dopo l'ammissione. Di conseguenza, il carico di lavoro ETL ottiene prestazioni prevedibili indipendentemente da qualsiasi altra operazione in esecuzione nel sistema. Le prestazioni prevedibili di un carico di lavoro con priorità elevata sono disponibili a scapito di altri carichi di lavoro con priorità minore che vengono eseguiti per un tempo più lungo, perché le query attendono il completamento di query più importanti. Oppure perché ricevono una frazione più piccola di risorse quando vengono eseguite simultaneamente a query con priorità maggiore. Gli algoritmi di pianificazione utilizzati da Amazon Redshift fanno in modo che le query con priorità minori non soffrano di un uso scarso delle risorse, ma che continuino ad avanzare, seppure a un ritmo più lento.

Nota

Il campo timeout non è disponibile nel WLM automatico. Utilizza invece la regola QMR, query_execution_time. Per ulteriori informazioni, consultare Regole di monitoraggio delle query WLM.
L'operazione QMR, HOP, non è applicabile al WLM automatico. Utilizza invece l'operazione change priority. Per ulteriori informazioni, consulta Regole di monitoraggio delle query WLM.
I cluster utilizzano le code WLM automatiche e manuali in modo diverso, il che può creare confusione con le configurazioni. Ad esempio, è possibile configurare la proprietà di priorità nelle code WLM automatiche ma non nelle code WLM manuali. Per questo motivo, all'interno di un gruppo di parametri è preferibile evitare il mix tra code WLM automatiche e code WLM manuali. Crea invece un nuovo gruppo di parametri durante la migrazione al WLM automatico.

Avvertimento JavaScript è disabilitato o non è disponibile nel tuo browser.

Per usare la documentazione AWS, JavaScript deve essere abilitato. Consulta le pagine della guida del browser per le istruzioni.

Convenzioni dei documenti

Impostazione del parametro delle dimensioni del recupero JDBC

WLM automatico