Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Capacità di calcolo per Amazon Redshift Serverless
Con Amazon Redshift Serverless puoi scalare automaticamente la capacità di calcolo verso l'alto e verso il basso per soddisfare i requisiti del tuo carico di lavoro. La capacità di elaborazione si riferisce alla potenza di elaborazione e alla memoria allocate ai carichi di lavoro Serverless di Amazon Redshift. I casi d'uso più comuni includono la gestione dei periodi di picco di traffico, l'esecuzione di analisi complesse o l'elaborazione efficiente di grandi volumi di dati. I seguenti termini forniscono dettagli sulla configurazione e la gestione della capacità di elaborazione.
RPUs
Amazon Redshift Serverless misura la capacità di data warehouse nelle unità di elaborazione Redshift (). RPUs RPUs sono risorse utilizzate per gestire i carichi di lavoro.
Capacità base
Rappresenta la capacità di base del data warehouse utilizzata da Amazon Redshift per elaborare le query. La capacità di base è specificata in RPUs. È possibile impostare una capacità di base in Redshift Processing Units ()RPUs. Una RPU fornisce 16 GB di memoria. L'impostazione di una capacità di base superiore migliora le prestazioni delle query, in particolare per i processi di elaborazione dati che consumano molte risorse. La capacità di base predefinita per Amazon Redshift Serverless è 128. RPUs Puoi regolare l'impostazione della capacità di base da 8 RPUs a 512 RPUs in unità da 8 (8,16,24... 512), utilizzando la AWS console, il funzionamento dell'UpdateWorkgroup
API o update-workgroup
l'operazione in. AWS CLI
Con una capacità minima di 8 RPU, ora si ha maggiore flessibilità per eseguire carichi di lavoro sia semplici che complessi in base ai requisiti di prestazioni. Le capacità RPU di base da 8, 16 e 24 RPU sono destinate a carichi di lavoro che richiedono meno di 128 TB di dati. Se i requisiti di dati sono superiori a 128 TB, è necessario utilizzare un minimo di 32 RPU. Per i carichi di lavoro con tabelle con un elevato numero di colonne numeriche e maggiore simultaneità, si consiglia di utilizzare 32 o più RPU.
La base massima RPUs disponibile, 512, aggiunge il massimo livello di risorse di elaborazione ai carichi di lavoro. Ciò offre una maggiore flessibilità per supportare carichi di lavoro di grande complessità e accelera il caricamento e l'interrogazione dei dati.
Nota
Una capacità RPU di base massima estesa di 1024 è disponibile nelle versioni seguenti: Regioni AWS
Stati Uniti orientali (Virginia settentrionale)
Stati Uniti orientali (Ohio)
-
US West (Oregon)
-
Europa (Irlanda)
-
Europa (Francoforte)
È possibile incrementare o diminuire RPUs in unità di 32 quando si imposta una capacità di base tra 512-1024.
Se gestisci carichi di lavoro più grandi e complessi, valuta la possibilità di aumentare le dimensioni del tuo data warehouse Redshift Serverless. I magazzini più grandi hanno accesso a più risorse di elaborazione, il che consente loro di elaborare le query in modo più efficiente. Si noti che l'aumento della capacità RPU di base massima del gruppo di lavoro richiede ulteriori indirizzi IP gratuiti. Per ulteriori informazioni sull'aumento dei requisiti di indirizzi IP gratuiti, consulta. Considerazioni su quando utilizzare Amazon Redshift Serverless
Di seguito sono riportati alcuni casi in cui è utile disporre di una capacità di base più elevata:
Sono presenti interrogazioni complesse che richiedono molto tempo per essere eseguite
Le tabelle hanno un numero elevato di colonne.
Le tue query hanno un numero elevato di JOINs.
Le tue query aggregano o scansionano grandi quantità di dati da una fonte esterna, come un data lake.
Per ulteriori informazioni sulle quote e i limiti di Amazon Redshift Serverless, consulta. Quote per gli oggetti Amazon Redshift Serverless
Considerazioni e limitazioni per la capacità di Amazon Redshift serverless
Di seguito sono riportate le considerazioni e limitazioni per la capacità di Amazon Redshift serverless.
-
Le configurazioni da 8 o 16 RPU supportano una capacità di archiviazione gestita da Redshift fino a 128 TB. Se utilizzi più di 128 TB di archiviazione gestita, non è possibile effettuare il downgrade a meno di 32 RPU.
-
La modifica della capacità di base del gruppo di lavoro potrebbe annullare alcune delle query in esecuzione sul gruppo di lavoro.
-
Amazon Redshift Serverless non aumenterà la scalabilità a RPUs meno che non ci siano domande in coda. Amazon Redshift Serverless non aumenterà la scalabilità RPUs in risposta all'aumento del carico derivante da una singola query. Di conseguenza, una singola query che richiede molte risorse può causare l'esaurimento della memoria del gruppo di lavoro se non esiste la capacità attuale per gestirla. Assicurati che la capacità di base sia sufficiente per gestire ogni singola query eseguita sul tuo data warehouse.
Scalabilità e ottimizzazione basate sull'intelligenza artificiale
La funzionalità di scalabilità e ottimizzazione basata sull'intelligenza artificiale è disponibile in tutte le AWS regioni in cui è disponibile Amazon Redshift Serverless.
Amazon Redshift Serverless offre una funzionalità avanzata di scalabilità e ottimizzazione basata sull'intelligenza artificiale per soddisfare diversi requisiti di carichi di lavoro. I data warehouse possono presentare i seguenti problemi di provisioning:
I data warehouse potrebbero essere sovradimensionati per migliorare le prestazioni delle query che richiedono un uso intensivo di risorse
I data warehouse potrebbero non disporre di risorse sufficienti per ridurre i costi.
Trovare il giusto equilibrio tra prestazioni e costi per i carichi di lavoro del data warehouse è difficile, soprattutto con query ad hoc e volumi di dati in crescita. Quando si eseguono carichi di lavoro misti, che comprendono query a bassa e alta intensità di risorse, è necessaria una scalabilità intelligente. La funzionalità di scalabilità e ottimizzazione basata sull'intelligenza artificiale ridimensiona automaticamente l'elaborazione serverless o in risposta alla crescita dei dati. RPUs Questa funzionalità aiuta anche a mantenere le prestazioni delle query entro obiettivi mirati in termini di prezzo/prestazioni. La scalabilità e l'ottimizzazione basate sull'intelligenza artificiale allocano dinamicamente le risorse di elaborazione man mano che i volumi di dati aumentano, garantendo che le query continuino a soddisfare gli obiettivi prestazionali. La scalabilità e l'ottimizzazione basate sull'intelligenza artificiale consentono al servizio di adattarsi senza problemi ai mutevoli requisiti del carico di lavoro, senza la necessità di interventi manuali o di una complessa pianificazione della capacità.
Amazon Redshift Serverless offre una soluzione di scalabilità più completa e reattiva basata su fattori quali la complessità delle query e il volume dei dati. Questa funzionalità consente di ottimizzare il rapporto prezzo/prestazioni dei carichi di lavoro pur mantenendo la flessibilità necessaria per gestire in modo efficiente carichi di lavoro diversi e set di dati in crescita. Amazon Redshift Serverless può apportare automaticamente ottimizzazioni basate sull'intelligenza artificiale al tuo endpoint Amazon Redshift Serverless per soddisfare gli obiettivi di prezzo/prestazioni specificati per il tuo gruppo di lavoro Serverless. Questa ottimizzazione automatica del rapporto prezzo/prestazioni è particolarmente utile se non sai quale capacità di base impostare per i carichi di lavoro o se alcune parti del carico di lavoro potrebbero essere più efficienti con un numero maggiore di risorse allocate.
Esempio
Se la tua organizzazione in genere esegue carichi di lavoro che richiedono solo 32 RPU ma introduce improvvisamente una query più complessa, potresti non conoscere la capacità di base appropriata. L'impostazione di una capacità di base più elevata offre prestazioni migliori ma comporta anche costi più elevati, pertanto il costo potrebbe non corrispondere alle aspettative. Utilizzando la scalabilità basata sull'intelligenza artificiale e l'ottimizzazione delle risorse, Amazon Redshift Serverless regola automaticamente le impostazioni RPUs per soddisfare gli obiettivi di rapporto prezzo/prestazioni, mantenendo al contempo i costi ottimizzati per l'organizzazione. Questa ottimizzazione automatica è utile indipendentemente dalla dimensione del carico di lavoro. L'ottimizzazione automatica consente di raggiungere gli obiettivi di rapporto prezzo/prestazioni dell'organizzazione in presenza di un numero illimitato di query complesse.
Nota
Gli obiettivi di rapporto prezzo/prestazioni sono un'impostazione specifica del gruppo di lavoro. Gruppi di lavoro diversi possono avere obiettivi di rapporto prezzo/prestazioni diversi.
Per mantenere i costi prevedibili, imposta il limite di capacità massima che Amazon Redshift serverless può allocare ai carichi di lavoro.
Per configurare gli obiettivi di rapporto prezzo/prestazioni, usa la console. AWS È necessario abilitare esplicitamente il proprio obiettivo di rapporto prezzo/prestazioni quando si crea il gruppo di lavoro Serverless. È inoltre possibile modificare l'obiettivo di rapporto prezzo/prestazioni dopo aver creato il gruppo di lavoro Serverless. Quando si abilita l'obiettivo prezzo-prestazioni, per impostazione predefinita viene impostato su Bilanciato.
Per modificare l'obiettivo di rapporto prezzo/prestazioni per il gruppo di lavoro
Nella console Amazon Redshift Serverless, scegli la configurazione Workgroup.
Scegli il gruppo di lavoro per cui desideri modificare l'obiettivo di rapporto prezzo/prestazioni. Seleziona la scheda Prestazioni e scegli Modifica.
Scegli l'obiettivo di rapporto prezzo/prestazioni e regola il cursore in base all'impostazione desiderata.
Scegli Save changes (Salva modifiche).
Per aggiornare la quantità massima RPUs che Amazon Redshift Serverless può allocare al tuo carico di lavoro, scegli la scheda Limiti della sezione Configurazione del gruppo di lavoro.
Puoi utilizzare il cursore Prezzo-Prestazioni target per impostare l'equilibrio desiderato tra costi e prestazioni. Spostando il cursore, puoi scegliere una delle seguenti opzioni:
Ottimizza i costi: questa impostazione dà priorità al risparmio sui costi. Amazon Redshift Serverless tenta di aumentare automaticamente la capacità di elaborazione, in questo caso non comporta costi aggiuntivi. Amazon Redshift Serverless tenta inoltre di ridimensionare le risorse di elaborazione a costi inferiori, possibilmente aumentando i tempi di esecuzione delle query.
Bilanciato: questa impostazione crea un equilibrio tra prestazioni e costi. Amazon Redshift Serverless è scalabile in base alle prestazioni e può comportare un aumento o una diminuzione moderata dei costi. Questa è l'impostazione consigliata per la maggior parte dei data warehouse Serverless Amazon Redshift.
Ottimizza le prestazioni: questa impostazione dà priorità alle prestazioni. Amazon Redshift è scalabile in modo aggressivo per prestazioni elevate, con potenziali costi più elevati.
Posizioni intermedie: puoi anche impostare il cursore su una delle due posizioni intermedie tra Balanced e Optimize for cost o Optimize for Performance. Utilizzate queste impostazioni se l'ottimizzazione completa dei costi o delle prestazioni è troppo estrema.
Considerazioni da prendere in considerazione nella scelta del vostro obiettivo di rapporto prezzo/prestazioni
Puoi utilizzare il cursore del rapporto prezzo/prestazioni per scegliere l'obiettivo di rapporto prezzo/prestazioni desiderato per il tuo carico di lavoro. L'algoritmo di scalabilità e ottimizzazione basato sull'intelligenza artificiale apprende nel tempo dalla cronologia del carico di lavoro e migliora la precisione delle previsioni e delle decisioni.
Esempio
Per questo esempio, supponiamo che una query richieda sette minuti e costi 7 USD. La figura seguente mostra i tempi di esecuzione e i costi delle query senza scalabilità.

Una determinata query potrebbe scalare in diversi modi, come illustrato di seguito. In base all'obiettivo di rapporto prezzo/prestazioni scelto, la scalabilità basata sull'intelligenza artificiale prevede in che modo la query permetta di bilanciare prestazioni e costi e la ridimensiona di conseguenza. La scelta delle diverse opzioni di scorrimento produce i seguenti risultati:

Ottimizzazione dei costi: con l'opzione Optimizes for Cost, il tuo data warehouse si ridimensiona favorendo scelte che riducono i costi. Nell'esempio precedente, l'approccio di scalabilità super lineare dimostra questo comportamento. Il ridimensionamento avverrà solo se può essere eseguito in modo conveniente in base alle previsioni del modello di scalabilità. Se i modelli di scalabilità prevedono che una scalabilità ottimizzata in termini di costi non sia possibile per un determinato carico di lavoro, il data warehouse non sarà scalabile.
Bilanciato: con l'opzione Balanced, il sistema è scalabile bilanciando al contempo considerazioni in termini di costi e prestazioni, con un potenziale aumento limitato dei costi. L'opzione Balanced esegue una scalabilità del carico di lavoro superlineare, lineare e possibilmente sublineare.
Ottimizza le prestazioni: con l'opzione Optimizes for Performance, oltre ai metodi precedenti per migliorare le prestazioni, il sistema è scalabile anche se i costi sono più elevati e possibilmente non proporzionali al miglioramento del runtime. Con Optimizes for Performance, il sistema esegue il ridimensionamento superlineare, il ridimensionamento lineare e il ridimensionamento sublineare, se possibile. Più il cursore si avvicina alla posizione Optimizes for Performance, più Amazon Redshift Serverless consente la scalabilità sublineare.
Tieni presente quanto segue quando imposti il cursore Price-Performance:
Puoi modificare l'impostazione del rapporto prezzo/prestazioni in qualsiasi momento, ma la scalabilità del carico di lavoro non cambierà immediatamente. La scalabilità cambia nel tempo man mano che il sistema viene a conoscenza del carico di lavoro corrente. Suggeriamo di monitorare un gruppo di lavoro Serverless per 1-3 giorni per verificare l'impatto della nuova impostazione.
Le opzioni di scorrimento prezzo/prestazioni Max capacity e Max RPU-Hours funzionano insieme. La capacità massima e l'ora massima di RPU sono i controlli per limitare il massimo che Amazon RPUs Redshift Serverless consente al data warehouse di scalare e il numero massimo di ore RPU che Amazon Redshift Serverless consente al data warehouse di consumare. Amazon Redshift Serverless rispetta e applica sempre queste impostazioni, indipendentemente dall'obiettivo di rapporto prezzo/prestazioni.
Monitoraggio della scalabilità automatica delle risorse
È possibile monitorare il ridimensionamento dell'RPU basato sull'intelligenza artificiale nei seguenti modi:
Consulta il grafico della capacità RPU utilizzata sulla console Amazon Redshift.
Monitora la
ComputeCapacity
metrica in entrata e in uscitaAWS/Redshift-Serverless
.Workgroup
CloudWatchInterroga la vista SYS_QUERY_HISTORY. Fornite l'ID o il testo della query specifici per identificare il periodo di tempo. Utilizzate questo periodo di tempo per interrogare la vista del sistema SYS_SERVERLESS_USAGE per trovare il valore.
compute_capacity
Ilcompute_capacity
campo mostra la scala durante l'esecuzione della query. RPUs
Utilizzate l'esempio seguente per interrogare la SYS_QUERY_HISTORY
vista. Sostituite il valore di esempio con il testo della query.
select query_id,query_text,start_time,end_time, elapsed_time/1000000.0 duration_in_seconds
from sys_query_history
where query_text like '<query_text>
'
and query_text not like '%sys_query_history%'
order by start_time desc
Esegui la seguente query per vedere in che modo è compute_capacity
stata ridimensionata durante il periodo dal start_time
alend_time
. Sostituisci start_time
e end_time
nella seguente query con l'output della query precedente:
select * from sys_serverless_usage where end_time >= '
start_time
' and end_time <= DATEADD(minute,1,'end_time
') order by end_time asc
Per step-by-step istruzioni sull'uso di queste funzionalità, consulta Configurare monitoraggio, limiti e allarmi in Amazon Redshift Serverless per mantenere
Considerazioni sull'utilizzo della scalabilità e dell'ottimizzazione basate sull'intelligenza artificiale
Quando utilizzi la scalabilità e l'ottimizzazione basate sull'intelligenza artificiale, considera quanto segue:
Per i carichi di lavoro esistenti su Amazon Redshift Serverless che richiedono da 32 a 512 RPU di base, consigliamo di utilizzare la scalabilità e l'ottimizzazione basate sull'intelligenza artificiale di Amazon Redshift Serverless per ottenere risultati ottimali. Non è consigliabile utilizzare questa funzionalità per carichi di lavoro con meno di 32 RPU di base o più di 512 RPU di base.
Gli obiettivi di rapporto prezzo/prestazioni ottimizzano automaticamente il carico di lavoro, sebbene i risultati possano variare. Ti consigliamo di utilizzare questa funzionalità nel tempo in modo che il sistema possa apprendere i modelli specifici eseguendo un carico di lavoro rappresentativo.
La scalabilità e l'ottimizzazione basate sull'intelligenza artificiale utilizzano tempi ottimali per applicare le ottimizzazioni ai gruppi di lavoro Serverless a seconda del carico di lavoro in esecuzione sull'istanza Serverless di Amazon Redshift.
Per informazioni sull'ottimizzazione e sul dimensionamento delle risorse basati sull'intelligenza artificiale, guarda il video seguente.