Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Cluster con provisioning di Amazon Redshift
Un data warehouse Amazon Redshift è costituito da un insieme di risorse di calcolo denominate nodi, strutturate in un gruppo denominato cluster. Ciascun cluster esegue un motore Amazon Redshift e contiene uno o più database.
Nota
Al momento è disponibile il motore Amazon Redshift versione 1.0. Tuttavia, poiché il motore viene costantemente aggiornato, è possibile che siano disponibili più versioni del motore Amazon Redshift.
Cluster e nodi in Amazon Redshift
Un cluster Amazon Redshift è costituito da nodi. Ogni cluster include un nodo principale e uno o più nodi di calcolo. Il nodo principale riceve le query dalle applicazioni client, analizza le query e quindi genera i piani di esecuzione delle query. Il nodo principale coordina quindi l'esecuzione parallela di questi piani con i nodi di calcolo e aggrega i risultati intermedi da tali nodi. Restituisce infine i risultati alle applicazioni client.
I nodi di calcolo eseguono i piani di esecuzione delle query e si scambiano i dati necessari per elaborare tali query. I risultati intermedi vengono quindi inviati al nodo principale per l'aggregazione prima di essere reinviati alle applicazioni client. Per ulteriori informazioni sui nodi principali e sui nodi di calcolo, consultare Architettura del sistema di data warehouse nella Guida per gli amministratori di database di Amazon Redshift.
Nota
Quando crei un cluster sulla console Amazon Redshift (https://console.aws.amazon.com/redshiftv2/
Quando si avvia un cluster, una delle opzioni da specificare è il tipo di nodo. Il tipo di nodo determina la CPU capacità di archiviazione e il tipo di unità di archiviazione per ogni nodo. RAM
Amazon Redshift offre diversi tipi di nodi per soddisfare i tuoi carichi di lavoro e ti consigliamo di scegliere RA3 o DC2 dipendere dalle prestazioni richieste, dalla dimensione dei dati e dalla crescita prevista dei dati.
RA3i nodi con storage gestito consentono di ottimizzare il data warehouse scalando e pagando l'elaborazione e lo storage gestito in modo indipendente. ConRA3, scegli il numero di nodi in base ai tuoi requisiti di prestazioni e paghi solo per lo storage gestito che utilizzi. Dimensiona il RA3 cluster in base alla quantità di dati che elabori quotidianamente. Avviate cluster che utilizzano i tipi di RA3 nodi in un cloud privato virtuale (VPC). Non puoi avviare RA3 cluster in EC2 -Classic. Per ulteriori informazioni, consulta Creazione di un cluster con provisioning Redshift o di un gruppo di lavoro Serverless Amazon Redshift in un VPC.
Lo storage gestito di Amazon Redshift utilizza grandi dimensioni e ad alte prestazioni SSDs in ogni RA3 nodo per uno storage locale veloce e Amazon S3 per uno storage durevole a lungo termine. Se i dati in un nodo superano le dimensioni del grande localeSSDs, lo storage gestito di Amazon Redshift trasferisce automaticamente tali dati su Amazon S3. Paghi la stessa tariffa bassa per lo storage gestito di Amazon Redshift indipendentemente dal fatto che i dati si trovino in Amazon S3 o in Amazon ad alte prestazioniSSDs. Per i carichi di lavoro che richiedono uno storage in continua crescita, lo storage gestito consente di scalare automaticamente la capacità di storage del data warehouse separatamente dai nodi di elaborazione.
DC2i nodi consentono di disporre di data warehouse ad alta intensità di calcolo con storage locale incluso. SSD Puoi scegliere il numero di nodi di cui hai bisogno in base alla dimensione dei dati e ai requisiti di prestazioni. DC2i nodi archiviano i dati localmente per ottenere prestazioni elevate e, man mano che le dimensioni dei dati aumentano, è possibile aggiungere altri nodi di elaborazione per aumentare la capacità di archiviazione del cluster. Per set di dati inferiori a 1 TB (compressi), consigliamo i tipi di DC2 nodi per ottenere le migliori prestazioni al prezzo più basso. Se prevedi una crescita dei dati, ti consigliamo di utilizzare RA3 i nodi in modo da dimensionare l'elaborazione e lo storage in modo indipendente per ottenere prezzi e prestazioni migliori. Avviate cluster che utilizzano i tipi di DC2 nodi in un cloud privato virtuale ()VPC. Non puoi avviare DC2 cluster in EC2 -Classic. Per ulteriori informazioni, consulta Creazione di un cluster con provisioning Redshift o di un gruppo di lavoro Serverless Amazon Redshift in un VPC.
I tipi di nodo sono disponibili in diverse dimensioni. Le dimensioni e il numero dei nodi determinano lo storage totale di un cluster. Per ulteriori informazioni, consultare Dettagli relativi ai tipi di nodo.
Alcuni tipi di nodo consentono un solo nodo (a nodo singolo) o due o più nodi (a più nodi). Il numero minimo di nodi per i cluster di alcuni tipi di nodo è due. In un cluster a nodo singolo, il nodo condivide le funzionalità del nodo principale e del nodo di calcolo. I cluster a nodo singolo non sono consigliati per l'esecuzione di carichi di lavoro di produzione. In un cluster a più nodi, il nodo principale è distinto dai nodi di calcolo. Il tipo del nodo principale è identico a quello dei nodi di calcolo. Paghi solo per i nodi di calcolo.
Amazon Redshift applica quote alle risorse per ogni AWS account in ogni regione. AWS Una quota limita il numero di risorse che il tuo account può creare per un determinato tipo di risorsa, come nodi o istantanee, all'interno di una regione. AWS Per ulteriori informazioni sulle quote predefinite che si applicano alle risorse Amazon Redshift, consulta. Quote e limiti in Amazon Redshift
Il costo del cluster dipende dalla AWS regione, dal tipo di nodo, dal numero di nodi e dal fatto che i nodi siano prenotati in anticipo. Per ulteriori informazioni sui costi dei nodi, consultare la pagina dei prezzi di Amazon Redshift
Dettagli relativi ai tipi di nodo
Nelle tabelle seguenti sono riepilogate le specifiche dei nodi per ogni tipo e dimensione di nodo. Le intestazioni delle tabelle hanno i seguenti significati:
-
v CPU è il numero di virtuali CPUs per ogni nodo.
-
RAMè la quantità di memoria in gibibyte (GiB) per ogni nodo.
-
Sezioni di default per nodo è il numero di sezioni in cui un nodo di calcolo viene partizionato quando un cluster viene creato o ridimensionato con ridimensionamento classico.
Il numero di sezioni per nodo potrebbe cambiare se al cluster viene applicato il ridimensionamento elastico. Tuttavia, il numero totale di sezioni in tutti i nodi di calcolo nel cluster rimane lo stesso dopo il ridimensionamento elastico.
Quando si crea un cluster con l'operazione di ripristino da snapshot, il numero di sezioni del cluster risultante potrebbe cambiare rispetto al cluster originale se si modifica il tipo di nodo.
-
Storage è la capacità e il tipo di storage per ogni nodo.
-
L'intervallo di nodi è il numero minimo e massimo di nodi supportato da Amazon Redshift per il tipo e la dimensione del nodo.
Nota
Potresti essere limitato a un numero inferiore di nodi a seconda della quota applicata al tuo AWS account nella regione selezionata. AWS Per ulteriori informazioni sulle quote predefinite che si applicano alle risorse Amazon Redshift, consulta. Quote e limiti in Amazon Redshift
-
La capacità totale è la capacità di archiviazione totale per il cluster se distribuisci il numero massimo di nodi specificati nell'intervallo di nodi.
La tabella seguente descrive le specifiche dei nodi. RA3
Tipo di nodo | v CPU | RAM(GiB) | Sezioni predefinite per nodo | Limite dell'archiviazione gestita per nodo 1 | Intervallo di nodi con creazione cluster | Capacità totale di archiviazione gestita 2 |
---|---|---|---|---|---|---|
ra3.large (nodo singolo) | 2 | 16 | 2 | 1 TB | 1 | 1 TB 3 |
ra3.large (multinodo) | 2 | 16 | 2 | 8 TB | 2-16 | 128 TB |
ra3.xlplus (nodo singolo) | 4 | 32 | 2 | 4 TB | 1 | 4 TB3 |
ra3.xlplus (multinodo) | 4 | 32 | 2 | 32 TB | 2–164 | 1024 TB4 |
ra3.4xlarge | 12 | 96 | 4 | 128 TB | 2–325 | 8192 TB5 |
ra3.16xlarge | 48 | 384 | 16 | 128 TB | 2-128 | 16.384 TB4 |
1 Il limite di l'archiviazione gestita per Amazon Redshift. Questo è un limite insuperabile.
2 Il limite di archiviazione gestita totale è il numero massimo di nodi per il limite di archiviazione gestita per nodo.
3 Per ridimensionare un cluster a nodo singolo su più nodi, è supportato solo il ridimensionamento classico.
4 È possibile creare un cluster con il tipo di nodo ra3.xlplus (multinodo) contenente un massimo di 16 nodi. Per i cluster a più nodi, è possibile ridimensionare con il ridimensionamento elastico fino a un massimo di 32 nodi.
5 È possibile creare cluster con il tipo di nodo ra3.4xlarge contenente un massimo di 32 nodi. È possibile ridimensionarlo con un ridimensionamento elastico fino a un massimo di 64 nodi.
La tabella seguente descrive le specifiche per i nodi di elaborazione ad alta densità.
Tipo di nodo | v CPU | RAM(GiB) | Sezioni predefinite per nodo | Archiviazione per nodo | Intervallo di nodi | Capacità totale |
---|---|---|---|---|---|---|
dc2.large | 2 | 15 | 2 | 160 GB NVMe - SSD | 1-32 | 5.12 TB |
dc2.8xlarge | 32 | 244 | 16 | 2,56 TB NVMe - SSD | 2-128 | 326 TB |
Nota
I tipi di nodi Dense Storage (DS2) non sono più disponibili.
Nomi precedenti dei tipi di nodo
Nelle versioni precedenti di Amazon Redshift alcuni tipi di nodo hanno nomi diversi. Puoi usare i nomi precedenti in Amazon Redshift API e. AWS CLI Tuttavia, ti consigliamo di aggiornare gli script che fanno riferimento a tali nomi in modo che utilizzino invece i nomi correnti. I nomi correnti e i rispettivi nomi precedenti sono riportati di seguito.
Nome corrente | Nomi precedenti |
---|---|
ds2.xlarge | ds1.xlarge, dw.hs1.xlarge, dw1.xlarge |
ds2.8xlarge | ds1.8xlarge, dw.hs1.8xlarge, dw1.8xlarge |
dc1.large | dw2.large |
dc1.8xlarge | dw2.8xlarge |
Determinazione del numero di nodi
Dal momento che Amazon Redshift distribuisce ed esegue le query in parallelo tra tutti i nodi di calcolo di un cluster, è possibile ottimizzare le prestazioni delle query mediante l'aggiunta di nodi al cluster. Quando esegui un cluster che include almeno due nodi di calcolo, viene sempre eseguito il mirroring dei dati di ciascun nodo sui dischi di un altro nodo per ridurre il rischio di perdita dei dati.
Puoi monitorare le prestazioni delle query nella console Amazon Redshift e con i parametri di Amazon CloudWatch . Puoi inoltre aggiungere o rimuovere nodi in base alle esigenze per ottenere l'equilibrio tra prezzo e prestazioni per il cluster. Quando si richiede un nodo aggiuntivo, Amazon Redshift gestisce tutti i dettagli relativi a distribuzione, bilanciamento del carico e manutenzione dei dati. Per ulteriori informazioni sulle prestazioni dei cluster, consultare Monitoraggio delle prestazioni del cluster Amazon Redshift.
Nodi riservati sono ideali per carichi di lavoro in ambienti di produzione a stato costante, poiché i costi sono molto inferiori rispetto ai prezzi on demand. Puoi acquistare nodi riservati dopo aver eseguito esperimenti e aver convalidato proof-of-concepts la configurazione di produzione. Per ulteriori informazioni, consulta Nodi riservati.
La sospensione di un cluster comporta anche la sospensione della fatturazione on demand durante il periodo in cui il cluster è sospeso. Durante questo tempo di pausa, si paga per lo storage di backup. In questo modo non sarà necessario pianificare né acquistare in anticipo capacità del data warehouse e sarà possibile gestire ambienti di sviluppo o di test a costi ridotti.
Per informazioni sui prezzi dei nodi on demand e riservati, consultare Prezzi di Amazon Redshift
UsaEC2: VPC quando crei il cluster
I cluster Amazon Redshift vengono eseguiti in EC2 istanze Amazon configurate per il tipo e la dimensione del nodo Amazon Redshift selezionati. Crea il tuo cluster usando -. EC2 VPC Se utilizzi ancora EC2 -Classic, ti consigliamo di utilizzare EC2 - VPC per ottenere prestazioni e sicurezza migliorate. Per ulteriori informazioni su queste piattaforme di rete, consulta Supported Platforms nella Amazon EC2 User Guide. Le impostazioni del tuo AWS account determinano se EC2 - VPC o EC2 -Classic sono disponibili per te.
Nota
Per evitare problemi di connessione tra gli strumenti SQL client e il database Amazon Redshift, consigliamo di fare una delle due cose. Puoi configurare una regola in entrata che autorizzi gli host a negoziare le dimensioni dei pacchetti. In alternativa, puoi disabilitare i jumbo frame TCP /IP impostando l'unità di trasmissione massima (MTU) su 1500 sull'interfaccia di rete (NIC) delle tue istanze AmazonEC2. Per ulteriori informazioni su questi approcci, consultare Query bloccate e talvolta impossibilitate a raggiungere il cluster.
EC2-VPC
Quando usi EC2 -VPC, il tuo cluster viene eseguito in un cloud privato virtuale (VPC) logicamente isolato rispetto al tuo account. AWS Se effettui il provisioning del cluster in EC2 -VPC, controlli l'accesso al cluster associando uno o più gruppi VPC di sicurezza al cluster. Per ulteriori informazioni, consulta Security Groups for Your VPC nella Amazon VPC User Guide.
Per creare un cluster in unVPC, devi prima creare un sottogruppo di cluster Amazon Redshift fornendo le informazioni sulla sottorete del tuo VPC e poi fornire il gruppo di sottoreti all'avvio del cluster. Per ulteriori informazioni, consulta Sottoreti per risorse Redshift.
Per ulteriori informazioni su Amazon Virtual Private Cloud (AmazonVPC), consulta la pagina dei dettagli VPC del prodotto Amazon
Allarme predefinito dello spazio su disco
Quando crei un cluster Amazon Redshift, puoi facoltativamente configurare un CloudWatch allarme Amazon per monitorare la percentuale media di spazio su disco utilizzata su tutti i nodi del cluster. Questo allarme viene definito allarme predefinito dello spazio su disco.
Questo tipo di allarme ha lo scopo di monitorare la capacità di storage del cluster. Puoi configurare questo allarme in base alle specifiche esigenze del data warehouse in uso. Ad esempio, puoi utilizzare l'avviso come indicatore per l'eventuale necessità di dimensionare il cluster. Puoi decidere di eseguire il dimensionamento utilizzando un tipo di nodo diverso, aggiungendo nodi oppure acquistando nodi prenotati da utilizzare nelle espansioni future.
L'allarme predefinito dello spazio su disco viene attivato quando l'utilizzo del disco raggiunge o supera una percentuale specificata per un determinato numero di volte e con una durata specificata. Per impostazione predefinita, questo allarme viene attivato quando la percentuale specificata viene raggiunta per cinque minuti o più oppure viene superata per la stessa durata di tempo. Puoi modificare i valori predefiniti dopo aver avviato il cluster.
Quando si attiva l' CloudWatch allarme, Amazon Simple Notification Service (AmazonSNS) invia una notifica a destinatari specifici per avvisarli del raggiungimento della soglia percentuale. Amazon SNS utilizza un argomento per specificare i destinatari e il messaggio da inviare in una notifica. Puoi utilizzare un SNS argomento Amazon esistente; in caso contrario, viene creato un argomento in base alle impostazioni specificate all'avvio del cluster. Puoi modificare l'argomento dell'allarme corrente dopo aver avviato il cluster. Per ulteriori informazioni sulla creazione di SNS argomenti Amazon, consulta Getting Started with Amazon Simple Notification Service.
Dopo aver avviato il cluster, puoi visualizzare e modificare l'allarme dalla finestra di stato del cluster in CloudWatch Allarmi. Il nome è -default-< percentage-disk-space-usedstring
Il nome è -default-. Puoi aprire l'avviso per visualizzare l'SNSargomento Amazon a cui è associato e modificare le impostazioni dell'avviso. Se non hai selezionato un SNS argomento Amazon esistente da utilizzare, quello creato per te si chiama <clustername
Se non hai selezionato un argomento Amazon esistente da utilizzare, quello creato per te è named-default-alarms (<recipient
>-default-alarms (); ad esempio, (notify@example.com). examplecluster-default-alarms
Per ulteriori informazioni sulla configurazione e modifica dell'allarme predefinito dello spazio su disco, consultare Creazione di un cluster e Creazione di un allarme relativo allo spazio su disco.
Nota
Se elimini il cluster, l'allarme associato non verrà eliminato, ma non verrà mai attivato. È possibile eliminare l'allarme dalla CloudWatch console se non è più necessario.
Stato del cluster
Lo stato del cluster indica lo stato corrente del cluster. La tabella seguente fornisce una descrizione di ciascuno stato del cluster.
Stato | Descrizione |
---|---|
available |
Il cluster è in esecuzione e disponibile. |
available, prep-for-resize |
Il cluster viene preparato per il ridimensionamento elastico. Il cluster è in esecuzione ed è disponibile per query in lettura e scrittura, anche se le operazioni del cluster, come la creazione di uno snapshot, non sono disponibili. |
available, resize-cleanup |
Un'operazione di ridimensionamento elastico sta completando il trasferimento dati sui nuovi nodi del cluster. Il cluster è in esecuzione ed è disponibile per query in lettura e scrittura, anche se le operazioni del cluster, come la creazione di uno snapshot, non sono disponibili. |
cancelling-resize |
L'operazione di dimensionamento viene annullata. |
creating |
Amazon Redshift sta creando il cluster. Per ulteriori informazioni, consultare Creazione di un cluster. |
deleting |
Amazon Redshift sta eliminando il cluster. Per ulteriori informazioni, consulta Chiusura ed eliminazione di un cluster. |
final-snapshot |
Amazon Redshift sta creando uno snapshot finale del cluster prima di eliminarlo. Per ulteriori informazioni, consulta Chiusura ed eliminazione di un cluster. |
hardware-failure |
Nel cluster si è verificato un errore a livello di hardware. Se si tratta di un cluster a nodo singolo, il nodo non può essere sostituito. Per recuperare il cluster, ripristina uno snapshot. Per ulteriori informazioni, consulta Snapshot e backup di Amazon Redshift. |
incompatible-hsm |
Amazon Redshift non può connettersi al modulo di sicurezza hardware ()HSM. Verifica la HSM configurazione tra il cluster eHSM. Per ulteriori informazioni, consulta Crittografia mediante moduli di sicurezza hardware. |
incompatible-network |
Si è verificato un problema nella configurazione della rete sottostante. Assicurati che il cluster VPC in cui hai avviato il cluster esista e che le sue impostazioni siano corrette. Per ulteriori informazioni, consulta Risorse Redshift in un VPC. |
incompatible-parameters |
Si è verificato un problema con uno o più valori di parametro nel gruppo di parametri associato e il valore o i valori di parametro non possono essere applicati. Modificare il gruppo di parametri e aggiorna i valori non validi. Per ulteriori informazioni, consultare Gruppi di parametri di Amazon Redshift.. |
incompatible-restore |
Si è verificato un problema durante il ripristino del cluster dallo snapshot. Prova a ripristinare di nuovo il cluster con uno snapshot diverso. Per ulteriori informazioni, consultare Snapshot e backup di Amazon Redshift. |
modifying |
Amazon Redshift sta applicando le modifiche al cluster. Per ulteriori informazioni, consultare Modifica di un cluster. |
paused |
Il cluster è in pausa. Per ulteriori informazioni, consultare Mettere in pausa e riprendere un cluster. |
rebooting |
Amazon Redshift sta riavviando il cluster. Per ulteriori informazioni, consultare Riavvio di un cluster. |
renaming |
Amazon Redshift sta applicando un nuovo nome al cluster. Per ulteriori informazioni, consultare Ridenominazione di un cluster. |
resizing |
Amazon Redshift sta ridimensionando il cluster. Per ulteriori informazioni, consultare Ridimensionamento di un cluster. |
rotating-keys |
Amazon Redshift sta ruotando le chiavi di crittografia del cluster. Per ulteriori informazioni, consultare Rotazione delle chiavi di crittografia. |
storage-full |
Il cluster ha raggiunto la relativa capacità di storage. Ridimensiona il cluster aggiungendo nodi o scegliendo una dimensione di nodo diversa. Per ulteriori informazioni, consulta Ridimensionamento di un cluster. |
updating-hsm |
Amazon Redshift sta aggiornando la HSM configurazione. |