Cluster con provisioning di Amazon Redshift - Amazon Redshift

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Cluster con provisioning di Amazon Redshift

Un data warehouse Amazon Redshift è costituito da un insieme di risorse di calcolo denominate nodi, strutturate in un gruppo denominato cluster. Ciascun cluster esegue un motore Amazon Redshift e contiene uno o più database.

Nota

Al momento è disponibile il motore Amazon Redshift versione 1.0. Tuttavia, poiché il motore viene costantemente aggiornato, è possibile che siano disponibili più versioni del motore Amazon Redshift.

Cluster e nodi in Amazon Redshift

Un cluster Amazon Redshift è costituito da nodi. Ogni cluster include un nodo principale e uno o più nodi di calcolo. Il nodo principale riceve le query dalle applicazioni client, analizza le query e quindi genera i piani di esecuzione delle query. Il nodo principale coordina quindi l'esecuzione parallela di questi piani con i nodi di calcolo e aggrega i risultati intermedi da tali nodi. Restituisce infine i risultati alle applicazioni client.

I nodi di calcolo eseguono i piani di esecuzione delle query e si scambiano i dati necessari per elaborare tali query. I risultati intermedi vengono quindi inviati al nodo principale per l'aggregazione prima di essere reinviati alle applicazioni client. Per ulteriori informazioni sui nodi principali e sui nodi di calcolo, consultare Architettura del sistema di data warehouse nella Guida per gli amministratori di database di Amazon Redshift.

Nota

Quando crei un cluster sulla console Amazon Redshift (https://console.aws.amazon.com/redshiftv2/), puoi ricevere consigli sulla configurazione del cluster in base alla dimensione dei dati e alle caratteristiche delle query. Per utilizzare questo calcolatore di dimensionamento, cerca Help me choose sulla console nelle AWS regioni che supportano RA3 i tipi di nodi. Per ulteriori informazioni, consulta Creazione di un cluster.

Quando si avvia un cluster, una delle opzioni da specificare è il tipo di nodo. Il tipo di nodo determina la CPU, la RAM, la capacità di storage e il tipo di unità di storage per ciascun nodo.

Amazon Redshift offre diversi tipi di nodi per soddisfare i tuoi carichi di lavoro e ti consigliamo di scegliere RA3 o DC2 dipendere dalle prestazioni richieste, dalla dimensione dei dati e dalla crescita prevista dei dati.

RA3 i nodi con storage gestito consentono di ottimizzare il data warehouse scalando e pagando l'elaborazione e lo storage gestito in modo indipendente. Con RA3, scegli il numero di nodi in base ai tuoi requisiti di prestazioni e paghi solo per lo storage gestito che utilizzi. Dimensiona il RA3 cluster in base alla quantità di dati che elabori quotidianamente. Avvia cluster che utilizzano i tipi di RA3 nodi in un cloud privato virtuale (VPC). Per ulteriori informazioni, consulta Creazione di un cluster con provisioning Redshift o di un gruppo di lavoro Serverless Amazon Redshift in un VPC.

Lo storage gestito di Amazon Redshift utilizza grandi dimensioni e ad alte prestazioni SSDs in ogni RA3 nodo per uno storage locale veloce e Amazon S3 per uno storage durevole a lungo termine. Se i dati in un nodo superano le dimensioni del grande locale SSDs, lo storage gestito di Amazon Redshift trasferisce automaticamente tali dati su Amazon S3. Paghi la stessa tariffa bassa per lo storage gestito di Amazon Redshift indipendentemente dal fatto che i dati si trovino in Amazon S3 o in Amazon ad alte prestazioni SSDs . Per i carichi di lavoro che richiedono uno storage in continua crescita, lo storage gestito consente di scalare automaticamente la capacità di storage del data warehouse separatamente dai nodi di elaborazione.

DC2 i nodi consentono di disporre di data warehouse ad alta intensità di calcolo con storage SSD locale incluso. Scegliete il numero di nodi necessari in base alle dimensioni dei dati e ai requisiti prestazionali. DC2 i nodi archiviano i dati localmente per prestazioni elevate e, man mano che le dimensioni dei dati aumentano, puoi aggiungere altri nodi di elaborazione per aumentare la capacità di archiviazione del cluster. Per set di dati inferiori a 1 TB (compressi), consigliamo i tipi di DC2 nodi per ottenere le migliori prestazioni al prezzo più basso. Se prevedi una crescita dei dati, ti consigliamo di utilizzare RA3 i nodi in modo da dimensionare l'elaborazione e lo storage in modo indipendente per ottenere prezzi e prestazioni migliori. Avvia cluster che utilizzano i tipi di DC2 nodi in un cloud privato virtuale (VPC). Per ulteriori informazioni, consulta Creazione di un cluster con provisioning Redshift o di un gruppo di lavoro Serverless Amazon Redshift in un VPC.

I tipi di nodo sono disponibili in diverse dimensioni. Le dimensioni e il numero dei nodi determinano lo storage totale di un cluster. Per ulteriori informazioni, consultare Dettagli relativi ai tipi di nodo.

Alcuni tipi di nodo consentono un solo nodo (a nodo singolo) o due o più nodi (a più nodi). Il numero minimo di nodi per i cluster di alcuni tipi di nodo è due. In un cluster a nodo singolo, il nodo condivide le funzionalità del nodo principale e del nodo di calcolo. I cluster a nodo singolo non sono consigliati per l'esecuzione di carichi di lavoro di produzione. In un cluster a più nodi, il nodo principale è distinto dai nodi di calcolo. Il tipo del nodo principale è identico a quello dei nodi di calcolo. Paghi solo per i nodi di calcolo.

Amazon Redshift applica quote alle risorse per ogni AWS account in ogni regione. AWS Una quota limita il numero di risorse che il tuo account può creare per un determinato tipo di risorsa, come nodi o istantanee, all'interno di una regione. AWS Per ulteriori informazioni sulle quote predefinite che si applicano alle risorse Amazon Redshift, consulta. Quote e limiti in Amazon Redshift

Il costo del cluster dipende dalla AWS regione, dal tipo di nodo, dal numero di nodi e dal fatto che i nodi siano prenotati in anticipo. Per ulteriori informazioni sui costi dei nodi, consultare la pagina dei prezzi di Amazon Redshift.

Dettagli relativi ai tipi di nodo

Nelle tabelle seguenti sono riepilogate le specifiche dei nodi per ogni tipo e dimensione di nodo. Le intestazioni delle tabelle hanno i seguenti significati:

  • vCPU è il numero di dispositivi virtuali CPUs per ogni nodo.

  • RAM è la quantità di memoria, espressa in gibibyte (GiB), per ogni nodo.

  • Sezioni di default per nodo è il numero di sezioni in cui un nodo di calcolo viene partizionato quando un cluster viene creato o ridimensionato con ridimensionamento classico.

    Il numero di sezioni per nodo potrebbe cambiare se al cluster viene applicato il ridimensionamento elastico. Tuttavia, il numero totale di sezioni in tutti i nodi di calcolo nel cluster rimane lo stesso dopo il ridimensionamento elastico.

    Quando si crea un cluster con l'operazione di ripristino da snapshot, il numero di sezioni del cluster risultante potrebbe cambiare rispetto al cluster originale se si modifica il tipo di nodo.

  • Storage è la capacità e il tipo di storage per ogni nodo.

  • L'intervallo di nodi è il numero minimo e massimo di nodi supportato da Amazon Redshift per il tipo e la dimensione del nodo.

    Nota

    Potresti essere limitato a un numero inferiore di nodi a seconda della quota applicata al tuo AWS account nella AWS regione selezionata. Per ulteriori informazioni sulle quote predefinite che si applicano alle risorse Amazon Redshift, consulta. Quote e limiti in Amazon Redshift

  • La capacità totale è la capacità di archiviazione totale per il cluster se distribuisci il numero massimo di nodi specificati nell'intervallo di nodi.

La tabella seguente descrive le specifiche dei nodi. RA3

Tipo di nodo VPCU RAM (GiB) Sezioni predefinite per nodo Limite dell'archiviazione gestita per nodo 1 Intervallo di nodi con creazione cluster Capacità totale di archiviazione gestita 2
ra3.large (nodo singolo) 2 16 2 1 TB 1 1 TB 3
ra3.large (multinodo) 2 16 2 8 TB 2-16 128 TB
ra3.xlplus (nodo singolo) 4 32 2 4 TB 1 4 TB3
ra3.xlplus (multinodo) 4 32 2 32 TB 2–164 1024 TB4
ra3.4xlarge 12 96 4 128 TB 2–325 8192 TB5
ra3.16xlarge 48 384 16 128 TB 2-128 16.384 TB4

1 Il limite di l'archiviazione gestita per Amazon Redshift. Questo è un limite insuperabile.

2 Il limite di archiviazione gestita totale è il numero massimo di nodi per il limite di archiviazione gestita per nodo.

3 Per ridimensionare un cluster a nodo singolo su più nodi, è supportato solo il ridimensionamento classico.

4 È possibile creare un cluster con il tipo di nodo ra3.xlplus (multinodo) contenente un massimo di 16 nodi. Per i cluster a più nodi, è possibile ridimensionare con il ridimensionamento elastico fino a un massimo di 32 nodi.

5 È possibile creare cluster con il tipo di nodo ra3.4xlarge contenente un massimo di 32 nodi. È possibile ridimensionarlo con un ridimensionamento elastico fino a un massimo di 64 nodi.

La tabella seguente descrive le specifiche per i nodi di elaborazione ad alta densità.

Tipo di nodo VPCU RAM (GiB) Sezioni predefinite per nodo Archiviazione per nodo Intervallo di nodi Capacità totale
dc2.large 2 15 2 SSD da 160 GB NVMe 1-32 5.12 TB
dc2.8xlarge 32 244 16 SSD da 2,56 TB NVMe 2-128 326 TB
Nota

I tipi di nodi Dense Storage (DS2) non sono più disponibili.

Nomi precedenti dei tipi di nodo

Nelle versioni precedenti di Amazon Redshift alcuni tipi di nodo hanno nomi diversi. Puoi utilizzare i nomi precedenti nell'API Amazon Redshift e. AWS CLI Tuttavia, ti consigliamo di aggiornare gli script che fanno riferimento a tali nomi in modo che utilizzino invece i nomi correnti. I nomi correnti e i rispettivi nomi precedenti sono riportati di seguito.

Nome corrente Nomi precedenti
ds2.xlarge ds1.xlarge, dw.hs1.xlarge, dw1.xlarge
ds2.8xlarge ds1.8xlarge, dw.hs1.8xlarge, dw1.8xlarge
dc1.large dw2.large
dc1.8xlarge dw2.8xlarge

Determinazione del numero di nodi

Dal momento che Amazon Redshift distribuisce ed esegue le query in parallelo tra tutti i nodi di calcolo di un cluster, è possibile ottimizzare le prestazioni delle query mediante l'aggiunta di nodi al cluster. Quando esegui un cluster che include almeno due nodi di calcolo, viene sempre eseguito il mirroring dei dati di ciascun nodo sui dischi di un altro nodo per ridurre il rischio di perdita dei dati.

Puoi monitorare le prestazioni delle query nella console Amazon Redshift e con i parametri di Amazon CloudWatch . Puoi inoltre aggiungere o rimuovere nodi in base alle esigenze per ottenere l'equilibrio tra prezzo e prestazioni per il cluster. Quando si richiede un nodo aggiuntivo, Amazon Redshift gestisce tutti i dettagli relativi a distribuzione, bilanciamento del carico e manutenzione dei dati. Per ulteriori informazioni sulle prestazioni dei cluster, consultare Monitoraggio delle prestazioni del cluster Amazon Redshift.

Nodi riservati sono ideali per carichi di lavoro in ambienti di produzione a stato costante, poiché i costi sono molto inferiori rispetto ai prezzi on demand. Puoi acquistare nodi riservati dopo aver eseguito esperimenti e aver convalidato proof-of-concepts la configurazione di produzione. Per ulteriori informazioni, consulta Nodi riservati.

La sospensione di un cluster comporta anche la sospensione della fatturazione on demand durante il periodo in cui il cluster è sospeso. Durante questo tempo di pausa, si paga per lo storage di backup. In questo modo non sarà necessario pianificare né acquistare in anticipo capacità del data warehouse e sarà possibile gestire ambienti di sviluppo o di test a costi ridotti.

Per informazioni sui prezzi dei nodi on demand e riservati, consultare Prezzi di Amazon Redshift.

Utilizzali EC2 per creare il tuo cluster

I cluster Amazon Redshift vengono eseguiti in EC2 istanze Amazon configurate per il tipo e la dimensione del nodo Amazon Redshift selezionati. Per ulteriori informazioni su queste piattaforme di rete, consulta Supported Platforms nella Amazon EC2 User Guide.

Nota

Per evitare problemi di connessione tra gli strumenti client SQL e il database Amazon Redshift, consigliamo di eseguire una delle due operazioni seguenti. Puoi configurare una regola in entrata che autorizzi gli host a negoziare le dimensioni dei pacchetti. In alternativa, puoi disabilitare i jumbo frame TCP/IP impostando l'unità di trasmissione massima (MTU) su 1500 sull'interfaccia di rete (NIC) delle tue istanze Amazon. EC2 Per ulteriori informazioni su questi approcci, consultare Query bloccate e talvolta impossibilitate a raggiungere il cluster.

Amazon Virtual Private Cloud (Amazon VPC) (Amazon VPC)

Quando usi Amazon VPC, il cluster viene eseguito in un cloud privato virtuale (VPC) logicamente isolato dal tuo account. AWS Se effettui il provisioning del tuo cluster con Amazon VPC, controlli l'accesso al cluster associando uno o più gruppi di sicurezza VPC al cluster. Per ulteriori informazioni, consultare Gruppi di sicurezza per il VPC nella Guida per l'utente di Amazon VPC.

Per creare un cluster in un VPC, è necessario creare innanzitutto un gruppo di sottoreti del cluster Amazon Redshift immettendo le informazioni sulla sottorete del VPC in uso, quindi fornendo il gruppo di sottoreti all'avvio del cluster. Per ulteriori informazioni, consultare Sottoreti per risorse Redshift.

Per ulteriori informazioni su Amazon Virtual Private Cloud (Amazon VPC), consultare la pagina dei dettagli del prodotto di Amazon VPC.

Allarme predefinito dello spazio su disco

Quando crei un cluster Amazon Redshift, puoi facoltativamente configurare un CloudWatch allarme Amazon per monitorare la percentuale media di spazio su disco utilizzata su tutti i nodi del cluster. Questo allarme viene definito allarme predefinito dello spazio su disco.

Questo tipo di allarme ha lo scopo di monitorare la capacità di storage del cluster. Puoi configurare questo allarme in base alle specifiche esigenze del data warehouse in uso. Ad esempio, puoi utilizzare l'avviso come indicatore per l'eventuale necessità di dimensionare il cluster. Puoi decidere di eseguire il dimensionamento utilizzando un tipo di nodo diverso, aggiungendo nodi oppure acquistando nodi prenotati da utilizzare nelle espansioni future.

L'allarme predefinito dello spazio su disco viene attivato quando l'utilizzo del disco raggiunge o supera una percentuale specificata per un determinato numero di volte e con una durata specificata. Per impostazione predefinita, questo allarme viene attivato quando la percentuale specificata viene raggiunta per cinque minuti o più oppure viene superata per la stessa durata di tempo. Puoi modificare i valori predefiniti dopo aver avviato il cluster.

Quando si attiva l' CloudWatch allarme, Amazon Simple Notification Service (Amazon SNS) invia una notifica a destinatari specifici per avvisarli del raggiungimento della soglia percentuale. Amazon SNS utilizza un argomento per specificare i destinatari e il messaggio inviato in una notifica. È possibile utilizzare un argomento Amazon SNS esistente. In caso contrario, viene creato un argomento in base alle impostazioni specificate all'avvio del cluster. Puoi modificare l'argomento dell'allarme corrente dopo aver avviato il cluster. Per ulteriori informazioni sulla creazione di argomenti Amazon SNS, consultare in Nozioni di base di Amazon Simple Notification Service.

Dopo aver avviato il cluster, puoi visualizzare e modificare l'allarme dalla finestra di stato del cluster in Allarmi. CloudWatch Il nome è percentage-disk-space-used-default-< > string. È possibile aprire l'allarme per visualizzare l'argomento Amazon SNS associato e modificare le impostazioni dell'allarme. Se non hai selezionato un argomento Amazon SNS esistente da utilizzare, quello creato per te si chiama < clustername >-default-alarms (< recipient >); ad esempio, (notify@example.com). examplecluster-default-alarms

Per ulteriori informazioni sulla configurazione e modifica dell'allarme predefinito dello spazio su disco, consultare Creazione di un cluster e Creazione di un allarme relativo allo spazio su disco.

Nota

Se elimini il cluster, l'allarme associato non verrà eliminato, ma non verrà mai attivato. Puoi eliminare l'allarme dalla console se non ti serve più CloudWatch .

Stato del cluster

Lo stato del cluster indica lo stato corrente del cluster. La tabella seguente fornisce una descrizione di ciascuno stato del cluster.

Stato Descrizione
available Il cluster è in esecuzione e disponibile.
available, prep-for-resize Il cluster viene preparato per il ridimensionamento elastico. Il cluster è in esecuzione ed è disponibile per query in lettura e scrittura, anche se le operazioni del cluster, come la creazione di uno snapshot, non sono disponibili.
available, resize-cleanup Un'operazione di ridimensionamento elastico sta completando il trasferimento dati sui nuovi nodi del cluster. Il cluster è in esecuzione ed è disponibile per query in lettura e scrittura, anche se le operazioni del cluster, come la creazione di uno snapshot, non sono disponibili.
cancelling-resize L'operazione di dimensionamento viene annullata.
creating Amazon Redshift sta creando il cluster. Per ulteriori informazioni, consultare Creazione di un cluster.
deleting Amazon Redshift sta eliminando il cluster. Per ulteriori informazioni, consulta Chiusura ed eliminazione di un cluster.
final-snapshot Amazon Redshift sta creando uno snapshot finale del cluster prima di eliminarlo. Per ulteriori informazioni, consulta Chiusura ed eliminazione di un cluster.
hardware-failure

Nel cluster si è verificato un errore a livello di hardware.

Se si tratta di un cluster a nodo singolo, il nodo non può essere sostituito. Per recuperare il cluster, ripristina uno snapshot. Per ulteriori informazioni, consultare Snapshot e backup di Amazon Redshift.

incompatible-hsm Amazon Redshift non può connettersi al modulo di sicurezza hardware (HSM, Hardware Security Module). Controlla la configurazione HSM tra il cluster e HSM. Per ulteriori informazioni, consultare Crittografia mediante moduli di sicurezza hardware.
incompatible-network Si è verificato un problema nella configurazione della rete sottostante. Verifica che il VPC in cui hai avviato il cluster esista e che le relative impostazioni siano corrette. Per ulteriori informazioni, consultare Risorse Redshift in un VPC.
incompatible-parameters Si è verificato un problema con uno o più valori di parametro nel gruppo di parametri associato e il valore o i valori di parametro non possono essere applicati. Modificare il gruppo di parametri e aggiorna i valori non validi. Per ulteriori informazioni, consultare Gruppi di parametri di Amazon Redshift..
incompatible-restore Si è verificato un problema durante il ripristino del cluster dallo snapshot. Prova a ripristinare di nuovo il cluster con uno snapshot diverso. Per ulteriori informazioni, consultare Snapshot e backup di Amazon Redshift.
modifying Amazon Redshift sta applicando le modifiche al cluster. Per ulteriori informazioni, consultare Modifica di un cluster.
paused Il cluster è in pausa. Per ulteriori informazioni, consultare Mettere in pausa e riprendere un cluster.
rebooting Amazon Redshift sta riavviando il cluster. Per ulteriori informazioni, consultare Riavvio di un cluster.
renaming Amazon Redshift sta applicando un nuovo nome al cluster. Per ulteriori informazioni, consultare Ridenominazione di un cluster.
resizing Amazon Redshift sta ridimensionando il cluster. Per ulteriori informazioni, consultare Ridimensionamento di un cluster.
rotating-keys Amazon Redshift sta ruotando le chiavi di crittografia del cluster. Per ulteriori informazioni, consultare Rotazione delle chiavi di crittografia.
storage-full Il cluster ha raggiunto la relativa capacità di storage. Ridimensiona il cluster aggiungendo nodi o scegliendo una dimensione di nodo diversa. Per ulteriori informazioni, consulta Ridimensionamento di un cluster.
updating-hsm Amazon Redshift sta aggiornando la configurazione HSM.