Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Scopri i concetti di Amazon Redshift
Amazon Redshift serverless consente di accedere e analizzare i dati senza le configurazioni di un data warehouse con provisioning. Viene eseguito automaticamente il provisioning delle risorse e la capacità del data warehouse viene dimensionata in modo intelligente per fornire prestazioni rapide per carichi di lavoro maggiormente impegnativi e imprevedibili. Quando il data warehouse è inattivo non vengono addebitati costi, si paga solo l'utilizzo. Puoi caricare i dati e iniziare subito a eseguire query nell'editor di query Amazon Redshift v2 o nello strumento di business intelligence (BI) preferito. Goditi il miglior rapporto prezzo/prestazioni e SQL funzionalità familiari in un easy-to-use ambiente senza amministrazione.
Se Amazon Redshift viene utilizzato per la prima volta, consigliamo di iniziare leggendo le seguenti sezioni:
-
Panoramica delle funzionalità di Amazon Redshift serverless: in questo argomento viene riportata una panoramica di Amazon Redshift serverless e le sue funzionalità principali.
-
Punti salienti del servizio e prezzi
: in questa pagina del prodotto sono disponibili i dettagli sui punti salienti e sui prezzi del servizio Amazon Redshift serverless. -
Inizia a usare i data warehouse Serverless Amazon Redshift. — In questo argomento, puoi saperne di più su come creare un data warehouse Serverless Amazon Redshift e iniziare a interrogare i dati utilizzando l'editor di query v2.
Se preferisci gestire le risorse Amazon Redshift manualmente, puoi creare cluster con provisioning per le proprie esigenze di query sui dati. Per ulteriori informazioni, consultare Cluster Amazon Redshift.
Se la tua organizzazione è idonea e il tuo cluster viene creato in un Regione AWS paese in cui Amazon Redshift Serverless non è disponibile, potresti essere in grado di creare un cluster nell'ambito del programma di prova gratuita di Amazon Redshift. Scegli Produzione o Versione di prova gratuita per rispondere alla domanda Per cosa si intende utilizzare questo cluster? Se scegli Versione di prova gratuita, crei una configurazione con il tipo di nodo dc2.large. Per ulteriori informazioni sulla scelta di una versione prova gratuita, consulta Prova gratuita di Amazon Redshift
Di seguito sono riportati alcuni concetti chiave di Amazon Redshift serverless.
-
Spazio dei nomi: una raccolta di oggetti di database e utenti. Gli spazi dei nomi raggruppano tutte le risorse utilizzate in Amazon Redshift serverless, come schemi, tabelle, utenti, unità di condivisione dati e snapshot.
-
Gruppo di lavoro: una raccolta di risorse di calcolo. I gruppi di lavoro ospitano le risorse di calcolo utilizzate da Amazon Redshift serverless per eseguire attività di calcolo. Alcuni esempi di tali risorse includono Redshift Processing Units (RPUs), gruppi di sicurezza, limiti di utilizzo. I gruppi di lavoro dispongono di impostazioni di rete e sicurezza che puoi configurare utilizzando la console Amazon Redshift Serverless, AWS Command Line Interface Amazon Redshift Serverless o Amazon Redshift Serverless. APIs
Per ulteriori informazioni sulla configurazione dello spazio dei nomi e delle risorse del gruppo di lavoro, consulta Utilizzo dello spazio dei nomi e Utilizzo dei gruppi di lavoro.
Di seguito sono riportati alcuni concetti chiave sui cluster con provisioning di Amazon Redshift:
-
Cluster – Il componente centrale dell'infrastruttura di un data warehouse di Amazon Redshift è un cluster.
Un cluster è costituito da uno o più nodi di calcolo. I nodi di calcolo eseguono il codice compilato.
Se viene effettuato il provisioning di un cluster con due o più nodi di calcolo, un ulteriore nodo principale coordina i nodi di calcolo. Il nodo leader gestisce la comunicazione esterna con applicazioni, come strumenti di business intelligence e editor di query. L'applicazione client interagisce direttamente solo con il nodo principale. I nodi di calcolo sono trasparenti alle applicazioni esterne.
-
Database – Un cluster contiene uno o più database.
I dati utente vengono archiviati in uno o più database nei nodi di calcolo. Il tuo SQL client comunica con il nodo leader, che a sua volta coordina l'esecuzione delle query con i nodi di elaborazione. Per dettagli sui nodi di calcolo e sui nodi principali, consulta Architettura del sistema di data warehouse All'interno di un database, i dati utente sono organizzati in uno o più schemi.
Amazon Redshift è un sistema di gestione di database relazionali (RDBMS) ed è compatibile con altre applicazioni. RDBMS Fornisce le stesse funzionalità tipicheRDBMS, incluse le funzioni di elaborazione delle transazioni online (OLTP) come l'inserimento e l'eliminazione di dati. Amazon Redshift è inoltre ottimizzato per l'analisi batch ad alte prestazioni e la creazione di report dei set di dati.
Di seguito, puoi trovare una descrizione del tipico flusso di elaborazione dei dati in Amazon Redshift, insieme alle descrizioni delle diverse parti del flusso. Per ulteriori informazioni sull'architettura di sistema Amazon Redshift, consulta Architettura del sistema di data warehouse.
Il diagramma seguente illustra un tipico flusso di elaborazione dati in Amazon Redshift.
Un data warehouse di Amazon Redshift è un sistema di query e gestione di database relazionali di livello aziendale. Amazon Redshift supporta connessioni client con molti tipi di applicazioni, tra cui strumenti di business intelligence, creazione di report, gestione dei dati e analisi. Attraverso l'esecuzione di query di analisi, puoi recuperare, confrontare e valutare grandi quantità di dati in operazioni in più fasi per produrre un risultato finale.
Presso il livello acquisizione dati, diversi tipi di origini dati caricano continuamente dati strutturati, semistrutturati o non strutturati sul livello di archiviazione dei dati. Questa area di archiviazione dei dati funge da area di gestione temporanea che memorizza i dati in diversi stati di preparazione al consumo. Un esempio di storage potrebbe essere un bucket Amazon Simple Storage Service (Amazon S3).
A livello di elaborazione dati opzionale, i dati di origine vengono sottoposti a preelaborazione, convalida e trasformazione utilizzando le pipeline extract, transform, load (ETL) o extract, load, transform (). ELT Questi set di dati grezzi vengono quindi perfezionati utilizzando le operazioni. ETL Un esempio di ETL motore è AWS Glue.
Presso il livello consumo di dati, i dati vengono caricati nel cluster Amazon Redshift, dove è possibile eseguire carichi di lavoro analitici.
Per alcuni esempi di carichi di lavoro analitici, consulta Esecuzione di query all'esterno delle origini dati.