Inizia a usare i data warehouse con provisioning di Amazon Redshift

Modalità Focus

Inizia a usare i data warehouse con provisioning di Amazon Redshift - Amazon Redshift

Iscrizione a AWS Definizione delle regole del firewall Fase 1: creazione di un cluster di esempio Fase 2: Configurazione delle regole in ingresso per i client SQL Passaggio 3: concedere l'accesso a un client SQL ed eseguire le query Passaggio 4: caricare i dati da Amazon S3 ad Amazon Redshift Fase 5: provare query di esempio utilizzando l'editor di query Fase 6: reimpostazione dell'ambiente

Se sei un utente alle prime armi di Amazon Redshift, ti consigliamo di leggere le seguenti sezioni per iniziare a utilizzare i cluster con provisioning. Il flusso di base di Amazon Redshift consiste nel creare risorse assegnate, connettersi ad Amazon Redshift, caricare dati di esempio e quindi eseguire query sui dati. In questa guida, puoi scegliere di caricare dati di esempio da Amazon Redshift o da un bucket Amazon S3. I dati di esempio vengono utilizzati in tutta la documentazione di Amazon Redshift per dimostrare le funzionalità.

Questo tutorial dimostra come utilizzare i cluster provisioned di Amazon Redshift, che AWS sono oggetti di data warehouse per i quali gestisci le risorse di sistema. Puoi anche utilizzare Amazon Redshift con gruppi di lavoro serverless, che sono oggetti di data warehouse che si ridimensionano automaticamente in base all'utilizzo. Per iniziare a utilizzare Redshift Serverless, consulta. Inizia a usare i data warehouse Serverless Amazon Redshift

Dopo aver creato e effettuato l'accesso alla console di provisioning di Amazon Redshift, puoi creare e gestire oggetti Amazon Redshift, inclusi cluster, nodi e database. Puoi anche eseguire query, visualizzare query ed eseguire altre operazioni SQL Data Definition Language (DDL) e Data Manipulation Language (DML) con un client SQL.

Importante

Il cluster fornito per questo esercizio viene eseguito in un ambiente live. Finché è in esecuzione, addebita addebiti a tuo carico. Account AWS Per informazioni sui prezzi, consultare la pagina dei prezzi di Amazon Redshift.

Per evitare costi superflui, è necessario eliminare il cluster al termine dell'esercizio. La sezione finale di questo capitolo spiega come farlo.

Accedi AWS Management Console e apri la console Amazon Redshift all'indirizzo. https://console.aws.amazon.com/redshiftv2/

Ti consigliamo di iniziare accedendo alla dashboard dei cluster Provisioned per iniziare a utilizzare la console Amazon Redshift.

A seconda della configurazione, nel riquadro di navigazione della console di provisioning di Amazon Redshift vengono visualizzati i seguenti elementi:

Redshift Serverless: accedi e analizza i dati senza la necessità di configurare, ottimizzare e gestire i cluster provisioned di Amazon Redshift.
Pannello di controllo dei cluster forniti: visualizza l'elenco dei cluster presenti Regione AWS, consulta le metriche dei cluster e la panoramica di Query per informazioni dettagliate sui parametri, i dati (come l'utilizzo della CPU) e le informazioni sulle query. L'utilizzo di questi dati può aiutarti a determinare se i dati sulle prestazioni sono anormali in un intervallo di tempo specificato.
Cluster: visualizza l'elenco dei cluster che contiene Regione AWS, scegli un cluster per avviare le query o esegui azioni relative al cluster. È inoltre possibile creare un nuovo cluster da questa pagina.
Editor di query: esegui query su database ospitati nel tuo cluster Amazon Redshift. Ti consigliamo invece di utilizzare l'editor di query v2.
Query editor v2 — Amazon Redshift Query Editor v2 è un'applicazione client SQL separata basata sul Web per creare ed eseguire query sul tuo data warehouse Amazon Redshift. Puoi visualizzare i risultati nei grafici e collaborare condividendo le tue domande con altri membri del tuo team.
Queries and loads (Query e carichi): ottiene informazioni per riferimento o risoluzione dei problemi, ad esempio un elenco di query recenti e il testo SQL di ogni query.
Unità di condivisione dati - come amministratore di un account producer puoi autorizzare gli account consumer ad accedere alle unità di condivisione dati o scegliere di non autorizzare alcun accesso. Per utilizzare un datashare autorizzato, un amministratore di account consumer può associare il datashare a un intero o a specifici namespace del cluster in un account. Account AWS Un amministratore può anche rifiutare una unità di condivisione dati.
Integrazioni zero-ETL: gestisci le integrazioni che rendono disponibili i dati transazionali in Amazon Redshift dopo essere stati scritti in fonti supportate.
Connessioni IAM Identity Center: configura la connessione tra Amazon Redshift e IAM Identity Center.
Configurations (Configurazioni): si connette ai cluster di Amazon Redshift dagli strumenti del client SQL tramite le connessioni Java Database Connectivity (JDBC) e Open Database Connectivity (ODBC). Puoi anche configurare un endpoint VPC (Virtual Private Cloud) di Amazon RedShift. In questo modo viene fornita una connessione privata tra un VPC basato sul servizio Amazon VPC che contiene un cluster e un altro VPC che esegue uno strumento client.
AWS Integrazione con i partner: crea l'integrazione con un AWS partner supportato.
Advisor - Ricevi consigli specifici sulle modifiche che puoi apportare al cluster Amazon Redshift per dare priorità alle tue ottimizzazioni.
AWS Marketplace: ottieni informazioni su altri strumenti o AWS servizi compatibili con Amazon Redshift.
Allarmi — Crea allarmi sulle metriche del cluster per visualizzare i dati sulle prestazioni e tenere traccia delle metriche in un periodo di tempo specificato.
Eventi — Tieni traccia degli eventi e ottieni report su informazioni come la data in cui si è verificato l'evento, una descrizione o l'origine dell'evento.
Novità: questa pagina Web elenca le nuove funzionalità di Amazon Redshift e gli aggiornamenti dei prodotti.

In questo tutorial userai la procedura descritta di seguito:

I passaggi di questo tutorial sono descritti di seguito

Argomenti

Iscrizione a AWS
Definizione delle regole del firewall
Fase 1: Creazione di un cluster Amazon Redshift di esempio
Fase 2: Configurazione delle regole in ingresso per i client SQL
Passaggio 3: concedere l'accesso a un client SQL ed eseguire le query
Passaggio 4: caricare i dati da Amazon S3 ad Amazon Redshift
Fase 5: provare query di esempio utilizzando l'editor di query
Fase 6: reimpostazione dell'ambiente

Se non ne hai già uno Account AWS, iscriviti a uno. Se disponi già di un account, puoi ignorare questo prerequisito e utilizzare il tuo account esistente.

Apri la https://portal.aws.amazon.com/billing/registrazione.
Segui le istruzioni online.

Nel corso della procedura di registrazione riceverai una telefonata, durante la quale sarà necessario inserire un codice di verifica attraverso la tastiera del telefono.

Quando ti iscrivi a un Account AWS, Utente root dell'account AWSviene creato un. L'utente root dispone dell'accesso a tutte le risorse e tutti i Servizi AWS nell'account. Come best practice di sicurezza, assegna l'accesso amministrativo a un utente e utilizza solo l'utente root per eseguire attività che richiedono l'accesso di un utente root.

Definizione delle regole del firewall

Nota

Questo tutorial presuppone che il cluster utilizzi la porta predefinita 5439 e che l'editor di query Amazon Redshift v2 possa essere utilizzato per eseguire comandi SQL. Non fornisce dettagli sulle configurazioni di rete o sulla configurazione di un client SQL che potrebbe essere necessario nel tuo ambiente.

In alcuni ambienti, specifichi una porta quando avvii il cluster Amazon Redshift. Questa porta viene utilizzata insieme all'URL dell'endpoint del cluster per accedere al cluster. È importante inoltre creare una regola in entrata in un gruppo di sicurezza per consentire l'accesso al cluster attraverso la porta.

Se il computer client è protetto da un firewall, è necessario conoscere una porta aperta che è possibile utilizzare. Questa porta aperta consente di stabilire una connessione con il cluster da uno strumento client SQL ed eseguire query. Se non si dispone di questa informazione, chiedere la collaborazione di qualcuno che sia a conoscenza delle regole del firewall di rete al fine di determinare una porta aperta del firewall.

Sebbene Amazon Redshift usi la porta 5439 per impostazione predefinita, se questa porta del firewall non è aperta la connessione non funziona. Non è possibile modificare il numero di porta per il cluster Amazon Redshift dopo la creazione. Pertanto, assicurarsi di specificare una porta aperta che funziona nell'ambiente durante il processo di avvio.

Fase 1: Creazione di un cluster Amazon Redshift di esempio

In questo tutorial, illustrerai il processo per creare un cluster Amazon Redshift con un database. Quindi carichi un set di dati da Amazon S3 nelle tabelle del tuo database. Puoi usare questo cluster di esempio per valutare il servizio Amazon Redshift.

Prima di iniziare a configurare un cluster Amazon Redshift, assicurati di completare tutti i prerequisiti necessari come e. Iscrizione a AWS Definizione delle regole del firewall

Per qualsiasi operazione che accede ai dati da un'altra AWS risorsa, il cluster necessita dell'autorizzazione per accedere alla risorsa e ai dati sulla risorsa per tuo conto. Un esempio è l'utilizzo di un comando SQL COPY per caricare dati da Amazon Simple Storage Service (Amazon S3). Fornisci tali autorizzazioni utilizzando AWS Identity and Access Management (IAM). Puoi farlo tramite un ruolo IAM che crei e colleghi al tuo cluster. Per ulteriori informazioni su credenziali e autorizzazioni di accesso, consulta Credenziali e autorizzazioni di accesso nella Amazon Redshift Database Developer Guide.

Come creare un cluster Amazon Redshift

Accedi AWS Management Console e apri la console Amazon Redshift all'indirizzo. https://console.aws.amazon.com/redshiftv2/

Importante
Se si utilizzano le credenziali utente IAM, verificare di disporre delle autorizzazioni necessarie per eseguire le operazioni relative al cluster. Per ulteriori informazioni, consulta la sezione Sicurezza in Amazon Redshift nella Amazon Redshift Management Guide.
Sulla AWS console, scegli Regione AWS dove vuoi creare il cluster.
Dal menu di navigazione, scegliere Clusters (Cluster), quindi Create cluster (Crea cluster). Appare la pagina Create cluster (Crea cluster).
Nella sezione Configurazione del cluster, specificare i valori per Identificatore del cluster, Tipo di nodo e Nodi:
- Identificatore del cluster: inserire examplecluster per questo tutorial. Questo identificatore deve essere univoco. L'identificatore deve contenere un numero di caratteri compreso tra 1 e 63, dove i caratteri validi sono a-z (solo minuscole) e - (trattino).
- Selezionare uno dei seguenti metodi per dimensionare il cluster:
  
  Nota
  Il passaggio seguente presuppone un Regione AWS che supporti i tipi di RA3 nodi. Per un elenco dei tipi Regioni AWS di RA3 nodi di supporto, consulta Panoramica dei tipi di RA3 nodi nella Amazon Redshift Management Guide. Per ulteriori informazioni sulle specifiche del nodo per ogni tipo e dimensione di nodo, consulta Dettagli sul tipo di nodo.
  - Se non si conosce la dimensione del cluster, scegliereAiutami a scegliere. In questo modo si apre un calcolatore del dimensionamento che ti pone domande sulle dimensioni e sulle caratteristiche di interrogazione dei dati che intendi archiviare nel tuo data warehouse.
    
    Se si conosce la dimensione richiesta del cluster, ovvero il tipo di nodo e il numero di nodi, scegliere Sceglierò. Quindi scegliere il tipo di nodo e il numero di nodi per dimensionare il cluster.
    
    Per questo tutorial, scegli ra3.4xlarge per il tipo di nodo e 2 per il numero di nodi.
    
    Se è disponibile una scelta per la configurazione AZ, scegli Single-AZ.
  - Per utilizzare il set di dati di esempio fornito da Amazon Redshift, in Dati di esempio, scegliere Carica dati di esempio. Amazon Redshift carica di default il set di dati di esempio Tickit nel database dev e nello schema public.
Nella sezione Configurazione del database specifica i valori per Nome dell'utente amministratore. In Password dell'amministratore seleziona una delle opzioni seguenti:
- Genera una password: utilizza una password generata da Amazon Redshift.
- Aggiungi manualmente una password dell'amministratore: utilizza una tua password.
- Gestisci le credenziali di amministratore in AWS Secrets Manager: Amazon Redshift le AWS Secrets Manager utilizza per generare e gestire la password di amministratore. L'utilizzo AWS Secrets Manager per generare e gestire la password segreta comporta un costo. Per informazioni sui prezzi di AWS Secrets Manager , consulta Prezzi di AWS Secrets Manager.
Per questo tutorial utilizzare i seguenti valori:
- Nome utente amministratore: inserisci awsuser.
- Password utente amministratore: inserisci Changeit1 la password.
Per questo tutorial, create un ruolo IAM e impostatelo come predefinito per il cluster, come descritto di seguito. È possibile che sia disponibile un solo set di ruoli IAM predefinito per un cluster.
1. In Autorizzazioni cluster, per Gestisci i ruoli IAM, scegli Creazione di ruolo IAM.
2. Specificare un bucket Amazon S3 per l'accesso al ruolo IAM con uno dei seguenti metodi:
  - Scegliere Nessun bucket Amazon S3 aggiuntivo per consentire al ruolo IAM creato di accedere solo ai bucket Amazon S3 denominati redshift.
  - Scegliere Qualsiasi bucket Amazon S3 per consentire al ruolo IAM creato di accedere a tutti bucket Amazon S3.
  - Scegliere Bucket Amazon S3 specifico per specificare uno o più bucket Amazon S3 a cui il ruolo IAM creato può accedere. Scegli quindi uno o più bucket Amazon S3 dalla tabella.
3. Scegliere Creazione di ruolo IAM come predefinito. Amazon Redshift crea e imposta automaticamente il ruolo IAM come predefinito per il cluster.
  
  Poiché hai creato il tuo ruolo IAM dalla console, questo ha allegata la policy AmazonRedshiftAllCommandsFullAccess. Ciò consente ad Amazon Redshift di copiare, caricare, analizzare i dati ed eseguire query su di essi dalle risorse Amazon nel tuo account IAM.
Per informazioni su come gestire il ruolo IAM predefinito per un cluster, consulta Creazione di un ruolo IAM come predefinito per Amazon Redshift nella Amazon Redshift Management Guide.
(Facoltativo) Nella sezione Additional configurations (Configurazioni aggiuntive), disattivare Use defaults (Usa valori di default) per modificare le impostazioni di Network and security (Rete e sicurezza), Database configuration (Configurazione del database), Maintenance (Manutenzione), Monitoring (Monitoraggio) e Backup.

In alcuni casi, è possibile creare il cluster con l'opzione Caricare i dati campione e attivare il routing avanzato Amazon VPC. In tal caso, il cluster nel tuo virtual private cloud (VPC) richiede l'accesso all'endpoint Amazon S3 per caricare i dati.

Per rendere il cluster accessibile al pubblico, è possibile eseguire due operazioni. Puoi configurare un indirizzo NAT (Network Address Translation) nel VPC affinché il cluster acceda a Internet. Oppure puoi configurare un endpoint Amazon S3 VPC nel tuo VPC. Per ulteriori informazioni sul routing avanzato di Amazon VPC, consulta la sezione Enhanced Amazon VPC routing nella Amazon Redshift Management Guide.
Scegli Create cluster (Crea cluster). Attendi che il cluster venga creato con Available lo stato nella pagina Clusters.

Fase 2: Configurazione delle regole in ingresso per i client SQL

Nota

Ti consigliamo di saltare questo passaggio e accedere al cluster utilizzando Amazon Redshift Query Editor v2.

Più avanti in questo tutorial, si accederà al cluster da un Virtual Private Cloud (VPC) basato sul servizio Amazon VPC. Tuttavia, se per accedere al cluster si utilizza un client SQL esterno al firewall, è necessario concedere l'accesso in entrata.

Per controllare il firewall e concedere l'accesso in ingresso al cluster

S necessario accedere al cluster dall'esterno di un firewall, controlla le regole con cui è configurato. Ad esempio, il tuo cliente potrebbe essere un'istanza Amazon Elastic Compute Cloud (Amazon EC2) o un computer esterno.

Per ulteriori informazioni sulle regole del firewall, consulta le regole dei gruppi di sicurezza nella Amazon EC2 User Guide.
Per accedere da un client EC2 esterno Amazon, aggiungi una regola di ingresso al gruppo di sicurezza collegato al cluster che consente il traffico in entrata. Aggiungi le regole EC2 dei gruppi di sicurezza Amazon nella EC2 console Amazon. Ad esempio, un CIDR/IP of 192.0.2.0/24 allows clients in that IP address range to connect to your cluster. Find out the correct CIDR/IP per il tuo ambiente.

Passaggio 3: concedere l'accesso a un client SQL ed eseguire le query

Per interrogare i database ospitati dal tuo cluster Amazon Redshift, hai diverse opzioni per i client SQL. Ciò include:

Connettiti al tuo cluster ed esegui query utilizzando Amazon Redshift Query Editor v2.

Se utilizzi l'editor di query v2, non devi scaricare e configurare un'applicazione client SQL. Avvia Amazon Redshift Query Editor v2 dalla console Amazon Redshift.
Connect al cluster utilizzando RSQL. Per ulteriori informazioni, consulta Connecting with Amazon Redshift RSQL nella Amazon Redshift Management Guide.
Connettiti al tuo cluster tramite uno strumento client SQL, come SQL Workbench/J. Per ulteriori informazioni, consulta Connettiti al tuo cluster utilizzando SQL Workbench/J nella Amazon Redshift Management Guide.

Questo tutorial utilizza Amazon Redshift Query Editor v2 come un modo semplice per eseguire query su database ospitati dal tuo cluster Amazon Redshift. Dopo aver creato il cluster, puoi eseguire immediatamente le query. Per informazioni dettagliate sulle considerazioni relative all'utilizzo dell'editor di query di Amazon Redshift v2, consulta Considerazioni sull'utilizzo dell'editor di query v2 nella Amazon Redshift Management Guide.

Concessione dell'accesso all'editor di query v2

La prima volta che un amministratore configura l'editor di query v2 per te Account AWS, sceglie AWS KMS key quello utilizzato per crittografare le risorse dell'editor di query v2. Le risorse dell'editor di query di Amazon Redshift v2 includono query salvate, notebook e grafici. Per impostazione predefinita, una chiave di proprietà AWS viene utilizzata per crittografare le risorse. In alternativa, un amministratore può utilizzare una chiave gestita dal cliente scegliendo l'Amazon Resource Name (ARN) per la chiave nella pagina di configurazione. Dopo aver configurato un account, le impostazioni di AWS KMS crittografia non possono essere modificate. Per ulteriori informazioni, consulta Configuring your Account AWS nella Amazon Redshift Management Guide.

Per accedere all'editor della query v2, sono necessarie le opportune autorizzazioni. Un amministratore può collegare una delle policy AWS gestite per Amazon Redshift Query Editor v2 al ruolo o all'utente IAM per concedere le autorizzazioni. Queste politiche AWS gestite sono scritte con diverse opzioni che controllano il modo in cui l'etichettatura delle risorse consente la condivisione delle query. Puoi utilizzare la console IAM (https://console.aws.amazon.com/iam/) per allegare le policy IAM. Per ulteriori informazioni su queste politiche, consulta Accedere all'editor di query v2 nella Amazon Redshift Management Guide.

Puoi anche creare una policy in base alle autorizzazioni consentite e negate nelle policy gestite fornite. Se si utilizza l'editor policy della console IAM per creare le proprie policy, scegliereSQL Workbench come servizio per il quale si crea la policy nell'editor visivo. L'editor di query v2 utilizza il nome di servizio AWS SQL Workbench nell'editor visivo e in IAM Policy Simulator.

Per informazioni, consulta Utilizzo dell'editor di query v2 nella Guida alla gestione di Amazon Redshift.

Passaggio 4: caricare i dati da Amazon S3 ad Amazon Redshift

Dopo aver creato il cluster, puoi caricare dati da Amazon S3 nelle tabelle del database. Esistono diversi modi per caricare dati da Amazon S3.

È possibile utilizzare un client SQL per eseguire il comando SQL CREATE TABLE per creare una tabella nel database e quindi utilizzare il comando SQL COPY per caricare dati da Amazon S3. L'editor di query Amazon Redshift v2 è un client SQL.
Puoi utilizzare la procedura guidata di caricamento dell'editor di query di Amazon Redshift v2.

Questo tutorial dimostra come utilizzare l'editor di query Amazon Redshift v2 per eseguire comandi SQL per CREARE tabelle e COPIARE dati. Avvia Query editor v2 dal pannello di navigazione della console Amazon Redshift. All'interno di Query Editor v2, crea una connessione al examplecluster cluster e al database denominata dev con il nome dell'utente amministratore. awsuser Per questo tutorial scegli Credenziali temporanee che utilizzano un nome utente del database quando crei la connessione. Per informazioni dettagliate sull'uso dell'editor di query di Amazon Redshift v2, consulta Connessione a un database Amazon Redshift nella Amazon Redshift Management Guide.

Caricamento di dati da Amazon S3 tramite comandi SQL

Nel riquadro dell'editor di query v2, conferma di essere connesso al examplecluster cluster e dev al database. Quindi, crea tabelle nel database e carica i dati nelle tabelle. In questo tutorial, i dati che carichi sono disponibili in un bucket Amazon S3 accessibile da molti. Regioni AWS

La procedura seguente crea tabelle e carica dati da un bucket Amazon S3 pubblico.

Usa l'editor di query di Amazon Redshift v2 per copiare ed eseguire la seguente istruzione create table per creare una tabella nello public schema del database. dev Per ulteriori informazioni sulla sintassi, consultare CREATE TABLE nella Guida per gli sviluppatori di database di Amazon Redshift.

Per creare e caricare dati utilizzando un client SQL come Query Editor v2

Esegui il seguente comando SQL per CREARE la sales tabella.



   drop table if exists sales;
   create table sales(
	salesid integer not null,
	listid integer not null distkey,
	sellerid integer not null,
	buyerid integer not null,
	eventid integer not null,
	dateid smallint not null sortkey,
	qtysold smallint not null,
	pricepaid decimal(8,2),
	commission decimal(8,2),
	saletime timestamp);

Esegui il seguente comando SQL per CREARE la date tabella.



drop table if exists date;              
create table date(
	dateid smallint not null distkey sortkey,
	caldate date not null,
	day character(3) not null,
	week smallint not null,
	month character(5) not null,
	qtr character(5) not null,
	year smallint not null,
	holiday boolean default('N'));

Carica la sales tabella da Amazon S3 utilizzando il comando COPY.

Nota
Consigliamo di utilizzare il comando COPY per caricare set di dati di grandi dimensioni in Amazon Redshift da Amazon S3. Per ulteriori informazioni sulla sintassi di COPY, consultare COPY nella Guida per gli sviluppatori di database di Amazon Redshift.

Per caricare i dati di esempio, è necessario fornire al cluster l'autenticazione per accedere ad Amazon S3 per tuo conto. Fornisci l'autenticazione facendo riferimento al ruolo IAM che hai creato e impostato come cluster quando hai scelto Crea ruolo IAM come predefinito quando hai creato il cluster. default

Carica la sales tabella utilizzando il seguente comando SQL. Facoltativamente, puoi scaricare e visualizzare da Amazon S3 i dati di origine per sales la tabella. .
```
COPY sales
    FROM 's3://redshift-downloads/tickit/sales_tab.txt' 
    DELIMITER '\t' 
    TIMEFORMAT 'MM/DD/YYYY HH:MI:SS' 
    REGION 'us-east-1'
    IAM_ROLE default;
```

Caricate la date tabella utilizzando il seguente comando SQL. Facoltativamente, puoi scaricare e visualizzare da Amazon S3 i dati di origine per date la tabella. .


COPY date
    FROM 's3://redshift-downloads/tickit/date2008_pipe.txt' 
    DELIMITER '|' 
    REGION 'us-east-1'
    IAM_ROLE default;

Caricamento di dati da Amazon S3 utilizzando l'editor di query v2

Questa sezione descrive il caricamento dei tuoi dati in un cluster Amazon Redshift. L'editor di query v2 semplifica il caricamento dei dati quando si utilizza la procedura guidata Load data. Il comando COPY generato e utilizzato nell'editor di query v2 Load data wizard supporta molti dei parametri disponibili nella sintassi del comando COPY per caricare dati da Amazon S3. Per informazioni sul comando COPY e sulle opzioni utilizzate per copiare il caricamento da Amazon S3, consultare COPIA da Amazon Simple Storage Service nella Guida per sviluppatori di database Amazon Redshift.

Per caricare i tuoi dati da Amazon S3 ad Amazon Redshift, Amazon Redshift richiede un ruolo IAM con i privilegi necessari per caricare i dati dal bucket Amazon S3 specificato.

Per caricare i tuoi dati da Amazon S3 ad Amazon Redshift, puoi utilizzare la procedura guidata di caricamento dei dati dell'editor di query v2. Per informazioni su come utilizzare la procedura guidata di caricamento dei dati, consulta Loading data from Amazon S3 nella Amazon Redshift Management Guide.

Crea dati TICKIT nel tuo cluster

TICKIT è un database di esempio che puoi caricare facoltativamente nel tuo cluster Amazon Redshift per imparare a interrogare i dati in Amazon Redshift. Puoi creare il set completo di tabelle TICKIT e caricare dati nel tuo cluster nei seguenti modi:

Quando crei un cluster nella console Amazon Redshift, hai la possibilità di caricare contemporaneamente dati TICKIT di esempio. Sulla console Amazon Redshift, scegli Clusters, Create cluster. Nella sezione Dati di esempio, seleziona Carica dati di esempio Amazon Redshift carica automaticamente il set di dati di esempio nel dev database del cluster Amazon Redshift durante la creazione del cluster.
Per connetterti a un cluster esistente, procedi come segue:
- Nella console Amazon Redshift, scegli Clusters dalla barra di navigazione.
- Scegli il tuo cluster dal riquadro Cluster.
- Scegli Query data, Query in Query Editor v2.
- Espandi examplecluster nell'elenco delle risorse. Se è la prima volta che ti connetti al cluster, viene visualizzato Connect to examplecluster. Scegli nome utente e password del database. Lascia il database così com'èdev. awsuserSpecificare il nome Changeit1 utente e la password.
- Scegli Crea connessione.
Con Amazon Redshift Query Editor v2, puoi caricare i dati TICKIT in un database di esempio denominato sample_data_dev. Scegli il database sample_data_dev nell'elenco delle risorse. Accanto al nodo tickit, scegli l'icona Apri taccuini di esempio. Conferma di voler creare il database di esempio.
Amazon Redshift Query Editor v2 crea il database di esempio insieme a un notebook di esempio denominato. tickit-sample-notebook Puoi scegliere Esegui tutto per eseguire questo notebook per interrogare i dati nel database di esempio.

Per visualizzare i dettagli sui dati TICKIT, consulta il database di esempio nella Amazon Redshift Database Developer Guide.

Fase 5: provare query di esempio utilizzando l'editor di query

Per configurare e utilizzare l'editor di query di Amazon Redshift v2 per interrogare un database, consulta Working with Query Editor v2 nella Amazon Redshift Management Guide.

Ora, provare alcune query di esempio, come illustrato di seguito. Per creare nuove query nell'editor di query v2, scegli l'icona + in alto a destra del riquadro delle query e scegli SQL. Viene visualizzata una nuova pagina di query in cui è possibile copiare e incollare le seguenti query SQL.

Nota

Assicurati di eseguire prima la prima query nel notebook, che imposta il valore di configurazione del search_path server tickit sullo schema utilizzando il seguente comando SQL:


set search_path to tickit;

Per ulteriori informazioni sull'utilizzo del comando SELECT, consulta SELECT nella Amazon Redshift Database Developer Guide.


-- Get definition for the sales table.
SELECT *    
FROM pg_table_def    
WHERE tablename = 'sales';


-- Find total sales on a given calendar date.
SELECT sum(qtysold) 
FROM   sales, date 
WHERE  sales.dateid = date.dateid 
AND    caldate = '2008-01-05';


-- Find top 10 buyers by quantity.
SELECT firstname, lastname, total_quantity 
FROM   (SELECT buyerid, sum(qtysold) total_quantity
        FROM  sales
        GROUP BY buyerid
        ORDER BY total_quantity desc limit 10) Q, users
WHERE Q.buyerid = userid
ORDER BY Q.total_quantity desc;


-- Find events in the 99.9 percentile in terms of all time gross sales.
SELECT eventname, total_price 
FROM  (SELECT eventid, total_price, ntile(1000) over(order by total_price desc) as percentile 
       FROM (SELECT eventid, sum(pricepaid) total_price
             FROM   sales
             GROUP BY eventid)) Q, event E
       WHERE Q.eventid = E.eventid
       AND percentile = 1
ORDER BY total_price desc;

Fase 6: reimpostazione dell'ambiente

Nei passaggi precedenti, hai creato con successo un cluster Amazon Redshift, caricato i dati in tabelle e interrogato i dati utilizzando un client SQL come Amazon Redshift Query Editor v2.

Una volta completato il presente tutorial, consigliamo di reimpostare l'ambiente allo stato precedente eliminando il cluster di esempio. I costi del servizio Amazon Redshift continueranno ad essere addebitati fino all'eliminazione del cluster.

Tuttavia, potresti voler mantenere attivo il cluster di esempio se intendi provare attività in altre guide o attività di Amazon Redshift descritte in. Esegui comandi per definire e utilizzare un database nel tuo data warehouse

Per eliminare un cluster

Accedi AWS Management Console e apri la console Amazon Redshift all'indirizzo. https://console.aws.amazon.com/redshiftv2/
Dal menu di navigazione, scegliere Clusters (Cluster) per visualizzare l'elenco dei cluster.
Scegli il cluster examplecluster. In Actions (Azioni), scegliere Delete (Elimina). Il cluster di esempi Delete? viene visualizzata la pagina.
Conferma il cluster da eliminare, deseleziona l'impostazione Crea istantanea finale, quindi accedi delete per confermare l'eliminazione. Scegli Delete cluster (Elimina cluster).

Nella pagina dell'elenco dei cluster, lo stato del cluster viene aggiornato nel corso dell'eliminazione.

Una volta completato il tutorial, sarà possibile trovare ulteriori informazioni su Amazon Redshift e sulle fasi successive in Risorse aggiuntive per informazioni su Amazon Redshift.

Avvertimento JavaScript è disabilitato o non è disponibile nel tuo browser.

Per usare la documentazione AWS, JavaScript deve essere abilitato. Consulta le pagine della guida del browser per le istruzioni.

Convenzioni dei documenti

Inizia a usare i data warehouse serverless

Definisci e utilizza un database nel tuo data warehouse

Argomento successivo:

Definisci e utilizza un database nel tuo data warehouse

Argomento precedente:

Inizia a usare i data warehouse serverless

Hai bisogno di aiuto?

In questa pagina

Seleziona le tue preferenze relative ai cookie

Personalizza le tue preferenze relative ai cookie

Essenziali

Prestazione

Funzionali

Pubblicitari

Impossibile salvare le preferenze dei cookie

Inizia a usare i data warehouse con provisioning di Amazon Redshift

Importante

Argomenti

Definizione delle regole del firewall

Nota

Fase 1: Creazione di un cluster Amazon Redshift di esempio

Come creare un cluster Amazon Redshift

Importante

Nota

Fase 2: Configurazione delle regole in ingresso per i client SQL

Nota

Per controllare il firewall e concedere l'accesso in ingresso al cluster

Passaggio 3: concedere l'accesso a un client SQL ed eseguire le query

Concessione dell'accesso all'editor di query v2

Passaggio 4: caricare i dati da Amazon S3 ad Amazon Redshift

Caricamento di dati da Amazon S3 tramite comandi SQL

Per creare e caricare dati utilizzando un client SQL come Query Editor v2

Nota

Caricamento di dati da Amazon S3 utilizzando l'editor di query v2

Crea dati TICKIT nel tuo cluster

Fase 5: provare query di esempio utilizzando l'editor di query

Nota

Fase 6: reimpostazione dell'ambiente

Per eliminare un cluster

Argomento successivo:

Argomento precedente:

Hai bisogno di aiuto?

In questa pagina

Related resources

Questa pagina ti è stata utile?

Related resources

I passaggi di questo tutorial sono descritti di seguito