Inizia a usare i data warehouse Serverless Amazon Redshift - Amazon Redshift

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Inizia a usare i data warehouse Serverless Amazon Redshift

Se utilizzi Amazon Redshift Serverless per la prima volta, consigliamo di iniziare leggendo le seguenti sezioni: Il flusso di base di Amazon Redshift serverless consiste nel creare risorse serverless, connettersi ad Amazon Redshift serverless, caricare dati di esempio e quindi eseguire query sui dati. In questa guida, è possibile scegliere di caricare dati di esempio da Amazon Redshift serverless o da un bucket Amazon S3. I dati di esempio vengono utilizzati in tutta la documentazione di Amazon Redshift per dimostrare le funzionalità. Per iniziare a utilizzare i data warehouse con provisioning di Amazon Redshift, consulta. Inizia a usare i data warehouse con provisioning di Amazon Redshift

Iscrizione a AWS

Se non hai già un AWS account, registrane uno. Se disponi già di un account, puoi ignorare questo prerequisito e utilizzare il tuo account esistente.

  1. Apri la https://portal.aws.amazon.com/billing/registrazione.

  2. Segui le istruzioni online.

    Quando si registra un AWS account, viene creato un utente root dell' AWS account. L'utente root ha accesso a tutti i AWS servizi e le risorse dell'account. Come best practice di sicurezza, assegna l'accesso amministrativo a un utente amministrativo e utilizza solo l'utente root per eseguire attività che richiedono l'accesso di un utente root.

Creazione di un data warehouse con Amazon Redshift serverless

La prima volta che accedi alla console Amazon Redshift serverless, viene richiesto di accedere all'esperienza introduttiva, che puoi utilizzare per creare e gestire risorse serverless. In questa guida, creerai risorse serverless utilizzando le impostazioni predefinite di Amazon Redshift serverless.

Per un controllo più granulare della configurazione, scegli Customize settings (Personalizza impostazioni).

Nota

Redshift Serverless richiede un Amazon VPC con tre sottoreti in tre diverse zone di disponibilità. Redshift Serverless richiede inoltre almeno 37 indirizzi IP disponibili. Assicurati che Amazon VPC che usi per Redshift Serverless abbia tre sottoreti in tre diverse zone di disponibilità e almeno 37 indirizzi IP disponibili, prima di continuare. Per ulteriori informazioni sulla creazione di sottoreti in AmazonVPC, consulta Create a subnet nella Amazon Virtual Private Cloud User Guide. Per ulteriori informazioni sugli indirizzi IP in AmazonVPC, consulta Indirizzamento IP per VPCs le tue sottoreti.

Per configurare utilizzando le impostazioni predefinite:
  1. Accedi a AWS Management Console e apri la console Amazon Redshift all'indirizzo. https://console.aws.amazon.com/redshiftv2/

    Scegli Prova la versione di prova gratuita di Redshift Serverless.

  2. In Configuration (Configurazione), scegli Use default settings (Utilizza impostazioni predefinite). Amazon Redshift Serverless crea uno spazio dei nomi predefinito con un gruppo di lavoro predefinito associato a questo spazio dei nomi. Seleziona Save configuration (Salva configurazione).

    Nota

    Un namespace è una raccolta di oggetti e utenti del database. I namespace raggruppano tutte le risorse utilizzate in Redshift Serverless, come schemi, tabelle, utenti, condivisioni di dati e istantanee.

    Un gruppo di lavoro è una raccolta di risorse di elaborazione. I gruppi di lavoro ospitano le risorse di elaborazione che Redshift Serverless utilizza per eseguire attività di calcolo.

    La schermata seguente mostra le impostazioni predefinite per Amazon Redshift Serverless.

    Scegli le impostazioni predefinite per utilizzare i valori predefiniti per Amazon Redshift Serverless.
  3. Una volta completata la configurazione, scegliere Continue (Continua) per andare a Serverless dashboard (Pannello di controllo serverless). Puoi vedere che il gruppo di lavoro e lo spazio dei nomi serverless sono disponibili.

    Una volta terminata la configurazione, il gruppo di lavoro e lo spazio dei nomi sono disponibili per l'uso.
    Nota

    Se Redshift Serverless non crea correttamente il gruppo di lavoro, puoi fare quanto segue:

    • Risolvi eventuali errori segnalati da Redshift Serverless, come la presenza di un numero insufficiente di sottoreti in Amazon. VPC

    • Elimina lo spazio dei nomi scegliendo lo spazio dei nomi predefinito nella dashboard di Redshift Serverless, quindi scegliendo Azioni, Elimina spazio dei nomi. L'eliminazione di un namespace richiede diversi minuti.

    • Quando si apre nuovamente la console Redshift Serverless, viene visualizzata la schermata di benvenuto.

Caricamento di dati di esempio

Ora che è stato configurato il data warehouse con Amazon Redshift Serverless, puoi utilizzare l'editor di query Amazon Redshift v2 per caricare dati di esempio.

  1. Per avviare l'editor di query v2 dalla console Amazon Redshift Serverless, scegli Esegui query sui data. Quando richiami l'editor di query v2 dalla console di Amazon Redshift Serverless, viene visualizzata una nuova scheda del browser con l'editor di query. L'editor di query v2 si connette dal computer client all'ambiente Amazon Redshift Serverless.

    Il pulsante Esegui query sui dati nella console Amazon Redshift serverless avvia l'editor di queary v2.
  2. Per questa guida, utilizzerai il tuo account AWS amministratore e quello predefinito. AWS KMS keyPer informazioni sulla configurazione dell'editor di query v2, incluse le autorizzazioni necessarie, consulta Configuring your nella Account AWS Amazon Redshift Management Guide. Per informazioni sulla configurazione di Amazon Redshift per l'utilizzo di una chiave gestita dal cliente o per modificare KMS la chiave utilizzata da Amazon Redshift, consulta Changing AWS KMS the key for a namespace.

  3. Per connettersi a un gruppo di lavoro, scegliere il nome del gruppo di lavoro nel pannello con struttura ad albero.

    Per connettersi a un gruppo di lavoro, scegliere il nome del gruppo di lavoro nel pannello con struttura ad albero.
  4. Quando ti connetti a un nuovo gruppo di lavoro per la prima volta nell'editor di query v2, devi selezionare il tipo di autenticazione da utilizzare per connetterti al gruppo di lavoro. Per questa guida, lascia selezionato Utente federato e scegli Crea connessione.

    Puoi scegliere di connettersi utilizzando una password temporanea o una combinazione di nome utente e password del database.

    Una volta connesso, puoi scegliere di caricare dati di esempio da Amazon Redshift serverless o da un bucket Amazon S3.

  5. Nel gruppo di lavoro Amazon Redshift Serverless predefinito, espandi il database sample_data_dev. Esistono tre schemi di esempio corrispondenti a tre set di dati di esempio che puoi caricare nel database Amazon Redshift serverless. Scegli il set di dati di esempio che desideri caricare e scegli Apri notebook di esempio.

    Espandi il database sample_data_dev, quindi scegli lo schema che si desidera caricare.
    Nota

    Un SQL notebook è un contenitore per celle Markdown. SQL È possibile utilizzare i taccuini per organizzare, annotare e condividere più SQL comandi in un unico documento.

  6. Quando si caricano i dati per la prima volta, l'editor di query v2 richiederà di creare un database di esempio. Scegli Create (Crea) .

    Finestra di dialogo con una richiesta di creazione di un database di esempio.

Esecuzione di query di esempio

Dopo aver configurato Amazon Redshift serverless, puoi iniziare a utilizzare un set di dati di esempio in Amazon Redshift serverless. Amazon Redshift serverless carica automaticamente il set di dati di esempio, ad esempio il set di dati tickit, ed è possibile eseguire immediatamente le query sui dati.

  • Una volta che Amazon Redshift serverless ha terminato il caricamento dei dati di esempio, tutte le query di esempio vengono caricate nell'editor. Puoi scegliere Esegui tutto per eseguire tutte le query dai notebook di esempio.

    Scegli il pulsante Esegui tutto per eseguire tutte le query di esempio.

    È inoltre possibile esportare i risultati come CSV file JSON o visualizzare i risultati in un grafico.

    Il pulsante Esporta in Query Editor v2, accanto al pulsante di visualizzazione del grafico.

Puoi anche caricare i dati da un bucket Amazon S3. Per ulteriori informazioni, consulta Caricamento di dati da Amazon S3.

Caricamento di dati da Amazon S3

Una volta creato il data warehouse, puoi caricare i dati da Amazon S3.

A questo punto, disponi di un database denominato dev. Successivamente, crea alcune tabelle nel database, carica i dati nelle tabelle e prova a eseguire una query. Per maggiore praticità, i dati di esempio da caricare sono disponibili in un bucket Amazon S3.

  1. Prima di poter caricare dati da Amazon S3, devi prima creare un IAM ruolo con le autorizzazioni necessarie e collegarlo al tuo spazio dei nomi serverless. Per farlo, scegli Configurazione dello spazio dei nomi dal menu di navigazione, scegli il tuo spazio dei nomi e quindi scegli Sicurezza e crittografia. Quindi, scegli Gestisci ruoli. IAM

    Dalla pagina di configurazione del namespace, scegli Sicurezza e crittografia, quindi scegli Gestisci IAM ruoli.
  2. Espandi il menu Gestisci IAM ruoli e scegli Crea IAM ruolo.

    Espandi il menu Gestisci IAM ruoli e scegli Crea IAM ruolo.
  3. Scegli il livello di accesso al bucket S3 che desideri concedere a questo ruolo e scegli Crea IAM ruolo come predefinito.

    Crea un IAM ruolo da utilizzare come ruolo predefinito.
  4. Scegli Save changes (Salva modifiche). È ora possibile caricare i dati di esempio da Amazon S3.

I passaggi seguenti utilizzano dati all'interno di un bucket Amazon Redshift S3 pubblico, ma puoi replicare gli stessi passaggi utilizzando il tuo bucket S3 e i tuoi comandi. SQL

Caricamento di dati di esempio da Amazon S3
  1. Nell'editor di query v2, scegli The add button, represented by a plus sign. Aggiungi, quindi scegli Notebook per creare un nuovo notebook. SQL

    Crea un nuovo taccuino nel Query Editor v2.
  2. Passaggio al database dev.

    Passa al database di sviluppo per caricare i dati da un bucket S3.
  3. Per creare le tabelle.

    Se utilizzi l'editor di query v2, copia ed esegui le seguenti istruzioni per la creazione delle tabelle nel database dev. Per ulteriori informazioni sulla sintassi, consulta CREATETABLEla Amazon Redshift Database Developer Guide.

    create table users( userid integer not null distkey sortkey, username char(8), firstname varchar(30), lastname varchar(30), city varchar(30), state char(2), email varchar(100), phone char(14), likesports boolean, liketheatre boolean, likeconcerts boolean, likejazz boolean, likeclassical boolean, likeopera boolean, likerock boolean, likevegas boolean, likebroadway boolean, likemusicals boolean); create table event( eventid integer not null distkey, venueid smallint not null, catid smallint not null, dateid smallint not null sortkey, eventname varchar(200), starttime timestamp); create table sales( salesid integer not null, listid integer not null distkey, sellerid integer not null, buyerid integer not null, eventid integer not null, dateid smallint not null sortkey, qtysold smallint not null, pricepaid decimal(8,2), commission decimal(8,2), saletime timestamp);
  4. Nell'editor di query v2, crea una nuova SQL cella nel tuo notebook.

    Crea una nuova SQL cella nell'editor di query v2 per eseguire SQL i comandi.
  5. Ora usa il COPY comando nell'editor di query v2 per caricare set di dati di grandi dimensioni da Amazon S3 o Amazon DynamoDB in Amazon Redshift. Per ulteriori informazioni sulla COPY sintassi, consulta COPYla Amazon Redshift Database Developer Guide.

    Puoi eseguire il COPY comando con alcuni dati di esempio disponibili in un bucket S3 pubblico. Esegui i seguenti SQL comandi nell'editor di query v2.

    COPY users FROM 's3://redshift-downloads/tickit/allusers_pipe.txt' DELIMITER '|' TIMEFORMAT 'YYYY-MM-DD HH:MI:SS' IGNOREHEADER 1 REGION 'us-east-1' IAM_ROLE default; COPY event FROM 's3://redshift-downloads/tickit/allevents_pipe.txt' DELIMITER '|' TIMEFORMAT 'YYYY-MM-DD HH:MI:SS' IGNOREHEADER 1 REGION 'us-east-1' IAM_ROLE default; COPY sales FROM 's3://redshift-downloads/tickit/sales_tab.txt' DELIMITER '\t' TIMEFORMAT 'MM/DD/YYYY HH:MI:SS' IGNOREHEADER 1 REGION 'us-east-1' IAM_ROLE default;
  6. Dopo aver caricato i dati, crea un'altra SQL cella nel tuo notebook e prova alcune query di esempio. Per ulteriori informazioni sull'utilizzo del SELECT comando, consulta SELECTla Amazon Redshift Developer Guide. Per comprendere la struttura e gli schemi dei dati di esempio, esplora l'utilizzo dell'editor di query v2.

    -- Find top 10 buyers by quantity. SELECT firstname, lastname, total_quantity FROM (SELECT buyerid, sum(qtysold) total_quantity FROM sales GROUP BY buyerid ORDER BY total_quantity desc limit 10) Q, users WHERE Q.buyerid = userid ORDER BY Q.total_quantity desc; -- Find events in the 99.9 percentile in terms of all time gross sales. SELECT eventname, total_price FROM (SELECT eventid, total_price, ntile(1000) over(order by total_price desc) as percentile FROM (SELECT eventid, sum(pricepaid) total_price FROM sales GROUP BY eventid)) Q, event E WHERE Q.eventid = E.eventid AND percentile = 1 ORDER BY total_price desc;

Ora che sono stati caricati i dati ed eseguito alcune query di esempio, puoi esplorare altre aree di Amazon Redshift serverless. Consulta l'elenco seguente per ulteriori informazioni su come utilizzare Amazon Redshift serverless.

  • Puoi caricare i dati da un bucket Amazon S3. Per ulteriori informazioni, consulta Caricamento dei dati da Amazon S3.

  • Puoi utilizzare l'editor di query v2 per caricare dati da un file locale separato da caratteri di dimensioni inferiori a 5 MB. Per ulteriori informazioni, consulta la sezione relativa al caricamento di dati da un file locale.

  • Puoi connetterti ad Amazon Redshift Serverless con SQL strumenti di terze parti con il JDBC driver and. ODBC Per ulteriori informazioni, consulta Connessione ad Amazon Redshift serverless.

  • Puoi anche utilizzare Amazon Redshift Data API per connetterti ad Amazon Redshift Serverless. Per ulteriori informazioni, consulta Using the Amazon Redshift Data API.

  • Puoi utilizzare i tuoi dati in Amazon Redshift Serverless con Redshift ML per creare modelli di machine learning con il comando. CREATE MODEL Consulta il tutorial: Building customer churn models (Creazione di modelli di abbandono dei clienti) per informazioni su come creare un modello ML di Redshift.

  • Puoi eseguire query sui dati da un data lake Amazon S3 senza caricare i dati in Amazon Redshift serverless. Per ulteriori informazioni, consulta Esecuzione di query in un data lake.