Creazione di un nodo di origine Amazon Redshift - AWS Aderenza

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Creazione di un nodo di origine Amazon Redshift

Autorizzazioni necessarie

I processi AWS Glue Studio che utilizzano origini dati Amazon Redshift richiedono autorizzazioni aggiuntive. Per ulteriori informazioni su come aggiungere autorizzazioni ai processi ETL, consulta la pagina Review IAM permissions needed for ETL jobs.

Le seguenti autorizzazioni sono necessarie per utilizzare una connessione Amazon Redshift.

  • redshift-data:ListSchemas

  • redshift-data:ListTables

  • redshift-data:DescribeTable

  • redshift-data:ExecuteStatement

  • redshift-data:DescribeStatement

  • redshift-data:GetStatementResult

Aggiunta di un'origine dati Amazon Redshift

Per aggiungere un nodo Origine dati: Amazon Redshift:
  1. Scegli il tipo di accesso Amazon Redshift:

    • Connessione dati diretta (consigliata): scegli questa opzione se desideri accedere direttamente ai tuoi dati Amazon Redshift. Questa è l'opzione consigliata nonché quella predefinita.

    • Data Catalog tables: scegli questa opzione se hai delle tabelle di Catalogo dati che desideri utilizzare.

  2. Se scegli Connessione dati diretta, scegli la connessione per la tua origine dati Amazon Redshift. Ciò presuppone che la connessione esista già e che sia possibile effettuare una selezione tra le connessioni esistenti. Se devi creare una connessione, scegli Crea connessione Redshift. Per ulteriori informazioni, consulta la pagina Overview of using connectors and connections.

    Dopo aver scelto una connessione, puoi visualizzare le proprietà della connessione facendo clic su Visualizza proprietà. Le informazioni sulla connessione sono visibili, tra cui URL, gruppi di sicurezza, sottorete, zona di disponibilità, descrizione, nonché timestamp di creazione (UTC) e ultimo aggiornamento (UTC).

  3. Scegli un'opzione di origine Amazon Redshift:

    • Scegli una singola tabella: questa è la tabella che contiene i dati a cui desideri accedere da una singola tabella Amazon Redshift.

    • Inserisci una query personalizzata: ti consente di accedere a un set di dati da più tabelle Amazon Redshift in base alla tua query personalizzata.

  4. Se hai scelto una singola tabella, scegli lo schema Amazon Redshift. L'elenco degli schemi disponibili tra cui scegliere è determinato dalla tabella selezionata.

    In alternativa, scegli Inserisci query personalizzata. Scegli questa opzione per accedere a un set di dati personalizzato da più tabelle Amazon Redshift. Se scegli questa opzione, inserisci la query Amazon Redshift.

    Quando ti connetti a un ambiente serverless Amazon Redshift, aggiungi la seguente autorizzazione alla query personalizzata:

    GRANT SELECT ON ALL TABLES IN <schema> TO PUBLIC

    Puoi scegliere Acquisisci schema per leggere lo schema in base alla query che hai inserito. È inoltre possibile scegliere Apri editor di query Redshift per inserire una query Amazon Redshift. Per ulteriori informazioni, consulta la pagina Querying a database using the query editor.

  5. In Prestazioni e sicurezza, scegli la directory di gestione temporanea di Amazon S3 e il ruolo IAM.

    • Directory di gestione temporanea di Amazon S3: scegli la posizione Amazon S3 per la gestione temporanea dei dati.

    • Ruolo IAM: scegli il ruolo IAM che può scrivere nella posizione Amazon S3 che hai selezionato.

  6. In Parametri Redshift personalizzati - facoltativo, inserisci il parametro e il valore.