Interrogare il AWS Glue Data Catalog

È possibile utilizzare l'editor di query v2 per interrogare i dati catalogati nel sistema AWS Glue Data Catalog utilizzando comandi SQL specifici e concedendo le autorizzazioni descritte in questa sezione. Per impostazione predefinita, AWS Glue Data Catalog è elencato come database v2 dell'editor di query denominato awsdatacatalog. Interrogare AWS Glue Data Catalog non è disponibile in tutti Amazon Redshift Regioni AWS. Utilizza il comando SHOW per determinare se questa funzionalità è disponibile. Per ulteriori informazioni su AWS Glue, consulta What is? AWS Glue nella Guida per gli AWS Glue sviluppatori.

Nota

L'interrogazione AWS Glue Data Catalog è supportata solo nei cluster di tipo nodo Amazon RA3 Redshift e Amazon Redshift Serverless.

Puoi configurare il tuo data warehouse e visualizzare gli oggetti del AWS Glue database catalogati utilizzando i seguenti comandi SQL:

SHOW: per visualizzare se awsdatacatalog è montato per il data warehouse attualmente connesso. Ad esempio, per mostrare il valore del parametro data_catalog_auto_mount, esegui:
```
SHOW data_catalog_auto_mount;
```
Per ulteriori informazioni, consulta SHOW nella Guida per gli sviluppatori di database di Amazon Redshift.
ALTER SYSTEM: per modificare la configurazione a livello di sistema di data_catalog_auto_mount. Ad esempio, per modificare il valore del parametro data_catalog_auto_mount a on, esegui:
```
ALTER SYSTEM SET data_catalog_auto_mount = on;
```
La modifica ha effetto quando un cluster fornito viene riavviato o un gruppo di lavoro serverless viene automaticamente messo in pausa e ripreso. Per ulteriori informazioni, consulta ALTER SYSTEM nella Guida per gli sviluppatori di database di Amazon Redshift.
SHOW SCHEMAS: mostra un elenco di schemi. Gli schemi del database denominato awsdatacatalog rappresentano i AWS Glue database catalogati in. AWS Glue Data Catalog Ad esempio, per mostrare questi schemi, esegui:
```
SHOW SCHEMAS FROM DATABASE awsdatacatalog;
```
Per ulteriori informazioni, consulta SHOW SCHEMAS nella Guida per gli sviluppatori di database di Amazon Redshift.
SHOW TABLES: mostra un elenco di tabelle in uno schema. Ad esempio, per mostrare le tabelle del AWS Glue Data Catalog database denominate awsdatacatalog presenti nello schemamyglue, esegui:
```
SHOW TABLES FROM SCHEMA awsdatacatalog.myschema;
```
Per ulteriori informazioni, consulta SHOW TABLES nella Guida per gli sviluppatori di database di Amazon Redshift.
SHOW COLUMNS: mostra un elenco di colonne in una tabella. Ad esempio, per mostrare le colonne del AWS Glue Data Catalog database denominate awsdatacatalog che si trovano nello schema myglue e nella tabella mytable esegui:
```
SHOW COLUMNS FROM TABLE awsdatacatalog.myglue.mytable;
```
Per ulteriori informazioni, consulta SHOW COLUMNS nella Guida per gli sviluppatori di database di Amazon Redshift.

Per concedere al tuo utente o ruolo IAM l'autorizzazione a interrogare il AWS Glue Data Catalog,

Nel riquadro della visualizzazione ad albero, connettiti al database iniziale nel cluster o nel gruppo di lavoro serverless utilizzando il metodo di autenticazione Nome utente e password del database. Ad esempio, connettiti al database dev utilizzando l'utente e la password dell'amministratore che hai usato quando hai creato il cluster o il gruppo di lavoro.
In una scheda dell'editor, esegui l'istruzione SQL seguente per concedere a un utente IAM l'accesso a AWS Glue Data Catalog.
```
GRANT USAGE ON DATABASE awsdatacatalog to "IAM:myIAMUser"
```
IAM:myIAMUserDov'è un utente IAM a cui desideri concedere i privilegi di utilizzo a. AWS Glue Data Catalog In alternativa, puoi concedere il privilegio di utilizzo a IAMR:myIAMRole per un ruolo IAM.
Nel riquadro della visualizzazione ad albero, modifica o elimina la connessione al cluster o al gruppo di lavoro che hai creato in precedenza. Collegati al cluster o al gruppo di lavoro in uno dei seguenti modi:
- Per connetterti al database awsdatacatalog da un cluster, devi utilizzare il metodo di autenticazione Credenziali temporanee mediante l'identità IAM. Per ulteriori informazioni su questo metodo di autenticazione, consulta Connessione a un database Amazon Redshift. L'amministratore dell'editor di query v2 potrebbe dover configurare Impostazioni account per l'account per visualizzare questi metodi di autenticazione nella finestra di connessione.
- Per connetterti al database awsdatacatalog da un gruppo di lavoro, devi utilizzare il metodo di autenticazione Utente federato. Per ulteriori informazioni su questo metodo di autenticazione, consulta Connessione a un database Amazon Redshift.
Con il privilegio concesso, puoi usare l'identità IAM per eseguire SQL su AWS Glue Data Catalog.

Dopo il collegamento, puoi utilizzare l'editor di query v2 per eseguire query sui dati catalogati in AWS Glue Data Catalog. Nel riquadro della visualizzazione ad albero dell'editor di query v2, scegli il cluster o il gruppo di lavoro e il database awsdatacatalog. Nel riquadro dell'editor o del notebook, verifica di aver selezionato il cluster o il gruppo di lavoro corretto. Il database scelto deve essere il database iniziale di Amazon Redshift, ad esempio dev. Per informazioni sulla creazione di query, consulta Creazione di query con Amazon Redshift e Notebook in Amazon Redshift. Il database denominato awsdatacatalog è riservato per fare riferimento al database del catalogo dati esterno del tuo account. Le query sul database awsdatacatalog possono solo essere di sola lettura. Utilizza la notazione in tre parti per fare riferimento alla tabella nell'istruzione SELECT. Dove la prima parte è il nome del database, la seconda è il nome del AWS Glue database e la terza è il nome della AWS Glue tabella.


SELECT * FROM awsdatacatalog.<aws-glue-db-name>.<aws-glue-table-name>;

Puoi eseguire vari scenari che leggono i AWS Glue Data Catalog dati e popolano le tabelle Amazon Redshift.

L'esempio seguente SQL unisce due tabelle definite in. AWS Glue


SELECT pn.emp_id, alias, role, project_name 
FROM "awsdatacatalog"."empl_db"."project_name_table" pn, 
"awsdatacatalog"."empl_db"."project_alias_table" pa
WHERE pn.emp_id = pa.emp_id;

L'esempio seguente SQL crea una tabella Amazon Redshift e la popola con i dati provenienti da un'unione di due tabelle. AWS Glue


CREATE TABLE dev.public.glue AS
SELECT pn.emp_id, alias, role, project_name 
FROM "awsdatacatalog"."empl_db"."project_name_table" pn, 
"awsdatacatalog"."empl_db"."project_alias_table" pa
WHERE pn.emp_id = pa.emp_id;

Interrogazione delle tabelle Amazon S3 (anteprima)

Puoi utilizzare l'editor di query v2 per interrogare i dati contenuti nei cataloghi Amazon S3table montati su. AWS Glue Data Catalog I cataloghi di tabelle di Amazon S3 vengono montati al momento della AWS Glue Data Catalog creazione e vengono visualizzati automaticamente come database esterni su tutti i cluster e i gruppi di lavoro serverless distribuiti nello stesso account. Regione AWS Per ulteriori informazioni sull'accesso alle tabelle Amazon S3 con Amazon Redshift, consulta Accesso alle tabelle Amazon S3 con Amazon Redshift nella Guida per l'utente di Amazon Simple Storage Service.

Avvertimento JavaScript è disabilitato o non è disponibile nel tuo browser.

Per usare la documentazione AWS, JavaScript deve essere abilitato. Consulta le pagine della guida del browser per le istruzioni.

Convenzioni dei documenti

Importazione nei taccuini

Esecuzione di query in un data lake

Seleziona le tue preferenze relative ai cookie

Personalizza le tue preferenze relative ai cookie

Essenziali

Prestazione

Funzionali

Pubblicitari

Impossibile salvare le preferenze dei cookie

Interrogare il AWS Glue Data Catalog

Nota

Per concedere al tuo utente o ruolo IAM l'autorizzazione a interrogare il AWS Glue Data Catalog,

Interrogazione delle tabelle Amazon S3 (anteprima)

Questa pagina ti è stata utile?

Argomento successivo:

Argomento precedente:

Hai bisogno di aiuto?