Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Interrogare il AWS Glue Data Catalog
È possibile utilizzare l'editor di query v2 per interrogare i dati catalogati nel sistema AWS Glue Data Catalog utilizzando comandi SQL specifici e concedendo le autorizzazioni descritte in questa sezione. Per impostazione predefinita, AWS Glue Data Catalog
è elencato come database v2 dell'editor di query denominato awsdatacatalog
. Interrogare AWS Glue Data Catalog
non è disponibile in tutti Amazon Redshift Regioni AWS. Utilizza il comando SHOW per determinare se questa funzionalità è disponibile. Per ulteriori informazioni su AWS Glue, consulta What is? AWS Glue nella Guida per gli AWS Glue sviluppatori.
Nota
L'interrogazione AWS Glue Data Catalog è supportata solo nei cluster di tipo nodo Amazon RA3 Redshift e Amazon Redshift Serverless.
Puoi configurare il tuo data warehouse e visualizzare gli oggetti del AWS Glue database catalogati utilizzando i seguenti comandi SQL:
-
SHOW: per visualizzare se
awsdatacatalog
è montato per il data warehouse attualmente connesso. Ad esempio, per mostrare il valore del parametrodata_catalog_auto_mount
, esegui:SHOW data_catalog_auto_mount;
Per ulteriori informazioni, consulta SHOW nella Guida per gli sviluppatori di database di Amazon Redshift.
-
ALTER SYSTEM: per modificare la configurazione a livello di sistema di
data_catalog_auto_mount
. Ad esempio, per modificare il valore del parametrodata_catalog_auto_mount
aon
, esegui:ALTER SYSTEM SET data_catalog_auto_mount = on;
La modifica ha effetto quando un cluster fornito viene riavviato o un gruppo di lavoro serverless viene automaticamente messo in pausa e ripreso. Per ulteriori informazioni, consulta ALTER SYSTEM nella Guida per gli sviluppatori di database di Amazon Redshift.
-
SHOW SCHEMAS: mostra un elenco di schemi. Gli schemi del database denominato
awsdatacatalog
rappresentano i AWS Glue database catalogati in. AWS Glue Data Catalog Ad esempio, per mostrare questi schemi, esegui:SHOW SCHEMAS FROM DATABASE awsdatacatalog;
Per ulteriori informazioni, consulta SHOW SCHEMAS nella Guida per gli sviluppatori di database di Amazon Redshift.
-
SHOW TABLES: mostra un elenco di tabelle in uno schema. Ad esempio, per mostrare le tabelle del AWS Glue Data Catalog database denominate
awsdatacatalog
presenti nello schemamyglue
, esegui:SHOW TABLES FROM SCHEMA awsdatacatalog.myschema;
Per ulteriori informazioni, consulta SHOW TABLES nella Guida per gli sviluppatori di database di Amazon Redshift.
-
SHOW COLUMNS: mostra un elenco di colonne in una tabella. Ad esempio, per mostrare le colonne del AWS Glue Data Catalog database denominate
awsdatacatalog
che si trovano nello schemamyglue
e nella tabellamytable
esegui:SHOW COLUMNS FROM TABLE awsdatacatalog.myglue.mytable;
Per ulteriori informazioni, consulta SHOW COLUMNS nella Guida per gli sviluppatori di database di Amazon Redshift.
Per concedere al tuo utente o ruolo IAM l'autorizzazione a interrogare il AWS Glue Data Catalog,
-
Nel riquadro della visualizzazione ad albero, connettiti al database iniziale nel cluster o nel gruppo di lavoro serverless utilizzando il metodo di autenticazione Nome utente e password del database. Ad esempio, connettiti al database
dev
utilizzando l'utente e la password dell'amministratore che hai usato quando hai creato il cluster o il gruppo di lavoro. -
In una scheda dell'editor, esegui l'istruzione SQL seguente per concedere a un utente IAM l'accesso a AWS Glue Data Catalog.
GRANT USAGE ON DATABASE awsdatacatalog to "
IAM:myIAMUser
"IAM:myIAMUser
Dov'è un utente IAM a cui desideri concedere i privilegi di utilizzo a. AWS Glue Data Catalog In alternativa, puoi concedere il privilegio di utilizzo aIAMR:myIAMRole
per un ruolo IAM. -
Nel riquadro della visualizzazione ad albero, modifica o elimina la connessione al cluster o al gruppo di lavoro che hai creato in precedenza. Collegati al cluster o al gruppo di lavoro in uno dei seguenti modi:
-
Per connetterti al database
awsdatacatalog
da un cluster, devi utilizzare il metodo di autenticazione Credenziali temporanee mediante l'identità IAM. Per ulteriori informazioni su questo metodo di autenticazione, consulta Connessione a un database Amazon Redshift. L'amministratore dell'editor di query v2 potrebbe dover configurare Impostazioni account per l'account per visualizzare questi metodi di autenticazione nella finestra di connessione. -
Per connetterti al database
awsdatacatalog
da un gruppo di lavoro, devi utilizzare il metodo di autenticazione Utente federato. Per ulteriori informazioni su questo metodo di autenticazione, consulta Connessione a un database Amazon Redshift.
-
-
Con il privilegio concesso, puoi usare l'identità IAM per eseguire SQL su AWS Glue Data Catalog.
Dopo il collegamento, puoi utilizzare l'editor di query v2 per eseguire query sui dati catalogati in AWS Glue Data Catalog. Nel riquadro della visualizzazione ad albero dell'editor di query v2, scegli il cluster o il gruppo di lavoro e il database awsdatacatalog
. Nel riquadro dell'editor o del notebook, verifica di aver selezionato il cluster o il gruppo di lavoro corretto. Il database scelto deve essere il database iniziale di Amazon Redshift, ad esempio dev
. Per informazioni sulla creazione di query, consulta Creazione di query con Amazon Redshift e Notebook in Amazon Redshift. Il database denominato awsdatacatalog
è riservato per fare riferimento al database del catalogo dati esterno del tuo account. Le query sul database awsdatacatalog
possono solo essere di sola lettura. Utilizza la notazione in tre parti per fare riferimento alla tabella nell'istruzione SELECT. Dove la prima parte è il nome del database, la seconda è il nome del AWS Glue database e la terza è il nome della AWS Glue tabella.
SELECT * FROM awsdatacatalog.<aws-glue-db-name
>.<aws-glue-table-name
>;
Puoi eseguire vari scenari che leggono i AWS Glue Data Catalog dati e popolano le tabelle Amazon Redshift.
L'esempio seguente SQL unisce due tabelle definite in. AWS Glue
SELECT pn.emp_id, alias, role, project_name
FROM "awsdatacatalog"."empl_db"."project_name_table" pn,
"awsdatacatalog"."empl_db"."project_alias_table" pa
WHERE pn.emp_id = pa.emp_id;
L'esempio seguente SQL crea una tabella Amazon Redshift e la popola con i dati provenienti da un'unione di due tabelle. AWS Glue
CREATE TABLE dev.public.glue AS
SELECT pn.emp_id, alias, role, project_name
FROM "awsdatacatalog"."empl_db"."project_name_table" pn,
"awsdatacatalog"."empl_db"."project_alias_table" pa
WHERE pn.emp_id = pa.emp_id;
Interrogazione delle tabelle Amazon S3 (anteprima)
Puoi utilizzare l'editor di query v2 per interrogare i dati contenuti nei cataloghi Amazon S3table montati su. AWS Glue Data Catalog I cataloghi di tabelle di Amazon S3 vengono montati al momento della AWS Glue Data Catalog creazione e vengono visualizzati automaticamente come database esterni su tutti i cluster e i gruppi di lavoro serverless distribuiti nello stesso account. Regione AWS Per ulteriori informazioni sull'accesso alle tabelle Amazon S3 con Amazon Redshift, consulta Accesso alle tabelle Amazon S3 con Amazon Redshift nella Guida per l'utente di Amazon Simple Storage Service.