Redshift Spectrum e AWS Lake Formation - Amazon Redshift

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Redshift Spectrum e AWS Lake Formation

Questo argomento descrive come utilizzare Redshift Spectrum con Lake Formation. Lake Formation è un servizio per la condivisione di dati analitici.

Puoi utilizzarlo AWS Lake Formation per definire e applicare centralmente policy di accesso a livello di database, tabelle e colonne ai dati archiviati in Amazon S3. Dopo aver registrato i dati con AWS Glue Data Catalog abilitato con Lake Formation, è possibile eseguire query utilizzando diversi servizi, incluso Redshift Spectrum.

Lake Formation offre la sicurezza e la governance del catalogo di dati. All'interno di Lake Formation, è possibile concedere e revocare le autorizzazioni per gli oggetti del catalogo di dati, come database, tabelle, colonne e archiviazione Amazon S3 sottostante.

Importante

È possibile utilizzare Redshift Spectrum con un catalogo dati abilitato per Lake Formation solo AWS nelle regioni in cui è disponibile Lake Formation. Per l'elenco delle regioni disponibili, consulta Endpoint e quote di AWS Lake Formation in Riferimenti generali di AWS.

Utilizzando Redshift Spectrum con Lake Formation, è possibile effettuare le seguenti operazioni:

  • Utilizzare Lake Formation come luogo centralizzato in cui concedere e revocare le autorizzazioni e accedere alle policy di controllo su tutti i dati del data lake. Lake Formation offre una gerarchia alle autorizzazioni per controllare l'accesso a database e tabelle in un catalogo di dati. Per ulteriori informazioni, consulta la pagina relativa alla panoramica delle autorizzazioni di Lake Formation nella Guida per gli sviluppatori di AWS Lake Formation .

  • Crea tabelle esterne ed esegui query sui dati nel data lake. Prima che gli utenti nell'account possano eseguire le query, un amministratore dell'account data lake registra i percorsi Amazon S3 esistenti contenenti dati di origine con Lake Formation. L'amministratore crea anche tabelle e concede le autorizzazioni ai tuoi utenti. L'accesso può essere concesso per database, tabelle o colonne. L'amministratore può utilizzare i filtri di dati in Lake Formation per garantire un controllo granulare dell'accesso ai dati sensibili memorizzati in Amazon S3. Per ulteriori informazioni, consulta Utilizzo di filtri di dati per la sicurezza a livello di riga e cella.

    Dopo che i dati sono stati registrati nel catalogo dati, ogni volta che gli utenti provano a eseguire le query, Lake Formation verifica l'accesso alla tabella per quel principal specifico. Lake Formation fornisce credenziali temporanee a Redshift Spectrum e la query viene eseguita.

  • Esegui le query Redshift Spectrum su un dispositivo montato automaticamente AWS Glue Data Catalog utilizzando credenziali IAM ottenute con o GetCredentials e GetClusterCredentials gestisci le autorizzazioni Lake Formation per utente del database (iamr:UserName o IAM:UserName).

Quando si utilizza Redshift Spectrum con un catalogo di dati abilitato per Lake Formation, deve essere soddisfatta una delle seguenti condizioni:

Importante

Non è possibile collegare i ruoli IAM quando si utilizza Redshift Spectrum con un catalogo di dati abilitato per Lake Formation.

Per ulteriori informazioni sui passaggi necessari per la configurazione AWS Lake Formation per l'utilizzo con Redshift Spectrum, consulta Tutorial: Creazione di un data lake da una sorgente JDBC in Lake Formation nella Developer Guide.AWS Lake Formation In particolare, consulta Esecuzione di query sui dati nel data lake utilizzando Amazon Redshift Spectrum per i dettagli sull'integrazione con Redshift Spectrum. I dati e AWS le risorse utilizzati in questo argomento dipendono dai passaggi precedenti del tutorial.

Utilizzo di filtri di dati per la sicurezza a livello di riga e cella

Puoi definire filtri di dati AWS Lake Formation per controllare l'accesso delle tue query Redshift Spectrum a livello di riga e cella ai dati definiti nel tuo Data Catalog. Per configurare questo controllo, eseguirai le seguenti attività:

  • Creazione di un filtro di dati in Lake Formation con le seguenti informazioni:

    • Una specifica di colonna con un elenco di colonne da includere o escludere dai risultati della query.

    • Un'espressione di filtro di riga che specifica le righe da includere nei risultati della query.

    Per ulteriori informazioni su come creare un filtro di dati, consulta Filtri di dati in Lake Formation nella Guida per gli sviluppatori di AWS Lake Formation .

  • Creazione di una tabella esterna in Amazon Redshift che faccia riferimento a una tabella nel tuo catalogo dati abilitato per Lake Formation. Per dettagli su come eseguire query su una tabella di Lake Formation utilizzando Redshift Spectrum, consulta Esecuzione di query sui dati nel data lake utilizzando Amazon Redshift Spectrum nella Guida per gli sviluppatori di AWS Lake Formation .

Dopo aver definito la tabella in Amazon Redshift, puoi eseguire query sulla tabella di Lake Formation e accedere solo alle righe e alle colonne consentite dal filtro di dati.

Per una guida dettagliata su come configurare la sicurezza a livello di riga e di cella in Lake Formation e quindi eseguire query mediante Redshift Spectrum, consulta la pagina relativa all'utilizzo di Amazon Redshift Spectrum con policy di sicurezza a livello di riga e di cella definite in AWS Lake Formation.