Integrazione con altri servizi AWS - AWS Glue

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Integrazione con altri servizi AWS

Sebbene sia possibile utilizzare Crawler di AWS Glue s per compilarli AWS Glue Data Catalog, esistono diversi AWS servizi che possono integrarsi e popolare automaticamente nel catalogo. Le sezioni seguenti forniscono ulteriori informazioni sui casi d'uso specifici supportati dai AWS servizi che possono popolare il Data Catalog.

AWS Lake Formation

AWS Lake Formation è un servizio che semplifica la configurazione di un data lake sicuro. AWS Lake Formation è costruita su AWS Glue, e Lake Formation AWS Glue condividiamo la stessa cosa AWS Glue Data Catalog. Puoi registrare la tua posizione dati Amazon S3 con Lake Formation e utilizzare la console Lake Formation per creare database e tabelle nel AWS Glue Data Catalog, definire politiche di accesso ai dati e controllare l'accesso ai dati attraverso il tuo data lake da una posizione centrale. Puoi utilizzare il controllo granulare degli accessi di Lake Formation per gestire le risorse del Data Catalog esistenti e le posizioni dati Amazon S3.

Con i dati registrati con Lake Formation, puoi condividere in sicurezza le risorse del Data Catalog tra responsabili, AWS account, AWS organizzazioni e unità organizzative IAM.

Per ulteriori informazioni sulla creazione di risorse Data Catalog utilizzando Lake Formation, consulta Creating Data Catalog tables and database nella AWS Lake Formation Developer Guide.

Amazon Athena

Amazon Athena utilizza il Data Catalog per archiviare e recuperare i metadati delle tabelle per i dati Amazon S3 nel tuo account. AWS I metadati della tabella consentono al motore di query Athena di sapere come trovare, leggere ed elaborare i dati che si desidera interrogare.

È possibile compilare il file AWS Glue Data Catalog utilizzando direttamente le istruzioni CREATE TABLE Athena. È possibile definire e compilare manualmente lo schema e i metadati delle partizioni nel Data Catalog senza dover eseguire un crawler.

  1. Nella console Athena, crea un database che memorizzerà i metadati della tabella nel Data Catalog.

  2. Usa l'CREATE EXTERNAL TABLEistruzione per definire lo schema della tua fonte di dati.

  3. Utilizzate la PARTITIONED BY clausola per definire eventuali chiavi di partizione se i dati sono partizionati.

  4. Utilizza la LOCATION clausola per specificare il percorso Amazon S3 in cui vengono archiviati i tuoi file di dati effettivi.

  5. Eseguire l’istruzione CREATE TABLE.

    Questa query crea i metadati della tabella nel Data Catalog in base allo schema e alle partizioni definiti, senza eseguire effettivamente la scansione dei dati.

Puoi interrogare la tabella in Athena, che utilizzerà i metadati del Data Catalog per accedere e interrogare i tuoi file di dati in Amazon S3.

Per ulteriori informazioni, consulta Creazione di database e tabelle nella Guida per l'utente di Amazon Athena.