Utilizzo AWS Lake Formation con Amazon Athena - AWS Lake Formation

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Utilizzo AWS Lake Formation con Amazon Athena

Amazon Athena è un servizio di query senza server che ti aiuta ad analizzare dati strutturati, semistrutturati e non strutturati archiviati in Amazon S3. È possibile utilizzare Athena SQL per interrogare i dati dai formati di dati CSVJSON, Parquet e Avro. Athena supporta SQL anche formati di tabella come Apache Hive, ApacheHudi e Apache Iceberg. Athena si integra con l' AWS Glue Data Catalog archiviazione dei metadati dei tuoi set di dati in Amazon S3. Athena può utilizzare Lake Formation per definire e mantenere le politiche di controllo degli accessi su tali set di dati.

Ecco alcuni casi d'uso comuni in cui è possibile utilizzare Lake Formation con Athena.

  • Utilizza le autorizzazioni di Lake Formation per accedere alle risorse del Data Catalog (database e tabelle) da Athena. È possibile utilizzare il metodo della risorsa denominata o LF-Tags per definire le autorizzazioni su database e tabelle. Per ulteriori informazioni, consultare:

    Nota

    Le autorizzazioni di Lake Formation si applicano solo quando si utilizza SQL Athena per interrogare i dati di origine da Amazon S3 e i metadati nel Data Catalog.

    Athena Spark non supporta l'interrogazione delle tabelle del Data Catalog con autorizzazioni Lake Formation. Le autorizzazioni di Lake Formation supportano operazioni di lettura e scrittura su database e tabelle.

    Nota

    Non puoi applicare filtri di dati quando usi LF-Tags per gestire le autorizzazioni sulle risorse di Data Catalog.

  • Controlla i risultati delle query utilizzando Filtri di dati in Lake Formation per proteggere le tabelle nei tuoi data lake Amazon S3 concedendo autorizzazioni a livello di colonna, riga e cella. Consulta la limitazione alla proiezione delle partizioni nella Guida per l'utente di Amazon Athena.

  • Applica un controllo granulare degli accessi sui dati disponibili per l'utente Athena basato su SAML Athena durante l'esecuzione di query federate.

    Athena JDBC e ODBC i driver supportano la configurazione dell'accesso federato all'origine dati utilizzando un Identity Provider (IdP) SAML basato. Usa Amazon QuickSight integrato con Lake Formation con il tuo IAM ruolo, SAML gli utenti o i gruppi esistenti per visualizzare i risultati delle query di Athena.

    Nota

    Le autorizzazioni di Lake Formation per SAML utenti e gruppi verranno applicate solo quando invii domande ad Athena utilizzando il driver or. JDBC ODBC

    Per ulteriori informazioni, consulta Using Lake Formation and the Athena JDBC and ODBC drivers for federated access to Athena.

    Nota

    Attualmente, l'autorizzazione dell'accesso alle SAML identità in Lake Formation non è supportata nelle seguenti regioni:

    • Medio Oriente (Bahrein) - me-south-1

    • Asia Pacifico (Hong Kong) - ap-east-1

    • Africa (Città del Capo) - af-south-1

    • Cina (Ningxia) - cn-nordovest-1

    • Asia Pacifico (Osaka) - ap-northeast-3

  • Si usa Condivisione dei dati tra account in Lake Formation per interrogare le tabelle in un altro account.

Nota

Per ulteriori informazioni sulle limitazioni relative all'utilizzo delle autorizzazioni di Lake Formation perViews, consulta Considerazioni e limitazioni.

Support per i formati di tabelle transazionali

L'applicazione delle autorizzazioni Lake Formation consente di proteggere i dati transazionali nei data lake basati su Amazon S3. La tabella seguente elenca i formati di tabelle transazionali supportati nelle autorizzazioni Athena e Lake Formation. Lake Formation applica queste autorizzazioni quando gli utenti di Athena eseguono le loro query.

Formato della tabella Descrizione e operazioni consentite Autorizzazioni Lake Formation supportate in Athena

Apache Hudi

Un formato utilizzato per semplificare l'elaborazione incrementale dei dati e lo sviluppo di pipeline di dati.

Athena supporta operazioni di creazione e lettura utilizzando i formati di tabella Apache Hudi su set di dati Amazon S3 per i tipi di tabella Hudi Copy on Write (CoW) e Merge On Read (MoR). Athena non supporta le operazioni di scrittura sulle tabelle Hudi.

Usa Athena per interrogare i set di dati Hudi.

Utilizzalo Filtraggio dei dati e sicurezza a livello di cella in Lake Formation per proteggere la tabella Hudi utilizzando le autorizzazioni a livello di tabella, colonna, riga e cella.

Apache Iceberg

Un formato di tabella aperta che gestisce grandi raccolte di file sotto forma di tabelle e supporta le moderne operazioni analitiche dei data lake come l'inserimento, l'aggiornamento, l'eliminazione e le query sui viaggi nel tempo a livello di record.

Per ulteriori informazioni sul supporto di Athena per le tabelle Iceberg, vedere Utilizzo delle tabelle Iceberg.

Sono supportate le autorizzazioni a livello di tabella, colonna, riga e cella. Attualmente, Lake Formation non supporta la gestione delle autorizzazioni su operazioni di scrittura come VACUUM UPDATE e OPTIMIZE sulle tabelle in Open Table Formats. MERGE

Linux Foundation Delta Lake

Delta Lake è un progetto open source che aiuta a implementare moderne architetture di data lake comunemente costruite su Amazon S3 o Hadoop Distributed File System (). HDFS

Athena supporta le tabelle Delta Lake create utilizzando una definizione di tabella manifest basata su symlink a AWS Glue Data Catalog partire da una tabella Delta Lake.

Per ulteriori informazioni, consulta Scansionare le tabelle Delta Lake utilizzando i crawler. AWS Glue

Athena (versione 3 del motore) supporta la lettura delle tabelle native di Delta Lake.

Per ulteriori informazioni, consulta Introduzione al supporto tabellare nativo di Delta Lake con i AWS Glue crawler.

Le autorizzazioni a livello di tabella, colonna, riga e cella sono supportate per le tabelle symlink e le tabelle native di Delta Lake.

Risorse aggiuntive