Integra Amazon EMR con AWS Lake Formation - Amazon EMR

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Integra Amazon EMR con AWS Lake Formation

AWS Lake Formation è un servizio gestito che ti aiuta a scoprire, catalogare, pulire e proteggere i dati in un data lake Amazon Simple Storage Service (S3). Lake Formation fornisce un accesso granulare a livello di colonna a database e tabelle nel Glue Data Catalog. AWS Per ulteriori informazioni, consulta What is AWS Lake Formation?

Con la EMR versione 6.7.0 e successive di Amazon, puoi applicare il controllo degli accessi basato su Lake Formation ai job Spark, Hive e Presto che invii ai cluster Amazon. EMR Per l'integrazione con Lake Formation, devi creare un EMR cluster con un ruolo di runtime. Un ruolo di runtime è un ruolo AWS Identity and Access Management (IAM) che associ ai EMR job o alle query di Amazon. Amazon utilizza EMR quindi questo ruolo per accedere alle AWS risorse. Per ulteriori informazioni, consulta Ruoli di runtime per Amazon EMR Steps.

Come EMR funziona Amazon con Lake Formation

Dopo aver integrato Amazon EMR con Lake Formation, puoi eseguire query EMR sui cluster Amazon con StepAPIo con SageMaker Studio. Quindi, Lake Formation fornisce l'accesso ai dati tramite credenziali temporanee per AmazonEMR. Questo processo è denominato distribuzione di credenziali. Per ulteriori informazioni, consulta What is AWS Lake Formation?

Di seguito è riportata una panoramica di alto livello su come Amazon EMR ottiene l'accesso ai dati protetti dalle politiche di sicurezza di Lake Formation.

In che modo Amazon EMR accede ai dati protetti dalle politiche di sicurezza di Lake Formation
  1. Un utente invia una EMR richiesta Amazon per i dati in Lake Formation.

  2. Amazon EMR richiede credenziali temporanee a Lake Formation per consentire all'utente l'accesso ai dati.

  3. Lake Formation restituisce le credenziali temporanee.

  4. Amazon EMR invia la richiesta di query per recuperare dati da Amazon S3.

  5. Amazon EMR riceve i dati da Amazon S3, li filtra e restituisce i risultati in base alle autorizzazioni utente definite dall'utente in Lake Formation.

Per ulteriori informazioni sull'aggiunta di utenti e gruppi ai policy di Lake Formation, consulta Concessione delle autorizzazioni Data Catalog.

Prerequisiti

È necessario soddisfare i seguenti requisiti prima di integrare Amazon EMR and Lake Formation:

  • Attiva l'autorizzazione del ruolo di runtime sul tuo EMR cluster Amazon.

  • Usa il AWS Glue Data Catalog come archivio di metadati.

  • Definisci e gestisci le autorizzazioni in Lake Formation per accedere a database, tabelle e colonne in AWS Glue Data Catalog. Per ulteriori informazioni, consulta What is AWS Lake Formation?