Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Integre Amazon EMR con AWS Lake Formation
AWS Lake Formation es un servicio gestionado que le ayuda a descubrir, catalogar, limpiar y proteger los datos de un lago de datos de Amazon Simple Storage Service (S3). Lake Formation proporciona un acceso detallado a nivel de columnas a las bases de datos y tablas del catálogo de datos de Glue. AWS Para obtener más información, consulte ¿Qué es AWS Lake Formation?
Con la EMR versión 6.7.0 y posteriores de Amazon, puede aplicar un control de acceso basado en Lake Formation a los trabajos de Spark, Hive y Presto que envíe a los clústeres de Amazon. EMR Para integrarse con Lake Formation, debe crear un EMR clúster con una función de tiempo de ejecución. Un rol en tiempo de ejecución es un rol AWS Identity and Access Management (IAM) que se asocia a EMR trabajos o consultas de Amazon. EMRA continuación, Amazon utiliza este rol para acceder a AWS los recursos. Para obtener más información, consulte Funciones de tiempo de ejecución para Amazon EMR Steps.
Cómo EMR trabaja Amazon con Lake Formation
Tras integrar Amazon EMR con Lake Formation, puede ejecutar consultas a EMR los clústeres de Amazon con Step
APIo con SageMaker Studio. Luego, Lake Formation proporciona acceso a los datos a través de credenciales temporales para AmazonEMR. Este proceso se denomina “expedición de credenciales”. Para obtener más información, consulte ¿Qué es AWS Lake Formation?
La siguiente es una descripción general de alto nivel de cómo Amazon EMR obtiene acceso a los datos protegidos por las políticas de seguridad de Lake Formation.
-
Un usuario envía una EMR consulta de Amazon para obtener datos en Lake Formation.
-
Amazon EMR solicita credenciales temporales a Lake Formation para dar acceso a los datos del usuario.
-
Lake Formation devuelve credenciales temporales.
-
Amazon EMR envía la solicitud de consulta para recuperar datos de Amazon S3.
-
Amazon EMR recibe los datos de Amazon S3, los filtra y devuelve los resultados en función de los permisos de usuario que el usuario definió en Lake Formation.
Para obtener más información sobre cómo agregar usuarios y grupos a las políticas de Lake Formation, consulte Concesión de permisos para el catálogo de datos.
Requisitos previos
Debes cumplir los siguientes requisitos antes de integrar Amazon EMR y Lake Formation:
-
Activa la autorización de roles en tiempo de ejecución en tu EMR clúster de Amazon.
-
Utilice el catálogo de datos de AWS Glue como almacén de metadatos.
-
Defina y gestione los permisos en Lake Formation para acceder a las bases de datos, tablas y columnas de AWS Glue Data Catalog. Para obtener más información, consulte ¿Qué es AWS Lake Formation?