Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Integre Amazon EMR con AWS Lake Formation
AWS Lake Formation es un servicio gestionado que le ayuda a descubrir, catalogar, limpiar y proteger los datos de un lago de datos de Amazon Simple Storage Service (S3). Lake Formation proporciona un acceso detallado a nivel de columnas a las bases de datos y tablas del catálogo de datos de Glue. AWS Para obtener más información, consulte ¿Qué es AWS Lake Formation?
Con las versiones 6.7.0 y posteriores de Amazon EMR, puede aplicar un control de acceso basado en Lake Formation a los trabajos de Spark, Hive y Presto que envíe a los clústeres de Amazon EMR. Para integrar con Lake Formation, debe crear un clúster de EMR con un rol en tiempo de ejecución. Un rol en tiempo de ejecución es un rol de AWS Identity and Access Management (IAM) que se asocia a los trabajos o consultas de Amazon EMR. A continuación, Amazon EMR utiliza esta función para acceder AWS a los recursos. Para obtener más información, consulte Roles en tiempo de ejecución para los pasos de Amazon EMR.
Cómo funciona Amazon EMR con Lake Formation
Tras integrar Amazon EMR con Lake Formation, puede ejecutar consultas a los clústeres de Amazon EMR con la Step
API o con AI Studio. SageMaker Luego, Lake Formation proporciona acceso a los datos a través de credenciales temporales para Amazon EMR. Este proceso se denomina “expedición de credenciales”. Para obtener más información, consulte ¿Qué es AWS Lake Formation?
A continuación, se ofrece una descripción general de alto nivel sobre cómo Amazon EMR obtiene acceso a los datos protegidos por las políticas de seguridad de Lake Formation.

-
Un usuario envía una solicitud de datos de Amazon EMR en Lake Formation.
-
Amazon EMR solicita credenciales temporales a Lake Formation para permitir que el usuario acceda a los datos.
-
Lake Formation devuelve credenciales temporales.
-
Amazon EMR envía la solicitud de consulta para obtener datos de Amazon S3.
-
Amazon EMR recibe los datos de Amazon S3, los filtra y devuelve los resultados en función de los permisos de usuario que el usuario definió en Lake Formation.
Para obtener más información sobre cómo agregar usuarios y grupos a las políticas de Lake Formation, consulte Concesión de permisos para el catálogo de datos.
Requisitos previos
Si desea integrar Amazon EMR y Lake Formation, debe cumplir los siguientes requisitos:
-
Active la autorización de roles en tiempo de ejecución en el clúster de Amazon EMR.
-
Utilice el catálogo de datos de AWS Glue como almacén de metadatos.
-
Defina y gestione los permisos en Lake Formation para acceder a las bases de datos, tablas y columnas de AWS Glue Data Catalog. Para obtener más información, consulte ¿Qué es AWS Lake Formation?