将 Amazon EMR 与 Apache Ranger 集成
从 Amazon EMR 5.32.0 开始,您可以启动与 Apache Ranger 在本地集成的集群。Apache Ranger 是一个开源框架,可跨 Hadoop 平台启用、监控和管理全面的数据安全。有关更多信息,请参阅 Apache Ranger
此部分从概念上简要介绍了 Amazon EMR 与 Apache Ranger 的集成。它还包含启动与 Apache Ranger 集成的 Amazon EMR 集群所需的先决条件和步骤。
将 Amazon EMR 与 Apache Ranger 集成提供了下列主要优势:
-
对 Hive 元存储数据库和表的精细访问控制,使您能够为 Apache Spark 和 Apache Hive 应用程序在数据库、表和列级别定义数据筛选策略。Hive 应用程序支持行级过滤和数据屏蔽。
-
能够将您现有的 Hive 策略直接用于 Hive 应用程序的 Amazon EMR。
-
在前缀和对象级别对 Amazon S3 数据进行访问控制,这使您能够定义数据筛选策略以使用 EMR 文件系统访问 S3 数据。
-
能够使用 CloudWatch Logs 进行集中审计。
-
Amazon EMR 代表您安装和管理 Apache Ranger 插件。