将 Amazon EMR 与 Apache Ranger 集成 - Amazon EMR

将 Amazon EMR 与 Apache Ranger 集成

从 Amazon EMR 5.32.0 开始,您可以启动与 Apache Ranger 在本地集成的集群。Apache Ranger 是一个开源框架,可跨 Hadoop 平台启用、监控和管理全面的数据安全。有关更多信息,请参阅 Apache Ranger。通过本机集成,您可以自带 Apache Ranger,在 Amazon EMR 上强制实施精细数据访问控制。

此部分从概念上简要介绍了 Amazon EMR 与 Apache Ranger 的集成。它还包含启动与 Apache Ranger 集成的 Amazon EMR 集群所需的先决条件和步骤。

将 Amazon EMR 与 Apache Ranger 集成提供了下列主要优势:

  • 对 Hive 元存储数据库和表的精细访问控制,使您能够为 Apache Spark 和 Apache Hive 应用程序在数据库、表和列级别定义数据筛选策略。Hive 应用程序支持行级过滤和数据屏蔽。

  • 能够将您现有的 Hive 策略直接用于 Hive 应用程序的 Amazon EMR。

  • 在前缀和对象级别对 Amazon S3 数据进行访问控制,这使您能够定义数据筛选策略以使用 EMR 文件系统访问 S3 数据。

  • 能够使用 CloudWatch Logs 进行集中审计。

  • Amazon EMR 代表您安装和管理 Apache Ranger 插件。