Amazon EMR と Apache Ranger を統合する
Amazon EMR 5.32.0 以降では、Apache Ranger とネイティブに統合されるクラスターを起動できます。Apache Ranger は、Hadoop プラットフォーム全体で包括的なデータセキュリティを有効化、監視、管理するためのオープンソースフレームワークです。詳細については、「Apache Ranger
このセクションでは、Amazon EMR と Apache Ranger の統合の概念的な概要を示します。また、Apache Ranger と統合された Amazon EMR クラスターを起動するために必要な前提条件と手順も示します。
Amazon EMR と Apache Ranger のネイティブ統合には、次の主な利点があります。
-
Hive Metastore データベースおよびテーブルへのきめ細かなアクセスコントロール。これにより、Apache Spark および Apache Hive アプリケーションにおいてデータベース、テーブル、列のレベルでデータフィルタリングポリシーを定義できます。行レベルのフィルタリングとデータマスキングは、Hive アプリケーションでサポートされています。
-
Hive アプリケーション用に Amazon EMR で既存の Hive ポリシーを直接使用する機能。
-
プレフィックスおよびオブジェクトレベルでの Amazon S3 データへのアクセスコントロール。これにより、EMR ファイルシステムを使用して S3 データにアクセスするためのデータフィルタリングポリシーを定義できます。
-
CloudWatch Logs を使用して一元的な監査を行う機能。
-
Amazon EMR はユーザーに代わって Apache Ranger プラグインをインストールおよび管理します。