Amazon EMR と Apache Ranger を統合する - Amazon EMR

Amazon EMR と Apache Ranger を統合する

Amazon EMR 5.32.0 以降では、Apache Ranger とネイティブに統合されるクラスターを起動できます。Apache Ranger は、Hadoop プラットフォーム全体で包括的なデータセキュリティを有効化、監視、管理するためのオープンソースフレームワークです。詳細については、「Apache Ranger」を参照してください。ネイティブ統合により、独自の Apache Ranger を導入して、Amazon EMR できめ細かなデータアクセス制御を実施できます。

このセクションでは、Amazon EMR と Apache Ranger の統合の概念的な概要を示します。また、Apache Ranger と統合された Amazon EMR クラスターを起動するために必要な前提条件と手順も示します。

Amazon EMR と Apache Ranger のネイティブ統合には、次の主な利点があります。

  • Hive Metastore データベースおよびテーブルへのきめ細かなアクセスコントロール。これにより、Apache Spark および Apache Hive アプリケーションにおいてデータベース、テーブル、列のレベルでデータフィルタリングポリシーを定義できます。行レベルのフィルタリングとデータマスキングは、Hive アプリケーションでサポートされています。

  • Hive アプリケーション用に Amazon EMR で既存の Hive ポリシーを直接使用する機能。

  • プレフィックスおよびオブジェクトレベルでの Amazon S3 データへのアクセスコントロール。これにより、EMR ファイルシステムを使用して S3 データにアクセスするためのデータフィルタリングポリシーを定義できます。

  • CloudWatch Logs を使用して一元的な監査を行う機能。

  • Amazon EMR はユーザーに代わって Apache Ranger プラグインをインストールおよび管理します。