Apache Hive プラグイン - Amazon EMR

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

Apache Hive プラグイン

Apache Hive は Hadoop エコシステム内の普及している実行エンジンです。Amazon EMRは、Hive にきめ細かなアクセスコントロールを提供できるように Apache Ranger プラグインを提供しています。このプラグインはオープンソースの Apache Ranger 管理サーバーバージョン 2.0 以降と互換性があります。

サポートされている機能

の Hive 用 Apache Ranger プラグインは、データベース、テーブル、列レベルのアクセスコントロール、行フィルタリング、データマスキングなど、オープンソースプラグインのすべての機能EMRをサポートしています。Hive コマンドおよび関連する Ranger アクセス許可の表については、「Hive commands to Ranger permission mapping」を参照してください。

サービス設定のインストール

Apache Hive プラグインは、Apache Hive Hadoop 内の既存の Hive サービス定義と互換性がありますSQL。

Hadoop の Apache Hive サービス定義SQL。

上記のようにSQL、Hadoop の下にサービスのインスタンスがない場合は、インスタンスを作成できます。Hadoop の横にある をクリックしますSQL。

  1. [Service Name] (サービス名): これが表示されている場合は、サービス名を入力します。推奨値は amazonemrhive です。このサービス名を書き留めておきます。これはEMRセキュリティ設定を作成するときに必要です。

  2. [Display Name] (表示名): サービスに対して表示する名前を入力します。推奨値は amazonemrhive です。

Hadoop の Apache Hive サービスの詳細SQL。

Apache Hive Config プロパティは、ポリシーの作成時に自動完了を実装する HiveServer2 で Apache Ranger 管理サーバーへの接続を確立するために使用されます。永続的な HiveServer2 プロセスがなく、情報を入力できる場合、以下のプロパティは正確である必要はありません。

  • ユーザー名: HiveServer2 つのインスタンスのインスタンスJDBCへの接続用のユーザー名を入力します。

  • [Password] (パスワード): 上記のユーザー名のパスワードを入力します。

  • jdbc.driver.ClassName: Apache Hive 接続のJDBCクラスのクラス名を入力します。デフォルト値を使用できます。

  • jdbc.url : HiveServer2 に接続するときに使用する接続JDBC文字列を入力します。

  • [Common Name for Certificate] (証明書の共通名): クライアントプラグインから管理サーバーに接続するために使用する証明書内の CN フィールド。この値は、プラグイン用に作成されたTLS証明書の CN フィールドと一致する必要があります。

Apache Hive サービス設定プロパティ。

テスト接続ボタンは、上記の値を使用して HiveServer2 つのインスタンスに正常に接続できるかどうかをテストします。サービスが正常に作成されると、サービスマネージャは以下のようになります。

HiveServer2 つのインスタンスに接続

考慮事項

Hive メタデータサーバー

Hive メタデータサーバーには、不正アクセスから保護するために、信頼されたエンジン (具体的には Hive および emr_record_server) からしかアクセスできません。また、Hive メタデータサーバーには、クラスター上のすべてのノードからもアクセスできます。ポート 9083 は必須で、メインノードへのすべてのノードアクセスを提供します。

認証

デフォルトでは、Apache Hive は、EMRセキュリティ設定で設定された Kerberos を使用して認証するように設定されています。 HiveServer2 は、 を使用してユーザーLDAPを認証するように設定できます。詳細については、「マルチテナント Amazon EMRクラスターでの Hive のLDAP認証の実装」を参照してください。

制限事項

Amazon 5.x の Apache Hive EMR プラグインの現在の制限事項は次のとおりです。

  • Hive ロールは、現在サポートされていません。Grant、Revoke ステートメントはサポートされていません。

  • Hive CLIはサポートされていません。JDBC/Beeline は、Hive を接続する唯一の認可された方法です。

  • hive.server2.builtin.udf.blacklist 設定には、安全でないUDFsと思われる を入力する必要があります。