データカタログを Hive メタストアに接続するための前提条件 - AWS Lake Formation

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

データカタログを Hive メタストアに接続するための前提条件

AWS Glue Data Catalog を外部の Apache Hive メタストアに接続してデータアクセス許可を設定するには、次の要件を満たす必要があります。

注記

Lake Formation 管理者が AWS SAM アプリケーションをデプロイし、特権ユーザーのみが Hive メタストア接続を使用して対応するフェデレーションデータベースを作成することをお勧めします。

  1. IAM ロールを作成します。
    AWS SAM アプリケーションをデプロイするには
    • Hive メタストアへの接続の作成に必要なリソース (Lambda 関数、 Amazon API Gateway、IAM ロール、および AWS Glue 接続) をデプロイするために必要なアクセス許可を持つロールを作成します。

    フェデレーションデータベースを作成するには

    リソースには次のアクセス許可が必要です。

    • glue:CreateDatabase on resource arn:aws:glue:region:account-id:database/gluedatabasename

    • glue:PassConnection on resource arn:aws:glue:region:account-id:connection/hms_connection

  2. Amazon S3 ロケーションを Lake Formation に登録します。

    Lake Formation を使用してデータレイク内のデータを管理および保護するには、Hive メタストアのテーブルのデータを含む Amazon S3 ロケーションを Lake Formation に登録する必要があります。これにより、Lake Formation は Athena、Redshift Spectrum、Amazon EMR などの AWS 分析サービスに認証情報を提供できます。

    Amazon S3 ロケーションの登録の詳細については「データレイクへの Amazon S3 ロケーションの追加」を参照してください。

    Amazon S3 ロケーションを登録するときは、データカタログフェデレーションを有効にするチェックボックスをオンにして、Lake Formation がフェデレーションデータベース内のテーブルにアクセスするためのロールを引き受けることを許可します。

    Register location form for AWS Lake Formation with Amazon S3 path and IAM role options.

    データロケーションに Lake Formation を登録する方法の詳細については、「データレイク用の Amazon S3 ロケーションを設定する」を参照してください。

  3. 正しい Amazon EMR バージョンを使用してください。

    フェデレーティッド Hive メタストアデータベースで Amazon EMR を使用するには、Hive バージョン 3.x 以降および Amazon EMR バージョン 6.x 以降が必要です。