翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
データカタログを外部 Hive メタストアに接続する
AWS Glue Data Catalog を Hive メタストアに接続するには、GlueDataCatalogFederation-HiveMetastore
AWS SAM アプリケーションは、Lambda 関数を使用して Amazon API Gateway の背後にある Hive メタストアの接続を作成します。 AWS SAM アプリケーションは、ユーザーからの入力としてユニフォームリソース識別子 (URI) を使用し、外部の Hive メタストアを Data Catalog に接続します。ユーザーが Hive テーブルに対してクエリを実行すると、Data Catalog は API Gateway エンドポイントを呼び出します。エンドポイントは Lambda 関数を呼び出して、Hive テーブルのメタデータを取得します。
データカタログを Hive メタストアに接続してアクセス許可を設定するには
-
AWS SAM アプリケーションをデプロイします。
にサインイン AWS Management Console し、 を開きます AWS Serverless Application Repository。
ナビゲーションペインで、[Available applications] (利用可能なアプリケーション) を選択します。
-
[パブリックアプリケーション] を選択します。
[Show apps that create custom roles or resource policies] (カスタム IAM ロールまたはリソースポリシーを作成するアプリを表示する) オプションを選択します。
検索ボックスに、名前 GlueDataCatalogFederation-HiveMetastore を入力します。
-
GlueDataCatalogFederation-HiveMetastore アプリケーションを選択します。
-
[アプリケーション設定] で、Lambda 関数に最低限必要な次の設定を入力します。
アプリケーション名 - AWS SAM アプリケーションの名前。
GlueConnectionName - 接続の名前。
HiveMetastoreURIs- Hive メタストアホストの URI。
-
LambdaMemory - 128-10240 からの MB 単位の Lambda メモリの量。デフォルトは 1024 です。
LambdaTimeout - 秒単位の最大 Lambda 呼び出しランタイム。デフォルトは 30 です。
VPCSecurityGroupIds と VPCSubnetIds - Hive メタストアが存在する VPC の情報。
[I acknowledge that this app creates custom IAM roles and resource policies] (このアプリがカスタム IAM ロールとリソースポリシーを作成することを承認します) を選択します。詳細については、[Info] (情報) リンクを選択してください。
[Application settings] (アプリケーションの設定) セクションの右下で [Deploy] (デプロイ) を選択します。デプロイが完了すると、Lambda 関数が Lambda コンソールの [リソース] セクションに表示されます。
アプリケーションは Lambda にデプロイされます。その名前の前に serverlessrepo- が付加され、アプリケーションが からデプロイされたことを示します AWS Serverless Application Repository。アプリケーションを選択すると、デプロイされたアプリケーションの各リソースが一覧表示される [リソース] ページに移動します。リソースには、Data Catalog と Hive メタストア間の通信を許可する Lambda 関数、 AWS Glue 接続、およびデータベースフェデレーションに必要なその他のリソースが含まれます。
-
データカタログでフェデレーションデータベースを作成する
Hive メタストアへの接続を作成したら、外部の Hive メタストアデータベースを指すフェデレーティッドデータベースを Data Catalog に作成できます。Data Catalog に接続するすべての Hive メタストアデータベースに対応するデータベースを Data Catalog に作成する必要があります。
-
フェデレーションデータベース内のテーブルを表示します。
フェデレーションデータベースを作成したら、Lake Formation コンソールまたは AWS CLIを使用して Hive メタストア内のテーブルのリストを表示できます。
-
アクセス許可を付与します。
データベースを作成したら、アカウント内の他の IAM ユーザーとロール、または外部 AWS アカウント と組織に許可を付与できます。フェデレーティッドデータベースに対して、書き込みデータ許可 (挿入、削除) とメタデータ許可 (変更、削除、作成) を付与することはできません。許可の付与の詳細については、「Lake Formation 許可の管理」を参照してください。
-
フェデレーションデータベースのクエリ
アクセス許可の付与後、ユーザーは Athena および Amazon Redshift を使用してサインインし、フェデレーションデータベースへのクエリを開始できます。これで、ユーザーはローカルデータベース名を使用して SQL クエリで Hive データベースを参照できるようになります。
Amazon Athena クエリ構文の例
を、前に作成したローカルデータベース名
fed_glue_db
に置き換えます。Select * from fed_glue_db.customers limit 10;