デプロイ済みの Hive メタストアコネクタを使用するように Athena を設定する - Amazon Athena

デプロイ済みの Hive メタストアコネクタを使用するように Athena を設定する

アカウントに AthenaHiveMetastoreFunction のような Lambda データソースコネクタをデプロイした後、その使用を Athena に設定します。これを行うには、Athena クエリで使用する外部 Hive メタストアを参照するためのデータソース名を作成します。

既存の Lambda 関数を使用して Athena を Hive メタストアに接続するには
  1. https://console.aws.amazon.com/athena/ で Athena コンソールを開きます。

  2. コンソールのナビゲーションペインが表示されない場合は、左側の展開メニューをクリックします。

    展開メニューを選択します。
  3. [Data sources] (データソース) を選択します。

  4. [Data sources] (データソース) タブで [Connect data source] (データソースを接続する) を選択します。

  5. [Choose a data source] (データソースの選択) ページの [Data sources] (データソース) で、[S3 - Apache Hive metastore] (S3 – Apache Hive メタストア) を選択します。

  6. [Next] を選択します。

  7. [Data source details] (データソースの詳細) セクションの [Data source name] (データソース名) に、Athena からデータソースをクエリする際に SQL ステートメントで使用する名前 (例えば MyHiveMetastore) を入力します。名前は最大 127 文字で、アカウント内で一意である必要があります。この設定は、作成後に変更することはできません。有効な文字は、a~z、A~Z、0~9、_ (アンダースコア)、@ (at マーク)、および - (ハイフン) です。awsdatacataloghivejmx、および system の名前は Athena によって予約されており、データソース名には使用できません。

  8. [接続の詳細] セクションで、[Lambda 関数を選択または入力] ボックスを使って、先ほど作成した関数の名前を選択します。Lambda 関数の ARN が表示されます。

  9. (オプション) [Tags] (タグ) でキーと値のペアを追加して、このデータソースに関連付けます。タグの詳細については、Athena リソースにタグ付けするを参照してください。

  10. [Next] を選択します。

  11. [Review and create] (確認と作成) ページで、データソースの詳細について確認し、[Add data source] (データソースの追加) を選択します。

  12. データソースのページの [データソースの詳細] セクションには、新しいコネクタに関する情報が表示されます。

    これで、指定した [Data source name] (データソース名) を使用して、Athena の SQL クエリで Hive メタストアを参照できるようになります。

    SQL クエリで次の構文例を使用する際には、ehms-catalog の部分を先に指定したデータソース名に置き換えます。

    SELECT * FROM ehms-catalog.CustomerData.customers
  13. 作成したデータソースを表示、編集、または削除するには、「データソースを管理する」を参照してください 。