AWS Glue Data Catalog をクエリする - Amazon Athena

AWS Glue Data Catalog をクエリする

AWS Glue Data Catalog は多くの AWS サービス で中央メタデータリポジトリとして使用されるため、データカタログメタデータのクエリが必要になる場合があります。これを実行するには、Athena で SQL クエリを使用できます。Athena を使用して、データベース、テーブル、パーティション、および列などの AWS Glue カタログメタデータをクエリできます。

AWS Glue カタログのメタデータを取得するには、Athena バックエンドで information_schema データベースをクエリします。このトピックのクエリ例は、一般的なユースケースのために Athena を使用して AWS Glue カタログメタデータをクエリする方法を示しています。

考慮事項と制約事項

  • information_schema データベースをクエリする代わりに、個別の Apache Hive DDL コマンドを使用して、Athena から特定のデータベース、テーブル、ビュー、パーティション、および列のメタデータ情報を抽出することができます。ただし、出力は表形式になりません。

  • information_schema のクエリのパフォーマンスは、AWS Glue メタデータの量が少ない、または中程度である場合に最も高くなります。大量のメタデータがある場合は、エラーが発生する可能性があります。

  • CREATE VIEW を使用して information_schema データベース上にビューを作成することはできません。