AWS Glue Data Catalog をクエリする
AWS Glue Data Catalog は多くの AWS のサービス で中央メタデータリポジトリとして使用されるため、データカタログメタデータのクエリが必要になる場合があります。これを実行するには、Athena で SQL クエリを使用できます。Athena を使用して、データベース、テーブル、パーティション、および列などの AWS Glue カタログメタデータをクエリできます。
AWS Glue カタログのメタデータを取得するには、Athena バックエンドで information_schema
データベースをクエリします。このトピックのクエリ例は、一般的なユースケースのために Athena を使用して AWS Glue カタログメタデータをクエリする方法を示しています。
考慮事項と制限事項
-
information_schema
データベースをクエリする代わりに、個別の Apache Hive DDL コマンドを使用して、Athena から特定のデータベース、テーブル、ビュー、パーティション、および列のメタデータ情報を抽出することができます。ただし、出力は表形式になりません。 -
information_schema
のクエリのパフォーマンスは、AWS Glue メタデータの量が少ない、または中程度である場合に最も高くなります。大量のメタデータがある場合は、エラーが発生する可能性があります。 -
CREATE VIEW
を使用してinformation_schema
データベース上にビューを作成することはできません。