由于许多 AWS 服务 都将 AWS Glue Data Catalog 用作其中央元数据存储库,因此您可能需要查询 Data Catalog 元数据。为此,您可以在 Athena 中使用 SQL 查询。您可以使用 Athena 查询 AWS Glue 目录元数据,如数据库、表、分区和列等。
要获取 AWS Glue Catalog 元数据,请查询 Athena 后端上的 information_schema
数据库。本主题中的示例查询显示如何使用 Athena 查询 AWS Glue Catalog 元数据以搜索常用案例。
注意事项和限制
-
您可以不查询
information_schema
数据库,而是使用单独的 Apache Hive DDL 命令从 Athena 中提取特定数据库、表、视图、分区和列的元数据信息。但输出将为非表格格式。 -
如果您的 AWS Glue 元数据较少或中等,则查询
information_schema
的性能会最佳。如果您有大量的元数据,则可能会出现错误。 -
不能使用
CREATE VIEW
在information_schema
数据库上创建视图。