查询 AWS Glue Data Catalog - Amazon Athena

查询 AWS Glue Data Catalog

由于许多 AWS 服务 都将 AWS Glue Data Catalog 用作其中央元数据存储库,因此您可能需要查询 Data Catalog 元数据。为此,您可以在 Athena 中使用 SQL 查询。您可以使用 Athena 查询 AWS Glue 目录元数据,如数据库、表、分区和列等。

要获取 AWS Glue Catalog 元数据,请查询 Athena 后端上的 information_schema 数据库。本主题中的示例查询显示如何使用 Athena 查询 AWS Glue Catalog 元数据以搜索常用案例。

注意事项和限制

  • 您可以不查询 information_schema 数据库,而是使用单独的 Apache Hive DDL 命令从 Athena 中提取特定数据库、表、视图、分区和列的元数据信息。但输出将为非表格格式。

  • 如果您的 AWS Glue 元数据较少或中等,则查询 information_schema 的性能会最佳。如果您有大量的元数据,则可能会出现错误。

  • 不能使用 CREATE VIEWinformation_schema 数据库上创建视图。