Como o AWS Glue Data Catalog é usado por muitos Serviços da AWS como repositório central de metadados, você pode consultar metadados do catálogo de dados. Para fazer isso, use as consultas SQL no Athena. Você pode usar o Athena para consultar os metadados do catálogo do AWS Glue, como bancos de dados, tabelas, partições e colunas.
Para acessar os metadados do catálogo do AWS Glue, consulte o banco de dados information_schema
no backend do Athena. As consultas de exemplo neste tópico mostram como usar o Athena para consultar os metadados do catálogo do AWS Glue em casos de uso comuns.
Considerações e limitações
-
Em vez de consultar o banco de dados
information_schema
, é possível usar comandos DDL individuais do Apache Hive para extrair informações de metadados para bancos de dados, tabelas, exibições, partições e colunas específicos do Athena. No entanto, a saída está em um formato não tabular. -
As consultas de
information_schema
apresentam melhor performance se você tiver uma quantidade pequena a moderada de metadados do AWS Glue. Pode haver erros se você tiver uma grande quantidade de metadados. -
Não é possível usar
CREATE VIEW
para criar uma exibição no banco de dadosinformation_schema
.