AWS Glue Data Catalog 쿼리
AWS Glue Data Catalog는 많은 AWS 서비스에서 중앙 메타데이터 리포지토리로 사용되므로 데이터 카탈로그 메타데이터를 쿼리해야 할 수 있습니다. 이를 위해 Athena에서 SQL 쿼리를 사용할 수 있습니다. Athena를 사용하여 데이터베이스, 테이블, 파티션 및 열과 같은 AWS Glue 카탈로그 메타데이터를 쿼리할 수 있습니다.
AWS Glue 카탈로그 메타데이터를 가져오려면 Athena 백엔드에서 information_schema
데이터베이스를 쿼리합니다. 이 주제의 예제 쿼리에서는 Athena를 사용하여 일반적인 사용 사례에 대한 AWS Glue 카탈로그 메타데이터를 쿼리하는 방법을 보여줍니다.
고려 사항 및 제한
-
information_schema
데이터베이스를 쿼리하는 대신, 개별 Apache Hive DDL 명령를 사용하여 Athena에서 특정 데이터베이스, 테이블, 뷰, 파티션 및 열에 대한 메타데이터 정보를 추출할 수 있습니다. 그러나 출력은 표가 아닌 형식을 가집니다. -
AWS Glue 메타데이터의 양이 소량에서 중간 정도라면
information_schema
쿼리가 가장 성능이 뛰어납니다. 메타데이터의 양이 많으면 오류가 발생할 수 있습니다. -
CREATE VIEW
를 사용하여information_schema
데이터베이스에 뷰를 생성할 수 없습니다.