배포된 Hive 메타스토어 커넥터를 사용하도록 Athena 구성
AthenaHiveMetastoreFunction
과 같은 Lambda 데이터 원본 커넥터를 계정에 배포한 후 이를 사용하도록 Athena를 구성할 수 있습니다. 이를 위해 Athena 쿼리에 사용할 외부 Hive 메타스토어를 참조하는 데이터 원본 이름을 생성합니다.
기존 Lambda 함수를 사용하여 Hive 메타스토어에 Athena 연결
https://console.aws.amazon.com/athena/
에서 Athena 콘솔을 엽니다. 콘솔 탐색 창이 표시되지 않으면 왼쪽의 확장 메뉴를 선택합니다.
-
데이터 소스(Data Source)을 선택합니다.
-
데이터 원본(Data sources) 페이지에서 데이터 원본 연결(Connect data source)을 선택합니다.
-
데이터 원본 선택(Choose data sources) 페이지에서 데이터 원본(Data source)에 대해 S3 - Apache Hive 메타스토어(S3 - Apache Hive metastore)를 선택합니다.
-
Next(다음)를 선택합니다.
-
데이터 원본 세부 정보(Data source details) 섹션의 데이터 원본 이름(Data source name)에 Athena에서 데이터 원본을 쿼리할 때 SQL 문에 사용할 이름을 입력합니다(예:
MyHiveMetastore
). 이름은 127자까지 입력할 수 있으며 계정 내에서 고유해야 합니다. 생성 후에는 변경할 수 없습니다. 유효한 문자는 a-z, A-Z, 0-9, _(밑줄), @(앰퍼샌드) 및 -(하이픈)입니다.awsdatacatalog
,hive
,jmx
,system
이름은 Athena에 예약되어 있으므로 데이터 원본 이름에 사용할 수 없습니다. -
연결 세부 정보 섹션에서, Lambda 함수 선택 또는 입력 상자를 사용해 방금 만든 함수의 이름을 선택합니다. Lambda 함수의 ARN이 표시됩니다.
-
(선택 사항) 태그(Tags)에 대해 이 데이터 원본과 연결할 키-값 페어를 추가합니다. 태그에 대한 자세한 내용은 Athena 리소스 태깅 단원을 참조하세요.
-
Next(다음)를 선택합니다.
-
검토 및 생성 페이지에서 데이터 원본 세부 정보를 검토한 다음 데이터 원본 생성을 선택합니다.
-
데이터 원본 페이지의 데이터 원본 세부 정보 섹션에는 새 커넥터에 대한 정보가 표시됩니다.
이제 Athena에서는 지정한 데이터 원본 이름(Data source name)을 사용하여 SQL 쿼리에서 Hive 메타스토어를 참조할 수 있습니다.
SQL 쿼리에서 다음 예제 구문을 사용하여
ehms-catalog
를 앞에서 지정한 데이터 원본 이름으로 바꿉니다.SELECT * FROM ehms-catalog.CustomerData.customers
-
생성한 데이터 원본을 보거나 편집하거나 삭제하려면 데이터 소스 관리 단원을 참조하세요.