배포된 Hive 메타스토어 커넥터를 사용하도록 Athena 구성 - Amazon Athena

배포된 Hive 메타스토어 커넥터를 사용하도록 Athena 구성

AthenaHiveMetastoreFunction과 같은 Lambda 데이터 원본 커넥터를 계정에 배포한 후 이를 사용하도록 Athena를 구성할 수 있습니다. 이를 위해 Athena 쿼리에 사용할 외부 Hive 메타스토어를 참조하는 데이터 원본 이름을 생성합니다.

기존 Lambda 함수를 사용하여 Hive 메타스토어에 Athena 연결
  1. https://console.aws.amazon.com/athena/에서 Athena 콘솔을 엽니다.

  2. 콘솔 탐색 창이 표시되지 않으면 왼쪽의 확장 메뉴를 선택합니다.

    확장 메뉴를 선택합니다.
  3. 데이터 소스(Data Source)을 선택합니다.

  4. 데이터 원본(Data sources) 페이지에서 데이터 원본 연결(Connect data source)을 선택합니다.

  5. 데이터 원본 선택(Choose data sources) 페이지에서 데이터 원본(Data source)에 대해 S3 - Apache Hive 메타스토어(S3 - Apache Hive metastore)를 선택합니다.

  6. Next(다음)를 선택합니다.

  7. 데이터 원본 세부 정보(Data source details) 섹션의 데이터 원본 이름(Data source name)에 Athena에서 데이터 원본을 쿼리할 때 SQL 문에 사용할 이름을 입력합니다(예: MyHiveMetastore). 이름은 127자까지 입력할 수 있으며 계정 내에서 고유해야 합니다. 생성 후에는 변경할 수 없습니다. 유효한 문자는 a-z, A-Z, 0-9, _(밑줄), @(앰퍼샌드) 및 -(하이픈)입니다. awsdatacatalog, hive, jmx, system 이름은 Athena에 예약되어 있으므로 데이터 원본 이름에 사용할 수 없습니다.

  8. 연결 세부 정보 섹션에서, Lambda 함수 선택 또는 입력 상자를 사용해 방금 만든 함수의 이름을 선택합니다. Lambda 함수의 ARN이 표시됩니다.

  9. (선택 사항) 태그(Tags)에 대해 이 데이터 원본과 연결할 키-값 페어를 추가합니다. 태그에 대한 자세한 내용은 Athena 리소스 태깅 단원을 참조하세요.

  10. Next(다음)를 선택합니다.

  11. 검토 및 생성 페이지에서 데이터 원본 세부 정보를 검토한 다음 데이터 원본 생성을 선택합니다.

  12. 데이터 원본 페이지의 데이터 원본 세부 정보 섹션에는 새 커넥터에 대한 정보가 표시됩니다.

    이제 Athena에서는 지정한 데이터 원본 이름(Data source name)을 사용하여 SQL 쿼리에서 Hive 메타스토어를 참조할 수 있습니다.

    SQL 쿼리에서 다음 예제 구문을 사용하여 ehms-catalog를 앞에서 지정한 데이터 원본 이름으로 바꿉니다.

    SELECT * FROM ehms-catalog.CustomerData.customers
  13. 생성한 데이터 원본을 보거나 편집하거나 삭제하려면 데이터 소스 관리 단원을 참조하세요.