데이터 카탈로그를 Hive 메타스토어에 연결하기 위한 사전 요구 사항 - AWS Lake Formation

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

데이터 카탈로그를 Hive 메타스토어에 연결하기 위한 사전 요구 사항

외부 Apache Hive 메타스토어에 연결하고 데이터 액세스 권한을 설정하려면 다음 요구 사항을 완료해야 합니다. AWS Glue Data Catalog

참고

Lake Formation 관리자가 AWS SAM 애플리케이션을 배포하고 권한이 있는 사용자만 Hive 메타스토어 연결을 사용하여 해당 페더레이션 데이터베이스를 생성하는 것이 좋습니다.

  1. IAM 역할을 생성합니다.
    애플리케이션을 배포하려면 AWS SAM
    • Hive 메타스토어에 대한 연결을 생성하는 데 필요한 리소스 (Lambda 함수 Amazon API Gateway, IAM 역할, 연결) 를 배포하는 데 필요한 권한이 있는 역할을 생성합니다. AWS Glue

    페더레이션형 데이터베이스를 만들려면

    리소스에 필요한 권한은 다음과 같습니다.

    • glue:CreateDatabase on resource arn:aws:glue:region:account-id:database/gluedatabasename

    • glue:PassConnection on resource arn:aws:glue:region:account-id:connection/hms_connection

  2. Lake Formation에 Amazon S3 위치를 등록합니다.

    Lake Formation을 사용하여 데이터 레이크의 데이터를 관리하고 보호하려면 Hive 메타스토어의 테이블 데이터가 있는 Amazon S3 위치를 Lake Formation에 등록해야 합니다. 이를 통해 Lake Formation은 Athena, Redshift Spectrum 및 Amazon EMR과 같은 AWS 분석 서비스에 자격 증명을 제공할 수 있습니다.

    Amazon S3 위치 등록에 대한 자세한 내용은 데이터 레이크에 Amazon S3 위치 추가 섹션을 참조하세요.

    Amazon S3 위치를 등록할 때 데이터 카탈로그 페더레이션 활성화 확인란을 선택하면 Lake Formation이 페더레이션된 데이터베이스의 테이블에 액세스하는 역할을 맡을 수 있습니다.

    Register location form for AWS Lake Formation with Amazon S3 path and IAM role options.

    Lake Formation에 데이터 위치를 등록하는 방법에 대한 자세한 내용은 데이터 레이크에 대한 Amazon S3 위치 구성 섹션을 참조하세요.

  3. 올바른 Amazon EMR 버전을 사용하십시오.

    Amazon EMR을 페더레이션된 하이브 메타스토어 데이터베이스와 함께 사용하려면 하이브 버전 3.x 이상 및 Amazon EMR 버전 6.x 이상이 필요합니다.