연결을 Glue 데이터 카탈로그로 등록 - Amazon Athena

연결을 Glue 데이터 카탈로그로 등록

데이터 소스를 생성한 후 Athena 콘솔을 사용하여 연결을 Glue 데이터 카탈로그로 등록할 수 있습니다. 등록되면 Lake Formation을 사용하여 페더레이션된 데이터 카탈로그를 관리하고 세분화된 액세스 제어를 활성화할 수 있습니다. 자세한 내용은 페더레이션된 카탈로그 생성을 참조하세요.

다음 커넥터를 등록하여 AWS Glue와 통합하고 세분화된 액세스 제어를 수행할 수 있습니다.

  • Redshift

  • BigQuery

  • DynamoDB(미리 보기)

  • Snowflake(미리 보기)

  • MySQL

  • PostgreSQL

  • AWS CMDB

  • Timestream

사전 조건

시작하기 전에 다음과 같은 사전 조건을 완료해야 합니다.

  • 위치를 등록하는 데 필요한 역할과 권한이 있는지 확인합니다. 자세한 내용은 AWS Lake Formation 개발자 안내서의 역할에 대한 요구 사항을 참조하세요.

  • 필요한 Lake Formation 역할이 있는지 확인합니다. 자세한 내용은 AWS Lake Formation 개발자 안내서의 데이터 카탈로그를 외부 데이터 소스에 연결하기 위한 사전 조건을 참조하세요.

  • Glue에 등록하는 역할에는 다음 예제에 나열된 권한이 있어야 합니다.

    { "Version": "2012-10-17", "Statement": [{ "Effect": "Allow", "Action": [ "s3:ListBucket", "s3:GetObject" ], "Resource": [ "s3://amzn-s3-demo-bucket/<Your_Spill_Prefix>/*", "s3://amzn-s3-demo-bucket/<Your_Spill_Prefix>" ] }, { "Sid": "lambdainvoke", "Effect": "Allow", "Action": "lambda:InvokeFunction", "Resource": "<Lambda_function_arn>" }, { "Sid": "gluepolicy", "Effect": "Allow", "Action": "glue:*", "Resource": [ "arn:aws:glue:<region>:<account_id>:connection/<connection_name>", "arn:aws:glue:<region>:<account_id>:catalog" ] } ] }
  • 적절한 데이터 액세스를 결정하고 관리할 책임은 사용자에게 있습니다. 페더레이션 쿼리에 대한 세분화된 액세스 제어를 통해 AmazonAthenaFullAccess 관리형 정책을 사용하는 것이 좋습니다. 자체 정책을 사용하려면 페더레이션 쿼리를 실행하는 사용자가 다음 리소스에 액세스할 수 없게 해야 합니다.

    • Glue 연결에 지정된 Lambda 커넥터의 lambda:InvokeFunction

    • IAM의 유출 버킷 위치 액세스

    • 페더레이션 카탈로그와 연결된 Glue 연결에 대한 액세스

    • IAM의 Lake Formation 역할

콘솔을 사용하여 연결 등록

연결을 Glue 데이터 카탈로그로 등록하려면
  1. https://console.aws.amazon.com/athena/에서 Athena 콘솔을 엽니다.

  2. 탐색 창에서 데이터 소스 및 카탈로그를 선택합니다.

  3. 데이터 소스 목록에서 생성한 데이터 소스를 선택하여 데이터 소스 세부 정보 페이지를 엽니다.

  4. Get started with AWS Lake Formation(SES 시작하기)를 선택합니다.

    참고

    이 옵션을 선택한 후에는 Lambda 함수를 직접 관리해야 합니다. Athena는 Lambda 함수를 삭제하지 않습니다.

  5. 데이터 카탈로그 이름에 카탈로그의 고유한 이름을 입력합니다.

  6. Lake Formation에 Lambda 함수를 호출할 권한을 부여하는 Lake Formation IAM 역할을 선택합니다. 역할에 예시에 표시된 것과 같은 권한이 있는지 확인합니다.

  7. 텍스트 상자에 확인을 입력하여 Athena 데이터 소스를 삭제하고 Glue 데이터 카탈로그 등록으로 바꿉니다.

    참고

    이 작업을 수행하면 Athena 데이터 소스가 삭제되고 해당 위치에 새 Glue 데이터 카탈로그가 생성됩니다. 이 프로세스가 완료되면 데이터 소스에 액세스하는 쿼리를 업데이트하여 새로 생성된 Glue 데이터 카탈로그를 대신 참조해야 할 수 있습니다.

  8. 카탈로그 생성을 선택하고 Lake Formation으로 이동합니다. 그러면 카탈로그를 관리하고 카탈로그, 데이터베이스, 테이블의 사용자에게 권한을 부여할 수 있는 Lake Formation 콘솔이 열립니다.