Amazon Redshift Spectrum AWS Lake Formation 과 함께 사용 - AWS Lake Formation

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

Amazon Redshift Spectrum AWS Lake Formation 과 함께 사용

Amazon Redshift Spectrum을 사용하면 Amazon Redshift 클러스터 노드에 데이터를 로드하지 않고도 Amazon S3 데이터 레이크에서 데이터를 쿼리하고 검색할 수 있습니다.

Redshift Spectrum은 Lake Formation으로 활성화된 외부 AWS Glue 데이터 카탈로그를 등록하는 두 가지 방법을 지원합니다.

  • 데이터 카탈로그에 대한 권한이 있는 클러스터 연결 IAM 역할 사용

    IAM 역할을 생성하려면 아래 절차에 설명된 단계를 따릅니다.

    에 대한 액세스 제어 AWS Glue Data Catalog

  • 외부 AWS Glue Data Catalog 리소스에 대한 액세스를 관리하도록 구성된 페더레이션 IAM 자격 증명 사용

    Redshift Spectrum은 페더레이션 IAM ID를 사용하여 Lake Formation 테이블 쿼리를 지원합니다. IAM 자격 증명은 IAM 사용자 또는 IAM 역할일 수 있습니다. Redshift Spectrum의 IAM 자격 증명 페더레이션에 대한 자세한 내용은 페더레이션 자격 증명 사용을 참조하세요.

Lake Formation과 Redshift Spectrum을 통합하여 데이터를 Lake Formation에 등록한 후 테이블에 대한 행, 열 및 셀 수준의 액세스 제어 권한을 정의할 수 있습니다.

자세한 내용은 에서 Redshift Spectrum 사용을 AWS Lake Formation 참조하세요.

Redshift Spectrum은 Lake Formation에서 관리하는 외부 스키마 테이블에 대한 읽기 또는 SELECT 쿼리를 지원합니다.

자세한 내용은 Amazon Redshift Spectrum용 외부 스키마 생성을 참조하세요.

트랜잭션 테이블 유형 지원

아래 테이블에는 Redshift Spectrum에서 지원되는 트랜잭션 테이블 형식과 해당하는 Lake Formation 권한이 나와 있습니다.

지원되는 테이블 형식
테이블 형식 설명 및 허용된 작업 Redshift Spectrum에서 지원되는 Lake Formation 권한

Apache Hudi

증분 데이터 처리 및 데이터 파이프라인 개발을 간소화하는 데 사용되는 형식입니다.

Redshift Spectrum은 Amazon S3에서 Apache Hudi Copy on Write(CoW) 테이블 형식을 사용하여 삽입, 삭제 및 업서트 쓰기 작업을 지원합니다.

자세한 내용은 Apache Hudi에서 관리되는 데이터에 대한 외부 테이블 생성을 참조하세요.

Lake Formation의 데이터 필터링 및 셀 수준 보안을 사용하여 테이블, 열, 행 및 셀 수준 권한으로 Hudi 테이블을 보호합니다.

Apache Iceberg

대규모 파일 모음을 테이블로 관리하며 레코드 수준 삽입, 업데이트, 삭제 및 시간 이동 쿼리와 같은 최신 분석 데이터 레이크 작업을 지원하는 오픈 테이블 형식입니다.

자세한 내용은 Amazon Redshift에서 Apache Iceberg 테이블 사용을 참조하세요.

Redshift Spectrum은 쿼리를 위해 Apache Iceberg 테이블을 지원합니다.

Linux Foundation Delta Lake Delta Lake는 Amazon S3 또는 Hadoop 분산 파일 시스템()에 일반적으로 구축된 최신 데이터 레이크 아키텍처를 구현하는 데 도움이 되는 오픈 소스 프로젝트입니다HDFS.

Redshift Spectrum은 Delta Lake 테이블 쿼리를 지원합니다. 자세한 내용은 Delta Lake에서 관리되는 데이터에 대한 외부 테이블 생성을 참조하세요.

테이블, 열, 행 및 셀 수준 권한이 지원됩니다.

추가 리소스