Amazon Redshift에서 데이터 공유
Amazon Redshift를 사용하면 Amazon Redshift 클러스터 또는 다른 AWS 서비스 전반에서 데이터를 안전하게 공유할 수 있습니다. 데이터 공유를 통해 복사본을 만들거나 이전하지 않고도 실시간 데이터 공유가 가능합니다. 데이터베이스 관리자와 데이터 엔지니어는 데이터 공유를 사용하여 데이터에 대한 제어를 유지 관리하면서 분석 목적으로 데이터에 대해 안전한 읽기 전용 액세스를 제공할 수 있습니다. 데이터 분석가, 비즈니스 인텔리전스 전문가 및 데이터 과학자는 공유 데이터를 활용하여 데이터를 복제하거나 이전하지 않고도 인사이트를 확보합니다. 일반적인 사용 사례에는 파트너와 데이터 공유, 부서 간 분석 사용, 조직 내 데이터 민주화 촉진이 포함됩니다. 다음 섹션에서는 Amazon Redshift에서 데이터 공유를 구성하고 관리하는 방법에 대한 세부 정보를 다룹니다.
Amazon Redshift 데이터 공유를 사용하면 데이터를 수동으로 이동하거나 복사하지 않고도 Amazon Redshift 클러스터, 작업 그룹, AWS 계정 및 AWS 리전 전체에서 라이브 데이터에 대한 액세스를 안전하게 공유할 수 있습니다. 데이터가 라이브 상태이므로 모든 사용자는 업데이트되는 즉시 Amazon Redshift에서 가장 최신의 일관된 정보를 볼 수 있습니다.
프로비저닝된 클러스터, 서버리스 작업 그룹, 가용 영역, AWS 계정, AWS 리전 등에서 데이터를 공유할 수 있습니다. 클러스터 유형 간뿐만 아니라 프로비저닝된 클러스터와 서버리스 간에 공유할 수 있습니다.
서로 다른 Amazon Redshift 클러스터 또는 Amazon Redshift Serverless 작업 그룹 내에서, 한 AWS 계정에서, 또는 한 AWS 계정에서 다른 계정 간에 읽기 및 쓰기 모두에 대한 데이터베이스 객체를 공유할 수 있습니다. 서로 다른 리전 간에도 데이터를 쓸 수 있습니다. 서로 다른 테이블에 대해 SELECT, INSERT, UPDATE 등의 권한을 부여하고 서로 다른 스키마에 대해 USAGE 및 CREATE와 같은 권한을 부여할 수 있습니다. 데이터는 쓰기 트랜잭션이 커밋되는 즉시 라이브 상태로 모든 웨어하우스에서 사용할 수 있습니다.
PREVIEW_2023 트랙의 데이터 공유 기능을 구성하는 방법에 대한 자세한 내용은 데이터에 대한 쓰기 액세스 공유(미리 보기)를 참조하세요.
참고
현재 ra3.xlplus 클러스터에서는 데이터 공유를 통한 다중 웨어하우스 쓰기를 사용할 수 없습니다. 이 기능을 사용하려면 ra3.4xl 클러스터, ra3.16xl 클러스터 또는 Amazon Redshift Serverless 작업 그룹을 생성하세요.
Amazon Redshift에서 데이터 공유를 사용할 때의 고려 사항
다음은 Amazon Redshift 데이터 공유 작업 시 고려 사항입니다. 데이터 공유 제한에 대한 자세한 내용은 datashare 제한 사항 섹션을 참조하세요.
-
리전 간 데이터 공유에는 리전 간 데이터 전송 요금이 추가로 부과됩니다. 이러한 데이터 전송 요금은 동일한 리전 내에서는 적용되지 않고 리전 간에만 적용됩니다. 자세한 내용은 리전 간 데이터 공유를 위한 비용 관리 단원을 참조하십시오.
-
데이터 공유에서 데이터를 읽을 때는 로컬 클러스터 데이터베이스에 연결된 상태를 유지합니다. 데이터 공유에서 생성된 데이터베이스 설정 및 읽기에 대한 자세한 내용은 datashare 객체 쿼리를 참조하세요.
-
생산자의 데이터를 쿼리하는 데 필요한 모든 컴퓨팅 및 리전 간 데이터 전송 요금은 소비자에게 부과됩니다. 프로비저닝된 클러스터 또는 서버리스 네임스페이스의 기본 데이터 스토리지에 대해서는 생산자에게 요금이 부과됩니다.
-
공유 데이터에 대한 쿼리의 성능은 소비자 클러스터의 컴퓨팅 용량에 따라 다릅니다.
데이터 공유를 위한 클러스터 암호화 관리
AWS 계정에서 데이터를 공유하려면 생산자 클러스터와 소비자 클러스터를 모두 암호화해야 합니다.
Amazon Redshift에서는 클러스터의 데이터베이스 암호화를 통해 저장된 데이터를 보호할 수 있습니다. 클러스터에서 암호화를 활성화하면 해당 클러스터와 스냅샷의 데이터 블록 및 시스템 메타데이터가 암호화됩니다. 클러스터를 시작할 때 암호화를 활성화하거나, AWS Key Management Service(AWS KMS) 암호화를 사용하도록 암호화되지 않은 클러스터를 수정할 수 있습니다. Amazon Redshift 데이터베이스 암호화에 대한 자세한 내용은 Amazon Redshift 관리 가이드의 Amazon Redshift 데이터베이스 암호화 섹션을 참조하세요.
전송 중인 데이터 보호를 위해 생산자 클러스터의 암호화 스키마를 통해 전송 중인 모든 데이터를 암호화합니다. 소비자 클러스터는 데이터가 로드될 때 이 암호화 스키마를 채택합니다. 그런 다음 소비자 클러스터는 일반적인 암호화된 클러스터로 작동합니다. 생산자와 소비자 간의 통신도 공유 키 스키마를 사용하여 암호화됩니다. 전송 중 암호화에 대한 자세한 내용은 전송 중 데이터 암호화를 참조하세요.
datashare 제한 사항
다음은 Amazon Redshift에서 데이터베이스 작업 시 제한 사항입니다.
데이터 공유는 모든 프로비저닝된 RA3 클러스터 유형 및 Amazon Redshift Serverless에서 지원됩니다. 다른 클러스터 유형에서는 지원되지 않습니다.
생산자와 소비자 클러스터 및 서버리스 네임스페이스가 모두 동일한 계정에 있는 경우 동일한 암호화 유형(암호화되지 않은 유형 또는 암호화된 유형 중 하나)을 보유해야 합니다. Lake Formation 관리형 데이터 공유를 포함한 다른 모든 경우에는 소비자와 생산자를 모두 암호화해야 합니다. 이는 보안을 위한 것입니다. 하지만 동일한 암호화 키를 공유할 필요는 없습니다.
데이터 공유를 통해서만 SQL UDF를 공유할 수 있습니다. Python 및 Lambda UDF는 지원되지 않습니다.
생산자 데이터베이스에 특정 데이터 정렬이 있는 경우 소비자 데이터베이스에 동일한 데이터 정렬 설정을 사용합니다.
Amazon Redshift는 데이터 공유에 외부 스키마, 테이블, 후기 바인딩 보기 또는 외부 테이블 추가를 지원하지 않습니다.
Amazon Redshift는 생산자 클러스터에서 중첩된 SQL 사용자 정의 함수를 지원하지 않습니다.
Amazon Redshift는 인터리브 정렬 키가 있는 테이블과 이러한 테이블을 참조하는 뷰 공유를 지원하지 않습니다.
소비자는 데이터 공유 객체를 다른 데이터 공유에 추가할 수 없습니다. 또한 소비자는 데이터 공유 객체를 참조하는 뷰를 다른 데이터 공유에 추가할 수 없습니다.
Amazon Redshift는 액세스 준비와 실행 간에 동시 DDL이 발생한 데이터 공유 객체에 대한 액세스를 지원하지 않습니다.
Amazon Redshift는 데이터 공유를 통한 저장 프로시저 공유를 지원하지 않습니다.
Amazon Redshift는 메타데이터 시스템 뷰 및 시스템 테이블 공유를 지원하지 않습니다.
데이터 공유가 가능한 리전
다음 테이블에는 데이터 공유 기능의 사용 가능 여부가 나와 있습니다.
리전 | 동일 리전 데이터 공유 | 리전 간 데이터 공유 | AWS Lake Formation 통제 데이터 공유 |
---|---|---|---|
미국 동부(버지니아 북부)(us-east-1) | 예 | 예 | 예 |
미국 동부(오하이오)(us-east-2) | 예 | 예 | 예 |
미국 서부(캘리포니아 북부)(us-west-1) | 예 | 예 | 예 |
미국 서부(오레곤)(us-west-2) | 예 | 예 | 예 |
아시아 태평양(홍콩)(ap-east-1) | 예 | 아니요 | 아니요 |
아시아 태평양(뭄바이)(ap-south-1) | 예 | 예 | 예 |
아시아 태평양(하이데라바드)(ap-south-2) | 예 | 아니요 | 아니요 |
아시아 태평양(도쿄)(ap-northeast-1) | 예 | 예 | 예 |
아시아 태평양(싱가포르)(ap-southeast-1) | 예 | 예 | 예 |
아시아 태평양(시드니)(ap-southeast-2) | 예 | 예 | 예 |
아시아 태평양(자카르타)(ap-southeast-3) | 예 | 아니요 | 아니요 |
아시아 태평양(멜버른)(ap-southeast-4) | 예 | 아니요 | 아니요 |
아시아 태평양(서울)(ap-northeast-2) | 예 | 예 | 예 |
아시아 태평양(오사카) (ap-northeast-3) | 예 | 아니요 | 아니요 |
중국(베이징) (cn-north-1) | 예 | 아니요 | 아니요 |
아프리카(케이프타운)(af-south-1) | 예 | 예 | 아니요 |
캐나다 서부(캘거리)(ca-west-1) | 예 | 아니요 | 아니요 |
캐나다(중부)(ca-central-1) | 예 | 예 | 예 |
유럽(프랑크푸르트)(eu-central-1) | 예 | 예 | 예 |
유럽(취리히)(eu-central-2) | 예 | 아니요 | 아니요 |
유럽(아일랜드)(eu-west-1) | 예 | 예 | 예 |
유럽(런던)(eu-west-2) | 예 | 예 | 예 |
유럽(파리)(eu-west-3) | 예 | 예 | 예 |
유럽(밀라노) (eu-south-1) | 예 | 아니요 | 아니요 |
유럽(스페인)(eu-south-2) | 예 | 아니요 | 아니요 |
유럽(스톡홀름)(eu-north-1) | 예 | 예 | 예 |
중동(UAE)(me-central-1) | 예 | 아니요 | 아니요 |
중동(바레인)(me-south-1) | 예 | 아니요 | 아니요 |
이스라엘(텔아비브) (il-central-1) | 예 | 아니요 | 아니요 |
남아메리카(상파울루)(sa-east-1) | 예 | 예 | 예 |
AWS GovCloud(미국 동부)(us-gov-east-1) | 예 | 아니요 | 예 |
AWS GovCloud(미국 서부)(us-gov-west-1) | 예 | 아니요 | 예 |
데이터 공유를 위한 다중 웨어하우스 쓰기의 리전별 가용성
PREVIEW_2023 트랙에서는 데이터 공유를 통해 쓰기 작업과 더욱 세분화된 공유 기능을 이용할 수 있습니다. 이러한 기능을 구성하는 방법에 대한 자세한 내용은 데이터에 대한 쓰기 액세스 공유(미리 보기)를 참조하세요. 미리 보기 기능을 사용할 수 있는 리전에 대한 자세한 내용은 데이터 공유가 가능한 리전(미리 보기)을 참조하세요.