datashare 개요
Amazon Redshift를 사용하면 Amazon Redshift 클러스터 간에 실시간 데이터를 안전하게 공유하여 데이터 공유 워크플로를 간소화하고 복잡한 추출, 전환, 적재(ETL) 프로세스의 필요를 줄일 수 있습니다. 데이터 공유를 통해 Amazon Redshift 클러스터 전반에서 실시간 데이터를 공유할 수 있으므로 데이터를 복사하거나 복제할 필요 없이 최신 데이터에 실시간으로 액세스합니다. 데이터베이스 관리자, 데이터 분석가 및 데이터 엔지니어는 팀 및 조직 내 또는 조직 전체에서 데이터 액세스 및 협업을 간소화하기 위해 이 기능에 관심이 있을 수 있습니다. 이를 통해 분석 팀과 실시간 프로덕션 데이터를 공유하고, 분산된 데이터 소스 간에 실시간 보고를 제공하고, 액세스 권한을 중앙에서 제어하여 데이터 거버넌스를 간소화하는 등의 사용 사례를 사용합니다. 다음 섹션에서는 Amazon Redshift에서 데이터 공유를 구성하고 관리하는 방법에 대한 세부 정보를 다룹니다.
데이터 공유를 사용하면 Amazon Redshift 클러스터에서 라이브 데이터를 안전하고 쉽게 공유할 수 있습니다.
데이터 공유 작업을 시작하고 AWS Management Console을 사용하여 datashare를 관리하는 방법에 대한 자세한 내용은 데이터 공유 작업 관리 섹션을 참조하세요.
Amazon Redshift의 데이터 공유 사용 사례
Amazon Redshift datashare는 다음과 같은 사용 사례에 특히 유용합니다.
-
다양한 종류의 비즈니스 크리티컬 워크로드 지원 – 여러 비즈니스 인텔리전스(BI) 또는 분석 클러스터와 데이터를 공유하는 중앙 추출, 변환 및 로드(ETL) 클러스터를 사용합니다. 이 접근 방식은 개별 워크로드에 대한 읽기 워크로드 격리 및 차지백을 제공합니다. 가격 및 성능에 대한 워크로드별 요구 사항에 따라 개별 워크로드 컴퓨팅의 크기를 조정하고 확장할 수 있습니다.
-
그룹 간 협업 사용 - 광범위한 분석, 데이터 과학 및 제품 간 영향 분석을 위해 팀과 비즈니스 그룹 간의 원활한 협업을 지원합니다.
-
데이터를 서비스로 제공 – 조직 전체에서 데이터를 서비스로 공유합니다.
-
환경 간 datashare – 개발, 테스트 및 프로덕션 환경 간에 데이터를 공유합니다. 다양한 세분화된 수준에서 데이터를 공유하여 팀 민첩성을 향상시킬 수 있습니다.
-
Amazon Redshift의 데이터에 대한 액세스 라이선스 부여 – 고객이 몇 분 안에 찾고, 구독하고, 쿼리할 수 있는 Amazon Redshift 데이터 집합을 AWS Data Exchange 카탈로그에 나열합니다.
데이터 공유 쓰기 액세스 사용 사례(미리 보기)
쓰기 데이터 공유에는 몇 가지 중요한 사용 사례가 있습니다.
-
생산자에 대한 비즈니스 소스 데이터 업데이트 - 조직 전체에서 데이터를 서비스로 공유할 수 있지만, 이렇게 하면 소비자도 소스 데이터에 대한 작업을 수행할 수 있습니다. 예를 들어 소비자가 최신 값을 전달하거나 데이터 수신을 승인할 수 있습니다. 이는 비즈니스 사용 사례 중 몇 가지에 불과합니다.
생산자에 추가 레코드 삽입 - 소비자가 원래 소스 데이터에 레코드를 추가할 수 있습니다. 필요한 경우 소비자가 추가한 것으로 표시할 수 있습니다.
데이터 공유에서 쓰기 작업을 수행하는 방법에 대한 구체적인 내용은 데이터에 대한 쓰기 액세스 공유(미리 보기)를 참조하세요.
Amazon Redshift에서 다양한 수준의 데이터 공유
Amazon Redshift를 사용하면 여러 수준에서 데이터를 공유할 수 있습니다. 이러한 수준에는 데이터베이스, 스키마, 테이블, 뷰(일반, 후기 바인딩 및 구체화된 뷰 포함) 및 SQL 사용자 정의 함수(UDF)가 포함됩니다. 지정된 데이터베이스에 대해 여러 datashare를 생성할 수 있습니다. datashare에는 공유가 생성되는 데이터베이스에 있는 여러 스키마의 객체가 포함될 수 있습니다.
datashare에 있어 이러한 유연성을 갖추면 세분화된 액세스 제어가 가능합니다. Amazon Redshift 데이터에 액세스해야 하는 다양한 사용자와 비즈니스에 맞게 이 제어를 조정할 수 있습니다.
Amazon Redshift에서 데이터 공유를 위한 일관성 관리
Amazon Redshift는 모든 생산자 및 소비자 클러스터에서 트랜잭션 일관성을 제공하고 모든 소비자와 데이터의 일관된 최신 뷰를 공유합니다.
생산자 클러스터에서 데이터를 지속적으로 업데이트할 수 있습니다. 트랜잭션 내의 소비자 클러스터에 대한 모든 쿼리는 공유 데이터의 동일한 상태를 읽습니다. Amazon Redshift는 소비자 클러스터에서 트랜잭션이 시작된 후 커밋된 생산자 클러스터의 다른 트랜잭션에 의해 변경된 데이터를 고려하지 않습니다. 생산자 클러스터에서 데이터 변경이 커밋된 후 소비자 클러스터의 새 트랜잭션은 업데이트된 데이터를 즉시 쿼리할 수 있습니다.
일관성이 뛰어나 데이터 공유 중 잘못된 결과를 포함할 수도 있는 충실도가 낮은 비즈니스 보고서가 작성될 위험이 없습니다. 이 요소는 재무 분석이나 기계 학습 모델을 훈련하는 데 사용되는 데이터 집합을 준비하는 데 결과를 사용할 수 있는 경우에 특히 중요합니다.