Amazon Redshift Spectrum
이 섹션에서는 Redshift Spectrum을 사용하여 Amazon S3의 데이터를 효율적으로 읽는 방법에 대해 설명합니다.
Amazon Redshift Spectrum을 사용하면 데이터를 Amazon Redshift 테이블에 로드하지 않고도 Amazon S3의 파일에서 정형 및 비정형 데이터를 효율적으로 쿼리하고 가져올 수 있습니다. Redshift Spectrum 쿼리는 대량 병렬 처리를 채택해 큰 데이터 집합에 대해 매우 빠르게 실행됩니다. 대부분의 처리가 Redshift Spectrum 계층에서 이루어지며, 데이터가 대부분 Amazon S3에 그대로 남습니다. 또한 다수의 클러스터가 Amazon S3의 동일한 데이터 집합에 대해 동시에 쿼리를 실행할 수 있기 때문에 각 클러스터의 데이터를 일일이 복사할 필요가 없습니다.
주제
- Amazon Redshift Spectrum 개요
- Amazon Redshift Spectrum 시작하기
- Amazon Redshift Spectrum에 대한 IAM 정책
- Redshift Spectrum 및 AWS Lake Formation
- Amazon Redshift Spectrum의 쿼리용 데이터 파일
- Amazon Redshift Spectrum의 외부 스키마
- Redshift Spectrum용 외부 테이블
- Amazon Redshift와 함께 Apache Iceberg 테이블 사용
- Amazon Redshift Spectrum 쿼리 성능
- 데이터 처리 옵션
- 예: Redshift Spectrum에서 상관 하위 쿼리 수행
- Amazon Redshift Spectrum의 지표
- Amazon Redshift Spectrum의 쿼리 문제 해결
- 튜토리얼: Amazon Redshift Spectrum을 사용한 중첩 데이터 쿼리