다차원 데이터 레이아웃 정렬(미리 보기)
다음은 미리 보기로 출시된 테이블의 다차원 데이터 레이아웃 정렬에 대한 사전 릴리스 설명서입니다. 설명서 및 기능은 모두 변경될 수 있습니다. 이 기능은 테스트 클러스터에만 사용하고 프로덕션 환경에서는 사용하지 않는 것이 좋습니다. 미리 보기 이용 약관은 AWS Service Terms |
참고
이 기능은 미리 보기 클러스터 또는 미리 보기 작업 그룹을 통해서만 사용할 수 있습니다. 미리 보기 클러스터를 만들려면 Amazon Redshift 관리 안내서의 미리 보기 클러스터 생성을 참조하세요. 미리 보기 작업 그룹을 만들려면 Amazon Redshift 관리 안내서의 미리 보기 작업 그룹 만들기를 참조하세요.
다차원 데이터 레이아웃 정렬 키는 워크로드에서 발견되는 반복적인 조건자를 기반으로 하는 일종의 AUTO 정렬 키입니다. 워크로드에 반복적인 조건자가 있는 경우 Amazon Redshift는 반복되는 조건자를 충족하는 데이터 행을 콜로케이션으로 배치하여 테이블 스캔 성능을 개선할 수 있습니다. 다차원 데이터 레이아웃 정렬 키는 테이블의 데이터를 엄격한 열 순서로 저장하는 대신 워크로드에 나타나는 반복적인 조건자를 분석하여 데이터를 저장합니다. 워크로드에서 반복되는 조건자를 두 개 이상 찾을 수 있습니다. 워크로드에 따라 이러한 종류의 정렬 키를 사용하면 많은 조건자의 성능이 향상될 수 있습니다. Amazon Redshift는 AUTO
정렬 키로 정의된 테이블에 이 정렬 키 방법을 사용해야 하는지를 자동으로 결정합니다.
예를 들어 열 순서로 데이터가 정렬된 테이블이 있다고 가정하겠습니다. 워크로드의 조건을 만족하는지 확인하기 위해 많은 데이터 블록을 검사해야 할 수 있습니다. 그러나 데이터를 조건자 순서대로 디스크에 저장하면 쿼리를 충족하기 위해 스캔해야 하는 블록 수가 줄어듭니다. 이 경우에는 다차원 데이터 레이아웃 정렬 키를 사용하는 것이 좋습니다.
쿼리가 다차원 데이터 레이아웃 키를 사용하는지 확인하려면 SYS_QUERY_DETAIL 뷰의 step_attribute
열을 참조하세요. 값이 multi-dimensional
일 경우 쿼리에 다차원 데이터 레이아웃이 사용된 것입니다. AUTO 정렬 키로 정의된 테이블이 다차원 데이터 레이아웃을 사용하는지 보려면 SVV_TABLE_INFO 뷰의 sortkey1
열을 참조하세요. 값이 padb_internal_mddl_key_col
일 경우 테이블 정렬 키에 다차원 데이터 레이아웃이 사용된 것입니다.
Amazon Redshift가 다차원 데이터 레이아웃 정렬 키를 사용하지 못하게 하려면 SORTKEY AUTO
가 아닌 다른 테이블 정렬 키 옵션을 선택하세요. SORTKEY 옵션에 대한 자세한 내용은 CREATE TABLE 섹션을 참조하세요.