최상의 정렬 키 선택
Amazon Redshift는 정렬 키에 따라 정렬된 순서로 디스크에 데이터를 저장합니다. Amazon Redshift 쿼리 옵티마이저는 최적의 쿼리 계획을 결정할 때 정렬 순서를 사용합니다.
참고
자동 테이블 최적화를 사용하는 경우 테이블의 정렬 키를 선택할 필요가 없습니다. 자세한 내용은 자동 테이블 최적화 단원을 참조하십시오.
가장 좋은 방법에 대한 몇 가지 제안은 다음과 같습니다.
Amazon Redshift에서 적절한 정렬 순서를 선택하도록 하려면 정렬 키에 대해
AUTO
를 지정합니다.-
최신 데이터를 가장 자주 쿼리하는 경우, 타임스탬프 열을 정렬 키의 선행 열로 지정합니다.
그러면 시간 범위에서 벗어나는 블록 전체를 건너뛸 수 있기 때문에 쿼리 효율성이 더욱 향상됩니다.
-
하나의 열에 범위 필터링이나 동등 필터링을 자주 수행하는 경우, 해당 열을 정렬 키로 지정합니다.
Amazon Redshift는 해당 열의 전체 데이터 블록 읽기를 건너뛸 수 있습니다. 그렇게 할 수 있는 이유는 각 블록에 저장된 최소 및 최대 열 값을 추적하여 조건자 범위에 적용되지 않는 블록을 건너뛸 수 있기 때문입니다.
-
자주 테이블을 조인할 경우 조인 열을 정렬 키와 분배 키로 지정합니다.
그러면 쿼리 최적화 프로그램이 느린 해시 조인 대신 정렬 병합 조인을 선택할 수 있습니다. 또한 데이터가 이미 조인 키를 기준으로 정렬되어 있기 때문에 쿼리 옵티마이저가 정렬 병합 조인의 정렬 단계를 우회할 수 있습니다.