Selecione a melhor chave de classificação
O Amazon Redshift armazena seus dados no disco em ordem classificada de acordo com a chave de classificação. O otimizador de consulta Amazon Redshift usa a ordem de classificação quando determina os planos de consulta ideais.
nota
Ao usar a otimização automática de tabela, você não precisa escolher a chave de classificação de sua tabela. Para ter mais informações, consulte Otimização automática de tabelas.
Seguem algumas sugestões para a melhor abordagem:
Para que o Amazon Redshift escolha a ordem de classificação apropriada, especifique
AUTO
para a chave de classificação.-
Se dados recentes forem mais consultados, especifique a coluna de time stamp como a coluna principal da chave de classificação.
As consultas são mais eficientes, pois podem ignorar blocos inteiros que estão fora do período.
-
Se você fizer filtragem de intervalos frequentes ou filtragem de igualdade em uma coluna, especifique esta coluna como a chave de classificação.
O Amazon Redshift pode ignorar a leitura de blocos inteiros de dados para essa coluna. É possível fazer isso, pois ele rastreia os valores mínimo e máximo da coluna armazenados em cada bloco e pode ignorar blocos que não se aplicam ao intervalo previsto.
-
Se você costuma ingressar em uma tabela, especifique a coluna de união como a chave de classificação e a chave de distribuição.
Isso permite que o otimizador de consulta escolha uma junção de mesclagem de classificação em vez de uma junção hash mais lenta. Como os dados já são classificados na chave de junção, o otimizador de consulta pode ignorar a fase de classificação da junção de mesclagem de classificação.