Chave de classificação intercalada
Uma classificação intercalada concede igual peso a cada coluna ou subconjunto de colunas na chave de classificação. Se várias consultas usam colunas diferentes como filtros, é frequentemente possível melhorar a performance dessas consultas usando um estilo intercalado de classificação. Quando uma consulta usa predicados restritivos em colunas de classificação secundárias, a classificação intercalada melhora significativamente a performance da consulta em relação à classificação composta.
Importante
Não use uma chave de classificação intercalada em colunas com atributos que aumentam monotonicamente, como colunas de identidade, datas ou time stamps.
As melhorias de performance que você ganha ao executar uma chave de classificação intercalada devem ser pesadas contra o aumento nos tempos de carregamento e limpeza.
Classificações intercaladas são mais eficazes com consultas altamente seletivas que filtram uma ou mais das colunas de chave de classificação na cláusula WHERE, por exemplo select
c_name from customer where c_region = 'ASIA'
. Os benefícios da classificação intercalada aumentam com o número de colunas classificadas que são restritas.
Uma classificação intercalada é mais eficaz com tabelas grandes. A classificação é aplicada em cada fatia. Assim, uma classificação intercalada é mais eficaz quando uma tabela é grande o suficiente para exigir vários blocos de 1 MB por fatia. Aqui, o processador de consultas pode ignorar uma proporção significativa dos blocos usando predicados restritivos. Para visualizar o número de blocos que uma tabela usa, consulte a exibição de sistema STV_BLOCKLIST.
Para classificação em uma única coluna, uma classificação intercalada pode apresentar melhor performance do que uma classificação composta se os valores da coluna tiverem um prefixo comum longo. Por exemplo, URLs normalmente começam com “http://www”. As chaves de classificação compostas usam um número limitado de caracteres do prefixo, o que resulta na duplicação de muitas chaves. As classificações intercaladas usam um esquema de compactação interna para valores de mapas de zona que lhes permite melhor distinção entre valores de coluna que possuem um prefixo comum longo.
Ao migrar clusters provisionados do Amazon Redshift para o Amazon Redshift Serverless, o Redshift converte tabelas com chaves de classificação intercaladas e DISTSTYLE KEY em chaves de classificação compostas. O DISTSTYLE não é alterado. Para obter mais informações sobre estilos de distribuição, consulte Trabalhar com estilos de distribuição de dados.
VACUUM REINDEX
À medida que você adiciona linhas a uma tabela classificada que já contém dados, a performance pode deteriorar-se com o tempo. Essa deterioração ocorre para classificações compostas e classificações intercaladas, mas tem um efeito maior em tabelas intercaladas. Um VACUUM restaura a ordem de classificação, mas a operação pode levar mais tempo para tabelas intercaladas, pois a mesclagem de novos dados intercalados pode envolver a modificação de cada bloco de dados.
Quando as tabelas são carregadas inicialmente, o Amazon Redshift analisa a distribuição dos valores nas colunas-chave de classificação e usa essas informações para intercalação ideal das colunas-chave de classificação. À medida que a tabela cresce, a distribuição dos valores nas colunas de chave de classificação pode mudar, ou desviar, especialmente com colunas de data ou timestamp. Se o desvio se tornar muito grande, a performance poderá ser afetada. Para reanalisar as chaves de classificação e restaurar a performance, execute o comando VACUUM com a palavra chave REINDEX. Como ele precisa realizar uma análise adicional dos dados, o comando VACUUM REINDEX pode demorar mais do que um comando VACUUM padrão para tabelas intercaladas. Para visualizar informações sobre desvio de distribuição de chaves e hora da última reindexação, consulte a exibição de sistema SVV_INTERLEAVED_COLUMNS.
Para obter mais informações sobre como determinar a frequência de execução do VACUUM e quando executar o VACUUM REINDEX, consulte Decidir sobre a reindexação.