Gerar estatísticas de colunas para tabelas Iceberg
Siga estas etapas para configurar um cronograma para gerar estatísticas no Catálogo de Dados usando o AWS Glue console AWS CLI ou ou execute a StartColumnStatisticsTaskRunoperação.
Para gerar estatísticas de colunas
-
Faça login no AWS Glue console em https://console.aws.amazon.com/glue/
. -
Escolha Tabelas em Catálogo de Dados.
-
Escolha uma tabela Iceberg na lista.
-
Escolha Estatísticas de colunas, Gerar sob demanda no menu Ações.
Você também pode escolher o botão Gerar estatísticas na guia Estatísticas da coluna na seção inferior da página Tabelas.
-
Na página Gerar estatísticas, forneça os detalhes da geração de estatísticas. Siga as etapas 6 a 11 na Gerando estatísticas de colunas em um cronograma seção para configurar um cronograma para geração de estatísticas para tabelas Iceberg.
Você também pode optar por gerar estatísticas de coluna sob demanda seguindo as instruções na Geração de estatísticas de colunas sob demanda
nota
A opção de amostragem não está disponível para tabelas Iceberg.
AWS Glue calcula o número de valores distintos de cada coluna da tabela Iceberg para um novo arquivo Puffin comprometido com o ID de snapshot especificado em sua localização no Amazon S3.