As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Ativando o otimizador de compactação
Você pode usar: AWS Glue console, AWS CLI, ou AWS APIpara habilitar a compactação de suas tabelas Apache Iceberg no AWS Glue Catálogo de dados. Para novas tabelas, você pode escolher o Apache Iceberg como formato de tabela e ativar a compactação ao criar a tabela. A compactação está desabilitada por padrão para novas tabelas.
- Console
-
Para habilitar a compactação
-
Abra as AWS Glue use o console https://console.aws.amazon.com/glue/e faça login como administrador do data lake, criador da tabela ou usuário que recebeu as lakeformation:GetDataAccess
permissões glue:UpdateTable
e na tabela.
-
No painel de navegação, em catálogo de dados, escolha Tabelas.
Na página Tabelas, escolha uma tabela em formato de tabela aberta para a qual você deseja habilitar a compactação e, em seguida, no menu Ações, escolha Otimização e, em seguida, escolha Habilitar.
Você também pode ativar a compactação selecionando a guia Otimização da tabela na página de detalhes da tabela. Escolha a guia Otimização de tabela na seção inferior da página e escolha Ativar compactação.
A opção Ativar otimização também está disponível quando você cria uma nova tabela Iceberg no Catálogo de Dados.
-
Na página Habilitar otimização, escolha Compactação em Opções de otimização.
-
Em seguida, selecione uma IAM função no menu suspenso com as permissões mostradas na Pré-requisitos de otimização de tabelas seção.
Você também pode escolher a opção Criar uma nova IAM função para criar uma função personalizada com as permissões necessárias para executar a compactação.
Siga as etapas abaixo para atualizar uma IAM função existente:
-
Para atualizar a política de permissões da IAM função, no IAM console, acesse a IAM função que está sendo usada para executar a compactação.
-
Na seção Adicionar permissões, escolha Criar política. Na janela recém-aberta do navegador, crie uma nova política para usar com sua função.
Na página Criar política, escolha a guia JSON
. Copie o JSON código mostrado nos Pré-requisitos no campo do editor de políticas.
-
Escolha Habilitar otimização.
- AWS CLI
-
O exemplo a seguir mostra como habilitar a compactação. Substitua o ID da conta por um válido AWS ID da conta. Substitua o nome do banco de dados e o nome da tabela pelo nome real da tabela do Iceberg e pelo nome do banco de dados. Substitua roleArn
o pelo AWS Nome do recurso (ARN) da IAM função e nome da IAM função que tem as permissões necessárias para executar a compactação.
aws glue create-table-optimizer \
--catalog-id 123456789012
\
--database-name iceberg_db
\
--table-name iceberg_table
\
--table-optimizer-configuration '{"roleArn":"arn:aws:iam::123456789012
:role/optimizer_role
", "enabled":'true'}' \
--type compaction
- AWS API
-
Chame a operação CreateTableOptimizer
para ativar a compactação de uma tabela.
Depois de ativar a compactação, a guia Otimização de tabela mostra os seguintes detalhes da compactação (após aproximadamente 15 a 20 minutos):
- Horário de início
-
A hora em que o processo de compactação iniciou no Catálogo de Dados. O valor é um registro de data e hora. UTC
- Horário de término
-
A hora em que o processo de compactação terminou no catálogo de dados. O valor é um registro de data e hora. UTC
- Status
-
O status de execução da compactação. Os valores são sucesso ou falha.
- Arquivos compactados
Número total de arquivos compactados.
- Bytes compactados
-
Número total de bytes compactados.