As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Verificações de qualidade de dados
A qualidade dos dados é parte integrante, mas muitas vezes negligenciada, do processo de limpeza de dados. O diagrama a seguir mostra como as verificações de qualidade de dados se encaixam no ciclo de vida de automação e controle de acesso da engenharia de dados.
A tabela a seguir fornece uma visão geral das diferentes soluções de qualidade de dados com base no caso de uso.
Caso de uso | Solução | Exemplo |
Solução sem código para adicionar condições de qualidade em nível de coluna ou de tabela | Verifica se todos os valores da coluna estão entre 1 e 12, ou se uma tabela ou coluna está vazia | |
Código personalizado adicionado a uma tarefa do AWS Glue ou a uma solução sem código (em versão prévia) para adicionar condições de qualidade em nível de coluna ou de tabela | Verifica se a coluna não | |
Verificações personalizadas | Verifica se o valor da coluna A é sempre maior que o valor correspondente da coluna B e da coluna C, ou se o valor da coluna | |
Solução sofisticada com um relatório de métricas, validação de restrições e sugestões de restrições | Verifica se |