Média
Verifica se o valor mediano (média) de uma coluna corresponde a uma determinada expressão.
Sintaxe
Mean
<COL_NAME>
<EXPRESSION>
COL_NAME: o nome da coluna em relação à qual você deseja avaliar a regra de qualidade de dados.
Tipos de coluna compatíveis: byte, decimal, duplo, flutuante, inteiro, longo, curto
EXPRESSION: uma expressão a ser executada na resposta do tipo de regra para produzir um valor booliano. Para ter mais informações, consulte Expressões.
Exemplo: valor médio
O exemplo de regra a seguir verifica se a média de todos os valores em uma coluna excede um limite.
Mean "Star_Rating" > 3 Mean "Salary" < 6200 where "Customer_ID < 10"
Exemplos de regras dinâmicas
Mean "colA" > avg(last(10)) + std(last(2))
Mean "colA" between min(last(5)) - 1 and max(last(5)) + 1
Comportamento nulo
A regra Mean
ignorará linhas com valores NULL
no cálculo da média. Por exemplo:
+---+-----------+ |id |units | +---+-----------+ |100|0 | |101|null | |102|20 | |103|null | |104|40 | +---+-----------+
A média da coluna units
será (0 + 20 + 40)/3 = 20. As linhas 101 e 103 não são consideradas nesse cálculo.