Sum - AWS Glue

Sum

Comprueba la suma de todos los valores de una columna con respecto a una expresión determinada.

Sintaxis

Sum <COL_NAME> <EXPRESSION>
  • COL_NAME: el nombre de la columna con la que quiere evaluar la regla de la calidad de los datos.

    Tipos de columnas compatibles: byte, decimal, doble, flotante, entero, largo, corto

  • EXPRESSION: una expresión que se ejecuta en función de la respuesta del tipo de regla para producir un valor booleano. Para obtener más información, consulte Expressions.

Ejemplo: suma

La siguiente regla de ejemplo comprueba si la suma de todos los valores de una columna supera un umbral dado.

Sum "transaction_total" > 500000 Sum "Salary" < 55600 where "Customer_ID < 10"

Muestra de reglas dinámicas

  • Sum "ColA" > avg(last(10))

  • Sum "colA" between min(last(10)) - 1 and max(last(10)) + 1

Comportamiento nulo

La regla Sum ignorará las filas con valores NULL al momento de calcular la suma. Por ejemplo:

+---+-----------+ |id |units | +---+-----------+ |100|0 | |101|null | |102|20 | |103|null | |104|40 | +---+-----------+

La suma de la columna units no considerará las filas 101 y 103 y su resultado será (0 + 20 + 40) = 60.