总和 - AWS Glue

总和

根据给定表达式检查列中所有值的总和。

语法

Sum <COL_NAME> <EXPRESSION>
  • COL_NAME — 要根据其评估数据质量规则的列的名称。

    支持的列类型:字节、十进制、双精度、浮点数、整数、长整数、短整数

  • EXPRESSION — 针对规则类型响应运行以生成布尔值的表达式。有关更多信息,请参阅 Expressions

示例:总和

以下示例规则检查列中所有值的总和是否超过给定阈值。

Sum "transaction_total" > 500000 Sum "Salary" < 55600 where "Customer_ID < 10"

示例动态规则

  • Sum "ColA" > avg(last(10))

  • Sum "colA" between min(last(10)) - 1 and max(last(10)) + 1

零值行为

在计算总和时,Sum 规则将忽略含有 NULL 值的行。例如:

+---+-----------+ |id |units | +---+-----------+ |100|0 | |101|null | |102|20 | |103|null | |104|40 | +---+-----------+

units 的总和将不考虑第 101 行和第 103 行,结果为 (0 + 20 + 40) = 60。