平均値 - AWS Glue

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

平均値

列内にあるすべての値の mean 値 (平均) が、特定の表現に適合するかどうかを確認します。

[Syntax] (構文)

Mean <COL_NAME> <EXPRESSION>
  • COL_NAME – データ品質ルールを評価する対象となる列の名前。

    列でサポートされている型: Byte (バイト)、Decimal (十進数)、Double (倍精度浮動小数点数)、Float (浮動小数点数)、Integer (整数)、Long (整数)、Short (整数)

  • EXPRESSION – ルールタイプの応答に対して実行し、論地値を生成するための式。詳細については、「表現」を参照してください。

例: 平均値

次のルール例では、列のすべての値の平均が、しきい値を超えているかどうかを確認します。

Mean "Star_Rating" > 3 Mean "Salary" < 6200 where "Customer_ID < 10"

動的ルールの例

  • Mean "colA" > avg(last(10)) + std(last(2))

  • Mean "colA" between min(last(5)) - 1 and max(last(5)) + 1

Null 動作

Mean ルールは、平均の計算で NULL 値を含む行を無視します。例:

+---+-----------+ |id |units | +---+-----------+ |100|0 | |101|null | |102|20 | |103|null | |104|40 | +---+-----------+

units 列の平均は (0 + 20 + 40) / 3 = 20 になります。行 101 および 103 はこの計算の対象になりません。