StandardDeviation - AWS Glue

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

StandardDeviation

根據指定運算式檢查欄中所有值的標準差。

語法

StandardDeviation <COL_NAME> <EXPRESSION>
  • COL_NAME – 您要評估資料品質規則的欄名稱。

    支援的欄類型:位元組、小數、雙精度浮點數、浮點數、整數、長整數、短整數

  • EXPRESSION – 針對規則類型回應執行的運算式,以產生布林值。如需詳細資訊,請參閱表達式

範例:標準差

下列範例規則會檢查名為 colA 的欄中的值標準差是否小於指定值。

StandardDeviation "Star_Rating" < 1.5 StandardDeviation "Salary" < 3500 where "Customer_ID < 10"

動態規則範例

  • StandardDeviation "colA" > avg(last(10) + 0.1

  • StandardDeviation "colA" between min(last(10)) - 1 and max(last(10)) + 1

Null 行為

StandardDeviation 規則會忽略計算標準差時具有NULL值的資料列。例如:

+---+-----------+-----------+ |id |units1 |units2 | +---+-----------+-----------+ |100|0 |0 | |101|null |0 | |102|20 |20 | |103|null |0 | |104|40 |40 | +---+-----------+-----------+

資料欄的標準差units1不會考慮資料列 101 和 103,且結果為 16.33。資料欄的標準差units2將產生 16。