DistinctValuesCount - AWS Glue

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

DistinctValuesCount

根據指定運算式檢查欄中相異值的數目。

語法

DistinctValuesCount <COL_NAME> <EXPRESSION>
  • COL_NAME – 您要評估資料品質規則的欄名稱。

    支援的欄類型:任何欄類型

  • EXPRESSION – 針對規則類型回應執行的運算式,以產生布林值。如需詳細資訊,請參閱表達式

範例:相異欄值計數

下列範例規則會檢查名為 State 的欄是否包含 3 個以上的相異值。

DistinctValuesCount "State" > 3 DistinctValuesCount "Customer_ID" < 6 where "Customer_ID < 10"

動態規則範例

  • DistinctValuesCount "colA" between avg(last(10))-1 and avg(last(10))+1

  • DistinctValuesCount "colA" <= index(last(10),2) + std(last(5))