UniqueValueRatio
特定の表現を参照して、列での一意な値の比率をチェックします。個別値の比率は、列内の一意の値の個数を、個別なすべての値の個数で割ったものです。一意の値とは 1 つだけ含まれる値であり、一方、個別の値は少なくとも 1 つ含まれている値です。
例えば、[a, a, b]
のセットには 1 つの一意の値 (b
) と 2 つの個別の値 (a
と b
) が含まれています。したがって、このセットの一意な値の比率は ½ = 0.5 です。
[Syntax] (構文)
UniqueValueRatio
<COL_NAME>
<EXPRESSION>
COL_NAME – データ品質ルールを評価する対象となる列の名前。
列でサポートされている型: 任意の型
EXPRESSION – ルールタイプの応答に対して実行し、論地値を生成するための式。詳細については、「表現」を参照してください。
例: 一意な値の比率
この例では、列の一意な値の比率を、値の範囲と比較します。
UniqueValueRatio "test_score" between 0 and 0.5 UniqueValueRatio "Customer_ID" between 0 and 0.9 where "Customer_ID < 10"
動的ルールの例
UniqueValueRatio "colA" > avg(last(10))
UniqueValueRatio "colA" <= index(last(10),2) + std(last(5))