DistinctValuesCount - AWS Glue

DistinctValuesCount

列内の異なる値の数を、指定された式に対応させて確認します。

[Syntax] (構文)

DistinctValuesCount <COL_NAME> <EXPRESSION>
  • COL_NAME – データ品質ルールを評価する対象となる列の名前。

    列でサポートされている型: 任意の型

  • EXPRESSION – ルールタイプの応答に対して実行し、論地値を生成するための式。詳細については、「表現」を参照してください。

例: 列内の異なる値のカウント

次のルール例では、State という名前の列に 3 つ以上の異なる値が含まれていることを確認します。

DistinctValuesCount "State" > 3 DistinctValuesCount "Customer_ID" < 6 where "Customer_ID < 10"

動的ルールの例

  • DistinctValuesCount "colA" between avg(last(10))-1 and avg(last(10))+1

  • DistinctValuesCount "colA" <= index(last(10),2) + std(last(5))