DetectAnomalies - AWS Glue

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

DetectAnomalies

检测给定数据质量规则的异常。每次执行 DetectAnomalies 规则都会导致保存给定规则的评估值。当收集到足够的数据时,异常检测算法会获取该给定规则的所有历史数据,并运行异常检测。检测到异常时,DetectAnomalies 规则失败。可通过观测值获得有关检测到哪些异常的更多信息。

语法

DetectAnomalies <RULE_NAME> <RULE_PARAMETERS>

RULE_NAME – 要根据其评估和检测异常的规则的名称。支持的规则:

  • "RowCount"

  • "Completeness"

  • "Uniqueness"

  • "Mean"

  • "Sum"

  • "StandardDeviation"

  • "Entropy"

  • "DistinctValuesCount"

  • "UniqueValueRatio"

  • "ColumnLength"

  • "ColumnValues"

  • "ColumnCorrelation"

  • "CustomSQL"

  • "ColumnCount"

RULE_PARAMETERS– 有些规则需要其他参数才能运行。请参阅给定的规则文档以了解所需的参数。

示例:RowCount 异常

例如,如果想检测 RowCount 异常,我们会提供 rowCount 作为规则名称。

DetectAnomalies "RowCount"

示例:ColumnLength 异常

例如,如果想检测 ColumnLength 异常,我们会提供 ColumnLength 作为规则名称和列名。

DetectAnomalies "ColumnLength" "id"