DetectAnomalies - AWS Glue

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

DetectAnomalies

偵測指定資料品質規則的異常情況。每次執行 DetectAnomalies 規則都會為指定規則儲存評估值。當收集到足夠的資料時,異常偵測演算法會擷取該指定規則的所有歷史資料,並執行異常偵測。 DetectAnomalies 偵測到異常時,規則會失敗。可以從觀察中獲得偵測到的異常的更多資訊。

語法

DetectAnomalies <RULE_NAME> <RULE_PARAMETERS>

RULE_NAME:您希望評估和偵測異常的規則名稱。支援的規則:

  • "RowCount"

  • "Completeness"

  • "Uniqueness"

  • "Mean"

  • "Sum"

  • "StandardDeviation"

  • "Entropy"

  • "DistinctValuesCount"

  • "UniqueValueRatio"

  • "ColumnLength"

  • "ColumnValues"

  • "ColumnCorrelation"

  • 「自定義SQL」

  • "ColumnCount"

RULE_PARAMETERS:某些規則需要其他參數才能執行。請參閱指定的規則文件查看所需的參數。

範例:的異常 RowCount

例如,如果我們想要偵測 RowCount 異常,我們會以規則名稱的 RowCount 形式提供。

DetectAnomalies "RowCount"

範例:的異常 ColumnLength

例如,如果我們想要偵測 ColumnLength 異常,我們會以規則名稱和欄名稱的 ColumnLength 形式提供。

DetectAnomalies "ColumnLength" "id"