準備儲存的事件資料 - Amazon Fraud Detector

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

準備儲存的事件資料

Amazon Fraud Detector 內部存放的事件資料會存放在Event Type資源層級。因此,來自相同事件的所有事件資料都會存放在單一 中Event Type。儲存的事件稍後可用於訓練新模型或重新訓練現有模型。使用儲存的事件資料訓練模型時,您可以選擇指定事件的時間範圍,以限制訓練資料集的大小。

每次使用 Amazon Fraud Detector 主控台、SendEventAPI 或 CreateBatchImportJob API 將資料存放在 Amazon Fraud Detector 時,Amazon Fraud Detector 都會在儲存前驗證您的資料。如果您的資料驗證失敗,則不會儲存事件資料。

使用 Amazon Fraud Detector 在內部儲存資料的先決條件

  • 為了確保您的事件資料通過驗證且資料集已成功儲存,請確定您已使用 Data Model Explorer 提供的洞見來準備資料集。

  • 為您要使用 Amazon Fraud Detector 存放的事件資料建立事件類型。如果您尚未完成,請遵循指示來建立事件類型

智慧資料驗證

當您在 Amazon Fraud Detector 主控台中上傳資料集進行批次匯入時,Amazon Fraud Detector 會使用智慧資料驗證 (SDV) 在匯入資料之前驗證資料集。SDV 會掃描上傳的資料檔案,並識別遺失資料、格式不正確或資料類型等問題。除了驗證資料集之外,SDV 還提供驗證報告,列出已識別的所有問題,並建議採取動作來修正最具影響力的問題。SDV 識別的一些問題可能很關鍵,必須先解決,Amazon Fraud Detector 才能成功匯入您的資料集。如需詳細資訊,請參閱智慧資料驗證報告

SDV 會在檔案層級和資料 (資料列) 層級驗證您的資料集。在檔案層級,SDV 會掃描您的資料檔案,並識別存取檔案的許可不足、檔案大小、檔案格式和標頭 (事件中繼資料和事件變數) 等問題。在資料層級,SDV 會掃描每個事件資料 (資料列),並識別不正確的資料格式、資料長度、時間戳記格式和 null 值等問題。

智慧資料驗證目前僅適用於 Amazon Fraud Detector 主控台,且預設會開啟驗證。如果您不希望 Amazon Fraud Detector 在匯入資料集之前使用智慧資料驗證,請在上傳資料集時關閉 Amazon Fraud Detector 主控台中的驗證。

使用 APIs或 AWS SDK 驗證儲存的資料

透過 SendEventGetEventPredictionCreateBatchImportJob API 操作上傳事件時,Amazon Fraud Detector 會驗證下列項目:

  • 該事件類型的 EventIngestion 設定為 ENABLED。

  • 無法更新事件時間戳記。具有重複事件 ID 和不同 EVENT_TIMESTAMP 的事件會被視為錯誤。

  • 變數名稱和值符合其預期的格式。如需詳細資訊,請參閱 建立變數

  • 所需的變數會填入值。

  • 所有事件時間戳記都不會超過 18 個月,也不會在未來。