ストレージ用のイベントデータを準備する - Amazon Fraud Detector

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

ストレージ用のイベントデータを準備する

Amazon Fraud Detector の内部に保存されるイベントデータは、Event Typeリソースレベルで保存されます。したがって、同じイベントからのすべてのイベントデータは 1 つの に保存されますEvent Type。保存されたイベントは、後で新しいモデルをトレーニングしたり、既存のモデルを再トレーニングしたりするために使用できます。保存されたイベントデータを使用してモデルをトレーニングする場合、必要に応じてイベントの時間範囲を指定して、トレーニングデータセットのサイズを制限できます。

Amazon Fraud Detector コンソール、 SendEvent API、または CreateBatchImportJob API を使用して Amazon Fraud Detector にデータを保存するたびに、Amazon Fraud Detector は保存前にデータを検証します。データが検証に失敗した場合、イベントデータは保存されません。

Amazon Fraud Detector でデータを内部的に保存するための前提条件

  • イベントデータが検証に合格し、データセットが正常に保存されるようにするには、データモデルエクスプローラーが提供するインサイトを使用してデータセットを準備していることを確認してください。

  • Amazon Fraud Detector に保存するイベントデータのイベントタイプを作成しました。まだの場合は、「Create an event type」の指示に従ってください。

スマートデータ検証

バッチインポート用に Amazon Fraud Detector コンソールでデータセットをアップロードすると、Amazon Fraud Detector はスマートデータ検証 (SDV) を使用してデータセットを検証してから、データをインポートします。SDV は、アップロードされたデータファイルをスキャンして、欠落データ、誤った形式やデータ型などの問題を特定します。SDV は、データセットの検証に加えて、特定されたすべての問題を一覧表示し、最も影響の大きい問題を修正するためのアクションを提案する検証レポートも提供します。SDV によって特定された問題の一部は重要であり、Amazon Fraud Detector がデータセットを正常にインポートする前に対処する必要があります。詳細については、「スマートデータ検証レポート」を参照してください。

SDV は、ファイルレベルとデータ (行) レベルでデータセットを検証します。ファイルレベルでは、SDV はデータファイルをスキャンし、ファイルにアクセスするための不適切なアクセス許可、誤ったファイルサイズ、ファイル形式、ヘッダー (イベントメタデータとイベント変数) などの問題を特定します。データレベルでは、SDV は各イベントデータ (行) をスキャンし、誤ったデータ形式、データの長さ、タイムスタンプ形式、null 値などの問題を特定します。

スマートデータ検証は現在 Amazon Fraud Detector コンソールでのみ使用でき、検証はデフォルトでオンになっています。データセットをインポートする前に Amazon Fraud Detector でスマートデータ検証を使用しない場合は、データセットをアップロードするときに Amazon Fraud Detector コンソールで検証をオフにします。

APIs または AWS SDK の使用時に保存されたデータを検証する

SendEvent、、GetEventPredictionまたは CreateBatchImportJob API オペレーションを介してイベントをアップロードする場合、Amazon Fraud Detector は以下を検証します。

  • そのイベントタイプの EventIngestion 設定が ENABLED であること。

  • イベントのタイムスタンプは更新できません。繰り返しイベント ID および異なる EVENT_TIMESTAMP を持つイベントは、エラーとして扱われます。

  • 変数の名前と値は、期待される形式と一致します。詳細については、「変数の作成」を参照してください。

  • 必須変数には値が入力されます。

  • すべてのイベントタイムスタンプは 18 か月を超えず、今後もそうなることはありません。