Préparer les données d'événements pour le stockage - Amazon Fraud Detector

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Préparer les données d'événements pour le stockage

Les données d'événements stockées en interne avec Amazon Fraud Detector sont stockées au niveauEvent Type des ressources. Ainsi, toutes les données d'événement provenant du même événement sont stockées dans un seul événementEvent Type. Les événements stockés peuvent ensuite être utilisés pour entraîner un nouveau modèle ou réentraîner un modèle existant. Lorsque vous entraînez un modèle à l'aide des données d'événements stockées, vous pouvez éventuellement spécifier une plage temporelle d'événements afin de limiter la taille de votre jeu de données d'entraînement.

Chaque fois que vous stockez vos données dans Amazon Fraud Detector, à l'aide de la console Amazon Fraud Detector, de l'SendEventAPI ou de l'CreateBatchImportJobAPI, Amazon Fraud Detector valide vos données avant de les stocker. Si la validation de vos données échoue, les données de l'événement ne sont pas stockées.

Conditions requises pour stocker des données en interne avec Amazon Fraud Detector

  • Pour vous assurer que les données de vos événements passent la validation et que l'ensemble de données est correctement stocké, assurez-vous d'avoir utilisé les informations fournies par l'explorateur de modèles de données pour préparer votre ensemble de données.

  • Vous avez créé un type d'événement pour les données d'événement que vous souhaitez stocker avec Amazon Fraud Detector. Si ce n'est pas le cas, suivez les instructions pour créer un type d'événement.

Validation intelligente

Lorsque vous chargez votre ensemble de données dans la console Amazon Fraud Detector pour l'importer par lots, Amazon Fraud Detector utilise la validation intelligente des données (SDV) pour valider votre ensemble de données avant de les importer. SDV analyse le fichier de données chargé et identifie les problèmes tels que les données manquantes, le format ou les types de données incorrects. Outre la validation de votre ensemble de données, SDV fournit également un rapport de validation qui répertorie tous les problèmes identifiés et suggère des actions pour résoudre les problèmes les plus importants. Certains des problèmes identifiés par SDV peuvent être critiques et doivent être résolus avant qu'Amazon Fraud Detector puisse importer correctement votre jeu de données. Pour plus d'informations, veuillez consulter Rapport de validation des données intelligentes.

Le SDV valide votre ensemble de données au niveau du fichier et au niveau des données (lignes). Au niveau du fichier, SDV analyse votre fichier de données et identifie les problèmes tels que des autorisations d'accès inadéquates, une taille de fichier, un format de fichier et des en-têtes (métadonnées d'événements et variables d'événement) incorrects. Au niveau des données, SDV analyse les données de chaque événement (ligne) et identifie les problèmes tels que le format de données, la longueur des données, le format d'horodatage et les valeurs nulles incorrects.

La validation intelligente des données est actuellement disponible uniquement dans la console Amazon Fraud Detector et la validation est activée par défaut. Si vous ne souhaitez pas qu'Amazon Fraud Detector utilise la validation intelligente des données avant d'importer votre jeu de données, désactivez la validation dans la console Amazon Fraud Detector lorsque vous chargez votre jeu de données.

Validation des données stockées lors de l'utilisation d'API ou d'unAWS SDK

Lorsque vous chargez des événements via l'opérationSendEventGetEventPrediction, ouCreateBatchImportJob API, Amazon Fraud Detector valide les éléments suivants :

  • Le EventIngestion paramètre pour ce type d'événement est ACTIVÉ.

  • Les horodatages des événements ne peuvent pas être mis à jour. Un événement avec un ID d'événement répété et un EVENT_TIMESTAMP différent sera traité comme une erreur.

  • Les noms et les valeurs des variables correspondent au format attendu. Pour de plus amples informations, consultez Création d'une variable.

  • Les variables obligatoires sont renseignées avec une valeur.

  • Tous les horodatages des événements ne datent pas de plus de 18 mois et ne sont pas future.