Dépannage - Amazon Fraud Detector

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Dépannage

Les sections suivantes vous aident à résoudre les problèmes que vous pouvez rencontrer lors de l'utilisation d'Amazon Fraud Detector

Résoudre les problèmes liés aux données d'entraînement

Utilisez les informations de cette section pour diagnostiquer et résoudre les problèmes que vous pourriez rencontrer dans le volet de diagnostic de l'entraînement des modèles de la console Amazon Fraud Detector lorsque vous entraînez votre modèle.

Les problèmes affichés dans le volet de diagnostic de Model Training sont classés comme suit. L'obligation de régler le problème dépend de la catégorie du problème.

  • Error icon Erreur : entraîne l'échec de l'entraînement du modèle. Ces problèmes doivent être résolus pour que le modèle s'entraîne avec succès.

  • Warning icon Avertissement : entraîne la poursuite de l'entraînement du modèle, mais certaines variables peuvent être exclues du processus de formation. Consultez les instructions pertinentes dans cette section pour améliorer la qualité de votre ensemble de données.

  • Information icon Information (Info) - n'a aucun impact sur l'entraînement du modèle et toutes les variables sont utilisées pour l'entraînement. Nous vous recommandons de consulter les instructions pertinentes de cette section afin d'améliorer encore la qualité de votre jeu de données et les performances de votre modèle.

Taux de fraude instable dans l'ensemble de données donné

Type de problème : Erreur

Description

Le taux de fraude dans les données fournies est trop instable dans le temps. Assurez-vous que votre fraude et vos événements légitimes sont échantillonnés de manière uniforme au fil du temps.

Cause

Cette erreur se produit si les fraudes et les événements légitimes de votre ensemble de données sont répartis de manière inégale et proviennent de plages horaires différentes. Le processus de formation du modèle Amazon Fraud Detector échantillonne et partitionne votre ensemble de données en fonction de EVENT_TIMESTAMP. Par exemple, si votre ensemble de données contient des événements de fraude extraits des 6 derniers mois, mais que seul le dernier mois d'événements légitimes est inclus, l'ensemble de données est considéré comme instable. Un jeu de données instable peut entraîner des biais dans l'évaluation des performances du modèle.

Solution

Assurez-vous de fournir les données relatives aux événements frauduleux et légitimes à partir du même créneau horaire afin que le taux de fraude ne change pas radicalement au fil du temps.

Données insuffisantes

  1. Type de problème : Erreur

    Description

    Moins de 50 lignes sont considérées comme des événements frauduleux. Assurez-vous que les événements frauduleux et légitimes dépassent le nombre minimum de 50 et réentraînez le modèle.

    Cause

    Cette erreur se produit si votre jeu de données contient moins d'événements considérés comme frauduleux que ce qui est requis pour l'entraînement du modèle. Amazon Fraud Detector nécessite au moins 50 événements frauduleux pour entraîner votre modèle.

    Solution

    Assurez-vous que votre ensemble de données inclut au moins 50 événements frauduleux. Vous pouvez vous en assurer en couvrant une période plus longue, si nécessaire.

  2. Type de problème : Erreur

    Description

    Moins de 50 lignes sont considérées comme des événements légitimes. Assurez-vous que les événements frauduleux et légitimes dépassent le seuil minimum de dollars et réentraînez le modèle.

    Cause

    Cette erreur se produit si votre jeu de données contient moins d'événements étiquetés comme légitimes que ce qui est requis pour l'entraînement du modèle. Amazon Fraud Detector nécessite au moins 50 événements légitimes pour entraîner votre modèle.

    Solution

    Assurez-vous que votre ensemble de données inclut au moins 50 événements légitimes. Vous pouvez vous en assurer en couvrant une période plus longue, si nécessaire.

  3. Type de problème : Erreur

    Description

    Le nombre d'entités uniques associées à la fraude est inférieur à 100. Envisagez d'inclure d'autres exemples d'entités frauduleuses afin d'améliorer les performances.

    Cause

    Cette erreur se produit si votre jeu de données contient moins d'entités présentant des événements frauduleux que ce qui est requis pour la formation du modèle. Le modèle Transaction Fraud Insights (TFI) nécessite au moins 100 entités présentant des cas de fraude pour garantir une couverture maximale de l'espace frauduleux. Le modèle risque de ne pas bien se généraliser si tous les événements de fraude sont réalisés par un petit groupe d'entités.

    Solution

    Assurez-vous que votre ensemble de données inclut au moins 100 entités présentant des événements frauduleux. Vous pouvez vous assurer que cela couvre une période plus longue, si nécessaire.

  4. Type de problème : Erreur

    Description

    Le nombre d'entités uniques associées à des entités légitimes est inférieur à 100. Envisagez d'inclure d'autres exemples d'entités légitimes afin d'améliorer les performances.

    Cause

    Cette erreur se produit si votre jeu de données contient moins d'entités présentant des événements légitimes que ce qui est requis pour l'entraînement du modèle. Le modèle Transaction Fraud Insights (TFI) nécessite au moins 100 entités présentant des événements légitimes pour garantir une couverture maximale de l'espace frauduleux. Le modèle risque de ne pas bien se généraliser si tous les événements légitimes sont réalisés par un petit groupe d'entités.

    Solution

    Assurez-vous que votre ensemble de données inclut au moins 100 entités présentant des événements légitimes. Vous pouvez vous assurer que cela couvre une période plus longue, si nécessaire.

  5. Type de problème : Erreur

    Description

    Le jeu de données contient moins de 100 lignes. Assurez-vous qu'il y a plus de 100 lignes dans le jeu de données total et qu'au moins 50 lignes sont considérées comme frauduleuses.

    Cause

    Cette erreur se produit si votre ensemble de données contient moins de 100 enregistrements. Amazon Fraud Detector a besoin de données provenant d'au moins 100 événements (enregistrements) de votre ensemble de données pour l'entraînement des modèles.

    Solution

    Assurez-vous que votre jeu de données contient des données provenant de plus de 100 événements.

Valeurs EVENT_LABEL manquantes ou différentes

  1. Type de problème : Erreur

    Description

    Plus de 1 % de votre colonne EVENT_LABEL sont nulles ou sont des valeurs autres que celles définies dans la configuration du modèle. $label_values Assurez-vous qu'il manque moins de 1 % de valeurs dans votre colonne EVENT_LABEL et que les valeurs sont celles définies dans la configuration du modèle. $label_values

    Cause

    Cette erreur se produit pour l'une des raisons suivantes :

    • Plus de 1 % des enregistrements du fichier CSV contenant vos données d'entraînement comportent des valeurs manquantes dans la colonne EVENT_LABEL.

    • Plus de 1 % des enregistrements du fichier CSV contenant vos données d'entraînement contiennent des valeurs dans la colonne EVENT_LABEL différentes de celles associées à votre type d'événement.

    Le modèle Online Fraud Insights (OFI) exige que la colonne EVENT_LABEL de chaque enregistrement soit remplie avec l'une des étiquettes associées à votre type d'événement (ou mappées). CreateModelVersion

    Solution

    Si cette erreur est due à l'absence de valeurs EVENT_LABEL, pensez à attribuer des étiquettes appropriées à ces enregistrements ou à supprimer ces enregistrements de votre ensemble de données. Si cette erreur est due au fait que les étiquettes de certains enregistrements ne figurent pas dans la label_values liste, assurez-vous d'ajouter toutes les valeurs de la colonne EVENT_LABEL aux étiquettes du type d'événement et de les associer à des valeurs frauduleuses ou légitimes (fraude, légitimité) lors de la création du modèle.

  2. Type de problème : Informations

    Description

    Votre colonne EVENT_LABEL contient des valeurs nulles ou des valeurs d'étiquette autres que celles définies dans la configuration du modèle. $label_values Ces valeurs incohérentes ont été converties en « valeurs non frauduleuses » avant la formation.

    Cause

    Vous obtenez ces informations pour l'une des raisons suivantes :

    • Moins de 1 % des enregistrements du fichier CSV contenant vos données d'entraînement comportent des valeurs manquantes dans la colonne EVENT_LABEL

    • Moins de 1 % des enregistrements du fichier CSV contenant vos données d'entraînement contiennent des valeurs dans la colonne EVENT_LABEL différentes de celles associées à votre type d'événement.

    Dans les deux cas, le modèle de formation sera couronné de succès. Toutefois, les valeurs d'étiquette des événements pour lesquels des valeurs d'étiquette sont manquantes ou non mappées sont converties en valeurs légitimes. Si vous considérez qu'il s'agit d'un problème, suivez la solution ci-dessous.

    Solution

    Si des valeurs EVENT_LABEL sont manquantes dans votre ensemble de données, pensez à supprimer ces enregistrements de votre ensemble de données. Si les valeurs fournies pour ces EVENT_LABELS ne sont pas mappées, assurez-vous que toutes ces valeurs sont mappées de manière frauduleuse ou légitime (fraude, légitime) pour chaque événement.

Valeurs EVENT_TIMESTAMP manquantes ou incorrectes

  1. Type de problème : Erreur

    Description

    Votre ensemble de données d'entraînement contient EVENT_TIMESTAMP avec des horodatages non conformes aux formats acceptés. Assurez-vous que le format est l'un des formats de date/horodatage acceptés.

    Cause

    Cette erreur se produit si la colonne EVENT_TIMESTAMP contient une valeur non conforme aux formats d'horodatage pris en charge par Amazon Fraud Detector.

    Solution

    Assurez-vous que les valeurs fournies pour la colonne EVENT_TIMESTAMP sont conformes aux formats d'horodatage pris en charge. S'il manque des valeurs dans la colonne EVENT_TIMESTAMP, vous pouvez soit les remplacer par des valeurs utilisant le format d'horodatage pris en charge, soit envisager de supprimer complètement l'événement au lieu de saisir des chaînes telles que, ou. none null missing

  2. Type de problème : Erreur

    Votre ensemble de données d'entraînement contient EVENT_TIMESTAMP avec des valeurs manquantes. Assurez-vous qu'il n'y a aucune valeur manquante.

    Cause

    Cette erreur se produit si des valeurs sont manquantes dans la colonne EVENT_TIMESTAMP de votre ensemble de données. Amazon Fraud Detector exige que la colonne EVENT_TIMESTAMP de votre ensemble de données contienne des valeurs.

    Solution

    Assurez-vous que la colonne EVENT_TIMESTAMP de votre ensemble de données contient des valeurs et que ces valeurs sont conformes aux formats d'horodatage pris en charge. S'il manque des valeurs dans la colonne EVENT_TIMESTAMP, vous pouvez soit les remplacer par des valeurs utilisant le format d'horodatage pris en charge, soit envisager de supprimer complètement l'événement au lieu de saisir des chaînes telles que, ou. none null missing

Données non ingérées

Type de problème : Erreur

Description

Aucun événement ingéré n'a été trouvé pour l'entraînement, veuillez vérifier votre configuration d'entraînement.

Cause

Cette erreur se produit si vous créez un modèle avec des données d'événements stockées avec Amazon Fraud Detector mais que vous n'avez pas importé votre ensemble de données dans Amazon Fraud Detector avant de commencer à entraîner votre modèle.

Solution

Utilisez l'opération d'SendEventAPI, l'opération d'CreateBatchImportJobAPI ou la fonctionnalité d'importation par lots dans la console Amazon Fraud Detector pour d'abord importer les données de vos événements, puis entraîner votre modèle. Voir Ensembles de données d'événements stockés pour plus d'informations.

Note

Nous vous recommandons d'attendre 10 minutes après avoir fini d'importer vos données avant de les utiliser pour entraîner votre modèle.

Vous pouvez utiliser la console Amazon Fraud Detector pour vérifier le nombre d'événements déjà enregistrés pour chaque type d'événement. Consultez la section Affichage des statistiques de vos événements enregistrés pour plus d'informations.

Variables insuffisantes

Type de problème : Erreur

Description

L'ensemble de données doit contenir au moins 2 variables adaptées à l'entraînement.

Cause

Cette erreur se produit si votre ensemble de données contient moins de 2 variables adaptées à l'entraînement du modèle. Amazon Fraud Detector considère qu'une variable convient à la formation des modèles uniquement si elle passe toutes les validations. Si la validation d'une variable échoue, elle est exclue de l'entraînement du modèle et un message s'affiche dans le diagnostic de l'entraînement du modèle.

Solution

Assurez-vous que votre ensemble de données comporte au moins deux variables remplies de valeurs et que toutes les validations de données ont été validées. Notez que la ligne de métadonnées d'événement dans laquelle vous avez fourni les en-têtes de colonne (EVENT_TIMESTAMP, EVENT_ID, ENTITY_ID, EVENT_LABEL, etc.) n'est pas considérée comme une variable.

Type de variable manquant ou incorrect

Type de problème : Avertissement

Description

Le type de données attendu pour $variable_name est NUMERIC. Passez en revue et mettez $variable_name à jour votre jeu de données et réentraînez le modèle.

Cause

Cet avertissement s'affiche si une variable est définie en tant que variable NUMERIC, mais que dans l'ensemble de données, elle contient des valeurs qui ne peuvent pas être converties en NUMERIC. Par conséquent, cette variable est exclue de l'entraînement du modèle.

Solution

Si vous souhaitez la conserver sous forme de variable NUMÉRIQUE, assurez-vous que les valeurs que vous fournissez peuvent être converties en nombres flottants. Notez que si la variable contient des valeurs manquantes, ne les remplissez pas avec des chaînes telles que nonenenull, oumissing. Si la variable contient des valeurs non numériques, recréez-la en tant que variable de type CATEGORICAL ou FREE_FORM_TEXT.

Valeurs de variables manquantes

Type de problème : Avertissement

Description

Des $threshold valeurs supérieures à $variable_name sont absentes de votre jeu de données d'entraînement. Envisagez de modifier $variable_name votre ensemble de données et de vous entraîner à nouveau pour améliorer les performances.

Cause

Cet avertissement s'affiche si la variable spécifiée est supprimée en raison d'un trop grand nombre de valeurs manquantes. Amazon Fraud Detector autorise les valeurs manquantes pour une variable. Cependant, si une variable comporte trop de valeurs manquantes, elle ne contribue pas beaucoup au modèle et cette variable est supprimée lors de l'apprentissage du modèle.

Solution

Tout d'abord, vérifiez que ces valeurs manquantes ne sont pas dues à des erreurs de collecte et de préparation des données. S'il s'agit d'erreurs, vous pouvez envisager de les supprimer de votre formation sur les modèles. Toutefois, si vous pensez que ces valeurs manquantes sont utiles et que vous souhaitez conserver cette variable, vous pouvez remplir manuellement les valeurs manquantes avec une constante à la fois dans l'apprentissage du modèle et dans l'inférence en temps réel.

Valeurs de variables uniques insuffisantes

Type de problème : Avertissement

Description

Le nombre de valeurs uniques de $variable_name est inférieur à 100. Passez en revue et mettez $variable_name à jour votre jeu de données et réentraînez le modèle.

Cause

Cet avertissement s'affiche si le nombre de valeurs uniques de la variable spécifiée est inférieur à 100. Les seuils varient en fonction du type de variable. Avec très peu de valeurs uniques, le jeu de données risque de ne pas être suffisamment général pour couvrir l'espace caractéristique de cette variable. Par conséquent, le modèle risque de ne pas bien se généraliser sur les prévisions en temps réel.

Solution

Tout d'abord, assurez-vous que la distribution des variables est représentative du trafic commercial réel. Ensuite, vous pouvez soit adopter des variables plus fines avec une cardinalité plus élevée, par exemple en les utilisant full_customer_name au lieu de first_name et last_name séparément, soit changer le type de variable en CATEGORICAL, ce qui permet une cardinalité plus faible.

Expression de variable incorrecte

  1. Type de problème : Informations

    Description

    Plus de 50 % des $email_variable_name valeurs ne correspondent pas à l'expression régulière attendue http://emailregex.com. Envisagez de modifier $email_variable_name votre ensemble de données et de vous entraîner à nouveau pour améliorer les performances.

    Cause

    Ces informations sont affichées si plus de 50 % des enregistrements de votre ensemble de données contiennent des valeurs d'e-mail qui ne sont pas conformes à une expression d'e-mail régulière et ne sont donc pas validées.

    Solution

    Formatez les valeurs des variables d'e-mail conformément à l'expression régulière. Si des valeurs d'e-mail sont manquantes, nous vous recommandons de les laisser vides au lieu de les remplir avec des chaînes telles que nonenull, oumissing.

  2. Type de problème : Informations

    Description

    Plus de 50 % des $IP_variable_name valeurs ne correspondent pas à l'expression régulière pour les adresses IPv4 ou IPv6 https://digitalfortress.tech/tricks/top-15 - /. commonly-used-regex Envisagez de modifier $IP_variable_name votre ensemble de données et de vous entraîner à nouveau pour améliorer les performances.

    Cause

    Ces informations sont affichées si plus de 50 % des enregistrements de votre ensemble de données contiennent des valeurs IP non conformes à une expression IP régulière et ne sont donc pas validées.

    Solution

    Formatez les valeurs IP conformément à l'expression régulière. Si des valeurs IP sont manquantes, nous vous recommandons de les laisser vides au lieu de les remplir avec des chaînes telles que nonenull, oumissing.

  3. Type de problème : Informations

    Description

    Plus de 50 % des $phone_variable_name valeurs ne correspondent pas à l'expression régulière de base du téléphone /$pattern/. Envisagez de modifier $phone_variable_name votre ensemble de données et de vous entraîner à nouveau pour améliorer les performances.

    Cause

    Ces informations sont affichées si plus de 50 % des enregistrements de votre ensemble de données contiennent des numéros de téléphone qui ne correspondent pas à une expression de numéro de téléphone normale et ne sont donc pas validés.

    Solution

    Formatez les numéros de téléphone conformément à l'expression régulière. S'il manque des numéros de téléphone, nous vous recommandons de les laisser vides au lieu de les remplir avec des chaînes telles que nonenull, oumissing.

Entités uniques insuffisantes

Type de problème : Informations

Description

Le nombre d'entités uniques est inférieur à 1 500. Envisagez d'inclure davantage de données pour améliorer les performances.

Cause

Ces informations sont affichées si votre jeu de données comporte un nombre d'entités uniques inférieur au nombre recommandé. Le modèle Transaction Fraud Insights (TFI) utilise à la fois des agrégats de séries chronologiques et des fonctionnalités de transaction génériques pour fournir les meilleures performances. Si votre ensemble de données comporte trop peu d'entités uniques, il est possible que la plupart de vos données génériques, telles que IP_ADDRESS, EMAIL_ADDRESS, n'aient pas de valeurs uniques. Il existe alors un risque que ce jeu de données ne soit pas suffisamment général pour couvrir l'espace caractéristique de cette variable. Par conséquent, le modèle risque de ne pas bien se généraliser aux transactions provenant de nouvelles entités.

Solution

Incluez davantage d'entités. Étendez la plage de temps de vos données d'entraînement, si nécessaire.