Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Dépannage
Les sections suivantes vous aident à résoudre les problèmes que vous pouvez rencontrer lors de l'utilisation d'Amazon Fraud Detector
Résoudre les problèmes liés aux données d'entraînement
Utilisez les informations de cette section pour diagnostiquer et résoudre les problèmes que vous pourriez rencontrer dans le volet de diagnostic de l'entraînement des modèles de la console Amazon Fraud Detector lorsque vous entraînez votre modèle.
Les problèmes affichés dans le volet de diagnostic de Model Training sont classés comme suit. L'obligation de régler le problème dépend de la catégorie du problème.
-
Erreur : entraîne l'échec de l'entraînement du modèle. Ces problèmes doivent être résolus pour que le modèle s'entraîne avec succès.
-
Avertissement : entraîne la poursuite de l'entraînement du modèle, mais certaines variables peuvent être exclues du processus de formation. Consultez les instructions pertinentes dans cette section pour améliorer la qualité de votre ensemble de données.
-
Information (Info) - n'a aucun impact sur l'entraînement du modèle et toutes les variables sont utilisées pour l'entraînement. Nous vous recommandons de consulter les instructions pertinentes de cette section afin d'améliorer encore la qualité de votre jeu de données et les performances de votre modèle.
Rubriques
- Taux de fraude instable dans l'ensemble de données donné
- Données insuffisantes
- Valeurs EVENT_LABEL manquantes ou différentes
- Valeurs EVENT_TIMESTAMP manquantes ou incorrectes
- Données non ingérées
- Variables insuffisantes
- Type de variable manquant ou incorrect
- Valeurs de variables manquantes
- Valeurs de variables uniques insuffisantes
- Expression de variable incorrecte
- Entités uniques insuffisantes
Taux de fraude instable dans l'ensemble de données donné
Type de problème : Erreur
Description
Le taux de fraude dans les données fournies est trop instable dans le temps. Assurez-vous que votre fraude et vos événements légitimes sont échantillonnés de manière uniforme au fil du temps.
Cause
Cette erreur se produit si les fraudes et les événements légitimes de votre ensemble de données sont répartis de manière inégale et proviennent de plages horaires différentes. Le processus de formation du modèle Amazon Fraud Detector échantillonne et partitionne votre ensemble de données en fonction de EVENT_TIMESTAMP. Par exemple, si votre ensemble de données contient des événements de fraude extraits des 6 derniers mois, mais que seul le dernier mois d'événements légitimes est inclus, l'ensemble de données est considéré comme instable. Un jeu de données instable peut entraîner des biais dans l'évaluation des performances du modèle.
Solution
Assurez-vous de fournir les données relatives aux événements frauduleux et légitimes à partir du même créneau horaire afin que le taux de fraude ne change pas radicalement au fil du temps.
Données insuffisantes
-
Type de problème : Erreur
Description
Moins de 50 lignes sont considérées comme des événements frauduleux. Assurez-vous que les événements frauduleux et légitimes dépassent le nombre minimum de 50 et réentraînez le modèle.
Cause
Cette erreur se produit si votre jeu de données contient moins d'événements considérés comme frauduleux que ce qui est requis pour l'entraînement du modèle. Amazon Fraud Detector nécessite au moins 50 événements frauduleux pour entraîner votre modèle.
Solution
Assurez-vous que votre ensemble de données inclut au moins 50 événements frauduleux. Vous pouvez vous en assurer en couvrant une période plus longue, si nécessaire.
-
Type de problème : Erreur
Description
Moins de 50 lignes sont considérées comme des événements légitimes. Assurez-vous que les événements frauduleux et légitimes dépassent le seuil minimum de dollars et réentraînez le modèle.
Cause
Cette erreur se produit si votre jeu de données contient moins d'événements étiquetés comme légitimes que ce qui est requis pour l'entraînement du modèle. Amazon Fraud Detector nécessite au moins 50 événements légitimes pour entraîner votre modèle.
Solution
Assurez-vous que votre ensemble de données inclut au moins 50 événements légitimes. Vous pouvez vous en assurer en couvrant une période plus longue, si nécessaire.
-
Type de problème : Erreur
Description
Le nombre d'entités uniques associées à la fraude est inférieur à 100. Envisagez d'inclure d'autres exemples d'entités frauduleuses afin d'améliorer les performances.
Cause
Cette erreur se produit si votre jeu de données contient moins d'entités présentant des événements frauduleux que ce qui est requis pour la formation du modèle. Le modèle Transaction Fraud Insights (TFI) nécessite au moins 100 entités présentant des cas de fraude pour garantir une couverture maximale de l'espace frauduleux. Le modèle risque de ne pas bien se généraliser si tous les événements de fraude sont réalisés par un petit groupe d'entités.
Solution
Assurez-vous que votre ensemble de données inclut au moins 100 entités présentant des événements frauduleux. Vous pouvez vous assurer que cela couvre une période plus longue, si nécessaire.
-
Type de problème : Erreur
Description
Le nombre d'entités uniques associées à des entités légitimes est inférieur à 100. Envisagez d'inclure d'autres exemples d'entités légitimes afin d'améliorer les performances.
Cause
Cette erreur se produit si votre jeu de données contient moins d'entités présentant des événements légitimes que ce qui est requis pour l'entraînement du modèle. Le modèle Transaction Fraud Insights (TFI) nécessite au moins 100 entités présentant des événements légitimes pour garantir une couverture maximale de l'espace frauduleux. Le modèle risque de ne pas bien se généraliser si tous les événements légitimes sont réalisés par un petit groupe d'entités.
Solution
Assurez-vous que votre ensemble de données inclut au moins 100 entités présentant des événements légitimes. Vous pouvez vous assurer que cela couvre une période plus longue, si nécessaire.
-
Type de problème : Erreur
Description
Le jeu de données contient moins de 100 lignes. Assurez-vous qu'il y a plus de 100 lignes dans le jeu de données total et qu'au moins 50 lignes sont considérées comme frauduleuses.
Cause
Cette erreur se produit si votre ensemble de données contient moins de 100 enregistrements. Amazon Fraud Detector a besoin de données provenant d'au moins 100 événements (enregistrements) de votre ensemble de données pour l'entraînement des modèles.
Solution
Assurez-vous que votre jeu de données contient des données provenant de plus de 100 événements.
Valeurs EVENT_LABEL manquantes ou différentes
-
Type de problème : Erreur
Description
Plus de 1 % de votre colonne EVENT_LABEL sont nulles ou sont des valeurs autres que celles définies dans la configuration du modèle.
$label_values
Assurez-vous qu'il manque moins de 1 % de valeurs dans votre colonne EVENT_LABEL et que les valeurs sont celles définies dans la configuration du modèle.$label_values
Cause
Cette erreur se produit pour l'une des raisons suivantes :
-
Plus de 1 % des enregistrements du fichier CSV contenant vos données d'entraînement comportent des valeurs manquantes dans la colonne EVENT_LABEL.
-
Plus de 1 % des enregistrements du fichier CSV contenant vos données d'entraînement contiennent des valeurs dans la colonne EVENT_LABEL différentes de celles associées à votre type d'événement.
Le modèle Online Fraud Insights (OFI) exige que la colonne EVENT_LABEL de chaque enregistrement soit remplie avec l'une des étiquettes associées à votre type d'événement (ou mappées).
CreateModelVersion
Solution
Si cette erreur est due à l'absence de valeurs EVENT_LABEL, pensez à attribuer des étiquettes appropriées à ces enregistrements ou à supprimer ces enregistrements de votre ensemble de données. Si cette erreur est due au fait que les étiquettes de certains enregistrements ne figurent pas dans la
label_values
liste, assurez-vous d'ajouter toutes les valeurs de la colonne EVENT_LABEL aux étiquettes du type d'événement et de les associer à des valeurs frauduleuses ou légitimes (fraude, légitimité) lors de la création du modèle. -
-
Type de problème : Informations
Description
Votre colonne EVENT_LABEL contient des valeurs nulles ou des valeurs d'étiquette autres que celles définies dans la configuration du modèle.
$label_values
Ces valeurs incohérentes ont été converties en « valeurs non frauduleuses » avant la formation.Cause
Vous obtenez ces informations pour l'une des raisons suivantes :
-
Moins de 1 % des enregistrements du fichier CSV contenant vos données d'entraînement comportent des valeurs manquantes dans la colonne EVENT_LABEL
-
Moins de 1 % des enregistrements du fichier CSV contenant vos données d'entraînement contiennent des valeurs dans la colonne EVENT_LABEL différentes de celles associées à votre type d'événement.
Dans les deux cas, le modèle de formation sera couronné de succès. Toutefois, les valeurs d'étiquette des événements pour lesquels des valeurs d'étiquette sont manquantes ou non mappées sont converties en valeurs légitimes. Si vous considérez qu'il s'agit d'un problème, suivez la solution ci-dessous.
Solution
Si des valeurs EVENT_LABEL sont manquantes dans votre ensemble de données, pensez à supprimer ces enregistrements de votre ensemble de données. Si les valeurs fournies pour ces EVENT_LABELS ne sont pas mappées, assurez-vous que toutes ces valeurs sont mappées de manière frauduleuse ou légitime (fraude, légitime) pour chaque événement.
-
Valeurs EVENT_TIMESTAMP manquantes ou incorrectes
-
Type de problème : Erreur
Description
Votre ensemble de données d'entraînement contient EVENT_TIMESTAMP avec des horodatages non conformes aux formats acceptés. Assurez-vous que le format est l'un des formats de date/horodatage acceptés.
Cause
Cette erreur se produit si la colonne EVENT_TIMESTAMP contient une valeur non conforme aux formats d'horodatage pris en charge par Amazon Fraud Detector.
Solution
Assurez-vous que les valeurs fournies pour la colonne EVENT_TIMESTAMP sont conformes aux formats d'horodatage pris en charge. S'il manque des valeurs dans la colonne EVENT_TIMESTAMP, vous pouvez soit les remplacer par des valeurs utilisant le format d'horodatage pris en charge, soit envisager de supprimer complètement l'événement au lieu de saisir des chaînes telles que, ou.
none
null
missing
-
Type de problème : Erreur
Votre ensemble de données d'entraînement contient EVENT_TIMESTAMP avec des valeurs manquantes. Assurez-vous qu'il n'y a aucune valeur manquante.
Cause
Cette erreur se produit si des valeurs sont manquantes dans la colonne EVENT_TIMESTAMP de votre ensemble de données. Amazon Fraud Detector exige que la colonne EVENT_TIMESTAMP de votre ensemble de données contienne des valeurs.
Solution
Assurez-vous que la colonne EVENT_TIMESTAMP de votre ensemble de données contient des valeurs et que ces valeurs sont conformes aux formats d'horodatage pris en charge. S'il manque des valeurs dans la colonne EVENT_TIMESTAMP, vous pouvez soit les remplacer par des valeurs utilisant le format d'horodatage pris en charge, soit envisager de supprimer complètement l'événement au lieu de saisir des chaînes telles que, ou.
none
null
missing
Données non ingérées
Type de problème : Erreur
Description
Aucun événement ingéré n'a été trouvé pour l'entraînement, veuillez vérifier votre configuration d'entraînement.
Cause
Cette erreur se produit si vous créez un modèle avec des données d'événements stockées avec Amazon Fraud Detector mais que vous n'avez pas importé votre ensemble de données dans Amazon Fraud Detector avant de commencer à entraîner votre modèle.
Solution
Utilisez l'opération d'SendEvent
API, l'opération d'CreateBatchImportJob
API ou la fonctionnalité d'importation par lots dans la console Amazon Fraud Detector pour d'abord importer les données de vos événements, puis entraîner votre modèle. Voir Ensembles de données d'événements stockés pour plus d'informations.
Note
Nous vous recommandons d'attendre 10 minutes après avoir fini d'importer vos données avant de les utiliser pour entraîner votre modèle.
Vous pouvez utiliser la console Amazon Fraud Detector pour vérifier le nombre d'événements déjà enregistrés pour chaque type d'événement. Consultez la section Affichage des statistiques de vos événements enregistrés pour plus d'informations.
Variables insuffisantes
Type de problème : Erreur
Description
L'ensemble de données doit contenir au moins 2 variables adaptées à l'entraînement.
Cause
Cette erreur se produit si votre ensemble de données contient moins de 2 variables adaptées à l'entraînement du modèle. Amazon Fraud Detector considère qu'une variable convient à la formation des modèles uniquement si elle passe toutes les validations. Si la validation d'une variable échoue, elle est exclue de l'entraînement du modèle et un message s'affiche dans le diagnostic de l'entraînement du modèle.
Solution
Assurez-vous que votre ensemble de données comporte au moins deux variables remplies de valeurs et que toutes les validations de données ont été validées. Notez que la ligne de métadonnées d'événement dans laquelle vous avez fourni les en-têtes de colonne (EVENT_TIMESTAMP, EVENT_ID, ENTITY_ID, EVENT_LABEL, etc.) n'est pas considérée comme une variable.
Type de variable manquant ou incorrect
Type de problème : Avertissement
Description
Le type de données attendu pour $variable_name
est NUMERIC. Passez en revue et mettez $variable_name
à jour votre jeu de données et réentraînez le modèle.
Cause
Cet avertissement s'affiche si une variable est définie en tant que variable NUMERIC, mais que dans l'ensemble de données, elle contient des valeurs qui ne peuvent pas être converties en NUMERIC. Par conséquent, cette variable est exclue de l'entraînement du modèle.
Solution
Si vous souhaitez la conserver sous forme de variable NUMÉRIQUE, assurez-vous que les valeurs que vous fournissez peuvent être converties en nombres flottants. Notez que si la variable contient des valeurs manquantes, ne les remplissez pas avec des chaînes telles que nonene
null
, oumissing
. Si la variable contient des valeurs non numériques, recréez-la en tant que variable de type CATEGORICAL ou FREE_FORM_TEXT.
Valeurs de variables manquantes
Type de problème : Avertissement
Description
Des $threshold
valeurs supérieures à $variable_name
sont absentes de votre jeu de données d'entraînement. Envisagez de modifier $variable_name
votre ensemble de données et de vous entraîner à nouveau pour améliorer les performances.
Cause
Cet avertissement s'affiche si la variable spécifiée est supprimée en raison d'un trop grand nombre de valeurs manquantes. Amazon Fraud Detector autorise les valeurs manquantes pour une variable. Cependant, si une variable comporte trop de valeurs manquantes, elle ne contribue pas beaucoup au modèle et cette variable est supprimée lors de l'apprentissage du modèle.
Solution
Tout d'abord, vérifiez que ces valeurs manquantes ne sont pas dues à des erreurs de collecte et de préparation des données. S'il s'agit d'erreurs, vous pouvez envisager de les supprimer de votre formation sur les modèles. Toutefois, si vous pensez que ces valeurs manquantes sont utiles et que vous souhaitez conserver cette variable, vous pouvez remplir manuellement les valeurs manquantes avec une constante à la fois dans l'apprentissage du modèle et dans l'inférence en temps réel.
Valeurs de variables uniques insuffisantes
Type de problème : Avertissement
Description
Le nombre de valeurs uniques de $variable_name
est inférieur à 100. Passez en revue et mettez $variable_name
à jour votre jeu de données et réentraînez le modèle.
Cause
Cet avertissement s'affiche si le nombre de valeurs uniques de la variable spécifiée est inférieur à 100. Les seuils varient en fonction du type de variable. Avec très peu de valeurs uniques, le jeu de données risque de ne pas être suffisamment général pour couvrir l'espace caractéristique de cette variable. Par conséquent, le modèle risque de ne pas bien se généraliser sur les prévisions en temps réel.
Solution
Tout d'abord, assurez-vous que la distribution des variables est représentative du trafic commercial réel. Ensuite, vous pouvez soit adopter des variables plus fines avec une cardinalité plus élevée, par exemple en les utilisant full_customer_name
au lieu de first_name
et last_name
séparément, soit changer le type de variable en CATEGORICAL, ce qui permet une cardinalité plus faible.
Expression de variable incorrecte
-
Type de problème : Informations
Description
Plus de 50 % des
$email_variable_name
valeurs ne correspondent pas à l'expression régulière attendue http://emailregex.com. Envisagez de modifier$email_variable_name
votre ensemble de données et de vous entraîner à nouveau pour améliorer les performances.Cause
Ces informations sont affichées si plus de 50 % des enregistrements de votre ensemble de données contiennent des valeurs d'e-mail qui ne sont pas conformes à une expression d'e-mail régulière et ne sont donc pas validées.
Solution
Formatez les valeurs des variables d'e-mail conformément à l'expression régulière. Si des valeurs d'e-mail sont manquantes, nous vous recommandons de les laisser vides au lieu de les remplir avec des chaînes telles que
none
null
, oumissing
. -
Type de problème : Informations
Description
Plus de 50 % des
$IP_variable_name
valeurs ne correspondent pas à l'expression régulière pour les adresses IPv4 ou IPv6 https://digitalfortress.tech/tricks/top-15 - /. commonly-used-regex Envisagez de modifier$IP_variable_name
votre ensemble de données et de vous entraîner à nouveau pour améliorer les performances.Cause
Ces informations sont affichées si plus de 50 % des enregistrements de votre ensemble de données contiennent des valeurs IP non conformes à une expression IP régulière et ne sont donc pas validées.
Solution
Formatez les valeurs IP conformément à l'expression régulière. Si des valeurs IP sont manquantes, nous vous recommandons de les laisser vides au lieu de les remplir avec des chaînes telles que
none
null
, oumissing
. -
Type de problème : Informations
Description
Plus de 50 % des
$phone_variable_name
valeurs ne correspondent pas à l'expression régulière de base du téléphone /$pattern/. Envisagez de modifier$phone_variable_name
votre ensemble de données et de vous entraîner à nouveau pour améliorer les performances.Cause
Ces informations sont affichées si plus de 50 % des enregistrements de votre ensemble de données contiennent des numéros de téléphone qui ne correspondent pas à une expression de numéro de téléphone normale et ne sont donc pas validés.
Solution
Formatez les numéros de téléphone conformément à l'expression régulière. S'il manque des numéros de téléphone, nous vous recommandons de les laisser vides au lieu de les remplir avec des chaînes telles que
none
null
, oumissing
.
Entités uniques insuffisantes
Type de problème : Informations
Description
Le nombre d'entités uniques est inférieur à 1 500. Envisagez d'inclure davantage de données pour améliorer les performances.
Cause
Ces informations sont affichées si votre jeu de données comporte un nombre d'entités uniques inférieur au nombre recommandé. Le modèle Transaction Fraud Insights (TFI) utilise à la fois des agrégats de séries chronologiques et des fonctionnalités de transaction génériques pour fournir les meilleures performances. Si votre ensemble de données comporte trop peu d'entités uniques, il est possible que la plupart de vos données génériques, telles que IP_ADDRESS, EMAIL_ADDRESS, n'aient pas de valeurs uniques. Il existe alors un risque que ce jeu de données ne soit pas suffisamment général pour couvrir l'espace caractéristique de cette variable. Par conséquent, le modèle risque de ne pas bien se généraliser aux transactions provenant de nouvelles entités.
Solution
Incluez davantage d'entités. Étendez la plage de temps de vos données d'entraînement, si nécessaire.