Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Fehlerbehebung
Die folgenden Abschnitte helfen Ihnen bei der Behebung von Problemen, die bei der Arbeit mit Amazon Fraud Detector auftreten können
Beheben von Problemen mit Trainingsdaten
Verwenden Sie die Informationen in diesem Abschnitt, um Probleme zu diagnostizieren und zu beheben, die im Diagnosebereich Modelltraining in der Amazon Fraud Detector-Konsole auftreten können, wenn Sie Ihr Modell trainieren.
Die im Diagnosebereich Modelltraining angezeigten Probleme sind wie folgt kategorisiert. Die Anforderung zur Behebung des Problems hängt von der Kategorie des Problems ab.
-
Fehler – führt dazu, dass das Modelltraining fehlschlägt. Diese Probleme müssen behoben werden, damit das Modell erfolgreich trainiert werden kann.
-
Warnung – bewirkt, dass das Modelltraining fortgesetzt wird. Einige der Variablen werden jedoch möglicherweise im Trainingsprozess ausgeschlossen. Suchen Sie nach den entsprechenden Anleitungen in diesem Abschnitt, um die Qualität Ihres Datensatzes zu verbessern.
-
Informationen (Informationen) – hat keine Auswirkungen auf das Modelltraining und alle Variablen werden für das Training verwendet. Wir empfehlen Ihnen, die entsprechenden Anleitungen in diesem Abschnitt zu lesen, um die Qualität Ihres Datensatzes und Ihrer Modellleistung weiter zu verbessern.
Themen
- Instabile Betrugsrate im angegebenen Datensatz
- Unzureichende Daten
- Fehlende oder andere EVENT_LABEL-Werte
- Fehlende oder falsche EVENT_TIMESTAMP-Werte
- Nicht aufgenommene Daten
- Unzureichende Variablen
- Fehlender oder falscher Variablentyp
- Fehlende Variablenwerte
- Unzureichende eindeutige Variablenwerte
- Falscher Variablenausdruck
- Unzureichende eindeutige Entitäten
Instabile Betrugsrate im angegebenen Datensatz
Problemtyp : Fehler
Beschreibung
Die Betrugsrate in den angegebenen Daten ist im Laufe der Zeit zu instabil. Bitte stellen Sie sicher, dass Ihre Betrugs- und legitimen Ereignisse im Laufe der Zeit einheitlich erfasst werden.
Ursache
Dieser Fehler tritt auf, wenn die Betrugs- und legitimen Ereignisse in Ihrem Datensatz ungleichmäßig verteilt sind und aus verschiedenen Zeitfenstern stammen. Der Modelltrainingsprozess von Amazon Fraud Detector nimmt Stichproben und partitioniert Ihren Datensatz basierend auf EVENT_TIMESTAMP. Wenn Ihr Datensatz beispielsweise aus Betrugsereignissen der letzten 6 Monate besteht, aber nur der letzte Monat legitimer Ereignisse enthalten ist, wird der Datensatz als instabil betrachtet. Ein instabiler Datensatz kann zu Verzerrungen bei der Bewertung der Modellleistung führen.
Lösung
Stellen Sie sicher, dass Sie die Daten zu betrügerischen und legitimen Ereignissen aus demselben Zeitfenster bereitstellen, und die Betrugsrate ändert sich im Laufe der Zeit nicht drastisch.
Unzureichende Daten
-
Problemtyp : Fehler
Beschreibung
Weniger als 50 Zeilen werden als betrügerische Ereignisse gekennzeichnet. Stellen Sie sicher, dass sowohl betrügerische als auch legitime Ereignisse die Mindestanzahl von 50 überschreiten, und trainieren Sie das Modell erneut.
Ursache
Dieser Fehler tritt auf, wenn Ihr Datensatz weniger Ereignisse enthält, die als betrügerisch gekennzeichnet sind als für das Modelltraining erforderlich. Amazon Fraud Detector erfordert mindestens 50 betrügerische Ereignisse, um Ihr Modell zu trainieren.
Lösung
Stellen Sie sicher, dass Ihr Datensatz mindestens 50 betrügerische Ereignisse enthält. Sie können dies sicherstellen, indem Sie bei Bedarf einen längeren Zeitraum abdecken.
-
Problemtyp : Fehler
Beschreibung
Weniger als 50 Zeilen werden als legitime Ereignisse bezeichnet. Stellen Sie sicher, dass sowohl betrügerische als auch legitime Ereignisse die Mindestanzahl von $threshold überschreiten, und trainieren Sie das Modell erneut.
Ursache
Dieser Fehler tritt auf, wenn Ihr Datensatz weniger Ereignisse enthält, die als legitime Ereignisse gekennzeichnet sind, als für das Modelltraining erforderlich. Amazon Fraud Detector erfordert mindestens 50 legitime Ereignisse, um Ihr Modell zu trainieren.
Lösung
Stellen Sie sicher, dass Ihr Datensatz mindestens 50 legitime Ereignisse enthält. Sie können dies sicherstellen, indem Sie bei Bedarf einen längeren Zeitraum abdecken.
-
Problemtyp : Fehler
Beschreibung
Die Anzahl der eindeutigen Entitäten im Zusammenhang mit Betrug beträgt weniger als 100. Erwägen Sie, weitere Beispiele für betrügerische Entitäten einzubeziehen, um die Leistung zu verbessern.
Ursache
Dieser Fehler tritt auf, wenn Ihr Datensatz weniger Entitäten mit betrügerischen Ereignissen enthält, als für das Modelltraining erforderlich. Das Transaction Fraud Insights (TFI)-Modell erfordert mindestens 100 Entitäten mit Betrugsereignissen, um eine maximale Abdeckung des Betrugsbereichs sicherzustellen. Das Modell kann möglicherweise nicht gut verallgemeinert werden, wenn alle Betrugsereignisse von einer kleinen Gruppe von Entitäten ausgeführt werden.
Lösung
Stellen Sie sicher, dass Ihr Datensatz mindestens 100 Entitäten mit betrügerischen Ereignissen enthält. Sie können sicherstellen, dass dies bei Bedarf einen längeren Zeitraum abdeckt.
-
Problemtyp : Fehler
Beschreibung
Die Anzahl der eindeutigen Entitäten, die mit legitimen Entitäten verknüpft sind, beträgt weniger als 100. Erwägen Sie, weitere Beispiele für legitime Entitäten einzubeziehen, um die Leistung zu verbessern.
Ursache
Dieser Fehler tritt auf, wenn Ihr Datensatz weniger Entitäten mit legitimen Ereignissen hat, als für das Modelltraining erforderlich. Das Transaction Fraud Insights (TFI)-Modell erfordert mindestens 100 Entitäten mit legitimen Ereignissen, um eine maximale Abdeckung des Betrugsbereichs sicherzustellen. Das Modell kann möglicherweise nicht gut verallgemeinert werden, wenn alle legitimen Ereignisse von einer kleinen Gruppe von Entitäten ausgeführt werden.
Lösung
Stellen Sie sicher, dass Ihr Datensatz mindestens 100 Entitäten mit legitimen Ereignissen enthält. Sie können sicherstellen, dass dies bei Bedarf einen längeren Zeitraum abdeckt.
-
Problemtyp : Fehler
Beschreibung
Im Datensatz befinden sich weniger als 100 Zeilen. Stellen Sie sicher, dass mehr als 100 Zeilen im gesamten Datensatz vorhanden sind und mindestens 50 Zeilen als betrügerisch gekennzeichnet sind.
Ursache
Dieser Fehler tritt auf, wenn Ihr Datensatz weniger als 100 Datensätze enthält. Amazon Fraud Detector benötigt Daten aus mindestens 100 Ereignissen (Datensätzen) in Ihrem Datensatz für das Modelltraining.
Lösung
Stellen Sie sicher, dass Sie Daten aus mehr als 100 Ereignissen in Ihrem Datensatz haben.
Fehlende oder andere EVENT_LABEL-Werte
-
Problemtyp : Fehler
Beschreibung
Größer als 1 % Ihrer Spalte EVENT_LABEL sind null oder andere Werte als die, die in der Modellkonfiguration definiert sind
$label_values
. Stellen Sie sicher, dass in Ihrer Spalte EVENT_LABEL weniger als 1 % der fehlenden Werte vorhanden sind und die Werte in der Modellkonfiguration definiert sind$label_values
.Ursache
Dieser Fehler tritt aus einem der folgenden Gründe auf:
-
Bei mehr als 1 % der Datensätze in der CSV-Datei, die Ihre Trainingsdaten enthalten, fehlen Werte in der Spalte EVENT_LABEL.
-
Mehr als 1 % der Datensätze in der CSV-Datei, die Ihre Trainingsdaten enthalten, haben Werte in der Spalte EVENT_LABEL, die sich von denen unterscheiden, die mit Ihrem Ereignistyp verknüpft sind.
Das OFI-Modell (Online Fraud Insights) erfordert, dass die Spalte EVENT_LABEL in jedem Datensatz mit einer der Bezeichnungen gefüllt wird, die Ihrem Ereignistyp zugeordnet sind (oder in zugeordnet sind
CreateModelVersion
).Lösung
Wenn dieser Fehler auf die fehlenden Werte von EVENT_LABEL zurückzuführen ist, sollten Sie diesen Datensätzen die richtigen Bezeichnungen zuweisen oder diese Datensätze aus Ihrem Datensatz entfernen. Wenn dieser Fehler darauf zurückzuführen ist, dass Beschriftungen einiger Datensätze nicht zu den gehören
label_values
, stellen Sie sicher, dass Sie alle Werte in der Spalte EVENT_LABEL zu Beschriftungen des Ereignistyps hinzufügen und bei der Modellerstellung entweder betrügerischen oder legitimen (betrügerischen, Legit-) zugeordnet sind. -
-
Problemtyp : Informationen
Beschreibung
Ihre Spalte EVENT_LABEL enthält andere Null- oder Labelwerte als die, die in der Modellkonfiguration definiert sind
$label_values
. Diese inkonsistenten Werte wurden vor dem Training in „nicht in Betrug“ umgewandelt.Ursache
Sie erhalten diese Informationen aus einem der folgenden Gründe:
-
Weniger als 1 % der Datensätze in der CSV-Datei, die Ihre Trainingsdaten enthalten, haben fehlende Werte in der Spalte EVENT_LABEL
-
Weniger als 1 % der Datensätze in der CSV-Datei, die Ihre Trainingsdaten enthalten, haben Werte in der Spalte EVENT_LABEL, die sich von denen unterscheiden, die mit Ihrem Ereignistyp verknüpft sind.
Das Modelltraining wird in beiden Fällen erfolgreich sein. Die Beschriftungswerte dieser Ereignisse, die fehlende oder nicht zugeordnete Beschriftungswerte aufweisen, werden jedoch in legitime Werte umgewandelt. Wenn Sie dies als Problem betrachten, folgen Sie der unten aufgeführten Lösung.
Lösung
Wenn in Ihrem Datensatz EVENT_LABEL-Werte fehlen, sollten Sie diese Datensätze aus Ihrem Datensatz entfernen. Wenn die für diese EVENT_LABELS bereitgestellten Werte nicht zugeordnet sind, stellen Sie sicher, dass alle diese Werte für jedes Ereignis entweder betrügerischen oder legitimen (betrügerischen, suffizienten) Werten zugeordnet sind.
-
Fehlende oder falsche EVENT_TIMESTAMP-Werte
-
Problemtyp : Fehler
Beschreibung
Ihr Trainingsdatensatz enthält EVENT_TIMESTAMP mit Zeitstempeln, die nicht den akzeptierten Formaten entsprechen. Stellen Sie sicher, dass das Format eines der akzeptierten Datums-/Zeitstempelformate ist.
Ursache
Dieser Fehler tritt auf, wenn die Spalte EVENT_TIMESTAMP einen Wert enthält, der nicht den von Amazon Fraud Detector unterstützten Zeitstempelformaten entspricht.
Lösung
Stellen Sie sicher, dass die für die Spalte EVENT_TIMESTAMP bereitgestellten Werte den unterstützten Zeitstempelformaten entsprechen. Wenn in der Spalte EVENT_TIMESTAMP Werte fehlen, können Sie diese entweder mit Werten im unterstützten Zeitstempelformat auffüllen oder erwägen, das Ereignis vollständig zu löschen
null
, anstatt Zeichenfolgen wienone
, oder einzugebenmissing
. -
Problemtyp : Fehler
Ihr Trainingsdatensatz enthält EVENT_TIMESTAMP mit fehlenden Werten. Stellen Sie sicher, dass keine Werte fehlen.
Ursache
Dieser Fehler tritt auf, wenn in der Spalte EVENT_TIMESTAMP in Ihrem Datensatz Werte fehlen. Amazon Fraud Detector erfordert, dass die Spalte EVENT_TIMESTAMP in Ihrem Datensatz Werte enthält.
Lösung
Stellen Sie sicher, dass die Spalte EVENT_TIMESTAMP in Ihrem Datensatz Werte enthält und diese Werte den unterstützten Zeitstempelformaten entsprechen. Wenn in der Spalte EVENT_TIMESTAMP Werte fehlen, können Sie diese entweder mit Werten im unterstützten Zeitstempelformat auffüllen oder erwägen, das Ereignis vollständig zu löschen
null
, anstatt Zeichenfolgen wienone
, oder einzugebenmissing
.
Nicht aufgenommene Daten
Problemtyp : Fehler
Beschreibung
Für das Training wurden keine aufgenommenen Ereignisse gefunden. Bitte überprüfen Sie Ihre Trainingskonfiguration.
Ursache
Dieser Fehler tritt auf, wenn Sie ein Modell mit Ereignisdaten erstellen, die in Amazon Fraud Detector gespeichert sind, Ihren Datensatz jedoch nicht in Amazon Fraud Detector importiert haben, bevor Sie mit dem Trainieren Ihres Modells begonnen haben.
Lösung
Verwenden Sie die SendEvent
API-Operation, die CreateBatchImportJob
API-Operation oder die Batch-Importfunktion in der Amazon Fraud Detector-Konsole, um zuerst Ihre Ereignisdaten zu importieren und dann Ihr Modell zu trainieren. Weitere Informationen finden Sie unter Gespeicherte Ereignisdatensätze.
Anmerkung
Wir empfehlen, 10 Minuten zu warten, nachdem Sie den Import Ihrer Daten abgeschlossen haben, bevor Sie sie zum Trainieren Ihres Modells verwenden.
Sie können die Amazon Fraud Detector-Konsole verwenden, um die Anzahl der Ereignisse zu überprüfen, die bereits für jeden Ereignistyp gespeichert sind. Weitere Informationen finden Sie unter Anzeigen von Metriken Ihrer gespeicherten Ereignisse.
Unzureichende Variablen
Problemtyp : Fehler
Beschreibung
Der Datensatz muss mindestens 2 Variablen enthalten, die für das Training geeignet sind.
Ursache
Dieser Fehler tritt auf, wenn Ihr Datensatz weniger als 2 Variablen enthält, die für das Modelltraining geeignet sind. Amazon Fraud Detector betrachtet eine Variable, die nur für das Modelltraining geeignet ist, wenn sie alle Validierungen besteht. Wenn eine Variable nicht validiert werden kann, wird sie im Modelltraining ausgeschlossen und Sie erhalten eine Meldung unter Diagnose des Modelltrainings.
Lösung
Stellen Sie sicher, dass Ihr Datensatz über mindestens zwei Variablen verfügt, die mit Werten gefüllt sind und alle Datenvalidierungen bestanden haben. Beachten Sie, dass die Zeile mit den Ereignismetadaten, in der Sie Ihre Spaltenüberschriften angegeben haben (EVENT_TIMESTAMP, EVENT_ID, ENTITY_ID, EVENT_LABEL usw.), nicht als Variable betrachtet wird.
Fehlender oder falscher Variablentyp
Problemtyp : Warnung
Beschreibung
Der erwartete Datentyp für $variable_name
ist NUMERIC. Überprüfen und aktualisieren Sie $variable_name
in Ihrem Datensatz und trainieren Sie das Modell erneut.
Ursache
Sie erhalten diese Warnung, wenn eine Variable als NUMERIC-Variable definiert ist, aber im Datensatz Werte enthält, die nicht in NUMERIC konvertiert werden können. Daher wird diese Variable beim Modelltraining ausgeschlossen.
Lösung
Wenn Sie sie als NUMERIC-Variable beibehalten möchten, stellen Sie sicher, dass die von Ihnen angegebenen Werte in eine Gleitkommazahl konvertiert werden können. Beachten Sie, dass die Variable keine Zeichenfolgen wie , oder enthältnonene
null
, wenn sie fehlende Werte enthältmissing
. Wenn die Variable nicht numerische Werte enthält, erstellen Sie sie als CATEGORICAL- oder microSD_FORM_TEXT-Variablentyp neu.
Fehlende Variablenwerte
Problemtyp : Warnung
Beschreibung
Größer als $threshold
Werte für $variable_name
fehlen in Ihrem Trainingsdatensatz. Erwägen Sie, $variable_name
Ihren Datensatz zu ändern und das Training erneut durchzuführen, um die Leistung zu verbessern.
Ursache
Sie erhalten diese Warnung, wenn die angegebene Variable aufgrund zu vieler fehlender Werte gelöscht wird. Amazon Fraud Detector lässt fehlende Werte für eine Variable zu. Wenn jedoch eine Variable zu viele fehlende Werte enthält, trägt sie nicht viel zum Modell bei und diese Variable wird beim Modelltraining gelöscht.
Lösung
Stellen Sie zunächst sicher, dass diese fehlenden Werte nicht auf Fehler bei der Datenerfassung und -vorbereitung zurückzuführen sind. Wenn es sich um Fehler handelt, können Sie sie aus Ihrem Modelltraining entfernen. Wenn Sie jedoch der Meinung sind, dass diese fehlenden Werte nützlich sind und diese Variable trotzdem beibehalten möchten, können Sie fehlende Werte sowohl beim Modelltraining als auch bei der Echtzeitinferenz manuell mit einer Konstante füllen.
Unzureichende eindeutige Variablenwerte
Problemtyp : Warnung
Beschreibung
Die Anzahl der eindeutigen Werte von $variable_name
ist niedriger als 100. Überprüfen und aktualisieren Sie $variable_name
in Ihrem Datensatz und trainieren Sie das Modell erneut.
Ursache
Sie erhalten diese Warnung, wenn die Anzahl der eindeutigen Werte der angegebenen Variablen kleiner als 100 ist. Die Schwellenwerte unterscheiden sich je nach Variablentyp. Bei sehr wenigen eindeutigen Werten besteht das Risiko, dass der Datensatz nicht allgemein genug ist, um den Feature-Bereich dieser Variablen abzudecken. Daher kann es sein, dass das Modell bei Echtzeitvorhersagen nicht gut verallgemeinert wird.
Lösung
Stellen Sie zunächst sicher, dass die Variablenverteilung repräsentativ für den echten Geschäftsverkehr ist. Anschließend können Sie entweder fein trainierte Variablen mit höherer Kardinalität übernehmen, z. B. full_customer_name
anstelle von first_name
und last_name
separat verwenden, oder den Variablentyp in CATEGORICAL ändern, was eine geringere Kardinalität ermöglicht.
Falscher Variablenausdruck
-
Problemtyp : Informationen
Beschreibung
Größer als 50 % der
$email_variable_name
Werte entsprechen nicht dem erwarteten regulären Ausdruck http://emailregex.com. Erwägen Sie,$email_variable_name
Ihren Datensatz zu ändern und das Training erneut durchzuführen, um die Leistung zu verbessern.Ursache
Diese Informationen werden angezeigt, wenn mehr als 50 % Datensätze in Ihrem Datensatz E-Mail-Werte haben, die nicht einem regulären E-Mail-Ausdruck entsprechen und daher nicht validiert werden können.
Lösung
Formatieren Sie die E-Mail-Variablenwerte so, dass sie dem regulären Ausdruck entsprechen. Wenn E-Mail-Werte fehlen, empfehlen wir, sie leer zu lassen
null
, anstatt sie mit Zeichenfolgen wienone
, oder zu füllenmissing
. -
Problemtyp : Informationen
Beschreibung
Größer als 50 % der
$IP_variable_name
Werte stimmen nicht mit dem regulären Ausdruck für IPv4- oder IPv6-Adressen https://digitalfortress.tech/tricks/top-15-commonly-used-regex/ überein. Erwägen Sie,$IP_variable_name
Ihren Datensatz zu ändern und das Training erneut durchzuführen, um die Leistung zu verbessern.Ursache
Diese Informationen werden angezeigt, wenn mehr als 50 % Datensätze in Ihrem Datensatz IP-Werte haben, die nicht einem regulären IP-Ausdruck entsprechen und daher nicht validiert werden können.
Lösung
Formatieren Sie die IP-Werte so, dass sie dem regulären Ausdruck entsprechen. Wenn IP-Werte fehlen, empfehlen wir, sie leer zu lassen
null
, anstatt sie mit Zeichenfolgen wienone
, oder zu füllenmissing
. -
Problemtyp : Informationen
Beschreibung
Größer als 50 % der
$phone_variable_name
Werte stimmen nicht mit dem regulären Standardausdruck des Telefons überein /$pattern/. Erwägen Sie,$phone_variable_name
in Ihrem Datensatz zu ändern und erneut zu trainieren, um die Leistung zu verbessern.Ursache
Diese Informationen werden angezeigt, wenn mehr als 50 % Datensätze in Ihrem Datensatz Telefonnummern haben, die nicht einem regulären Telefonnummernausdruck entsprechen und daher nicht validiert werden können.
Lösung
Formatieren Sie die Telefonnummern so, dass sie dem regulären Ausdruck entsprechen. Wenn Telefonnummern fehlen, empfehlen wir, sie leer zu lassen
null
, anstatt sie mit Zeichenfolgen wienone
, oder zu füllenmissing
.
Unzureichende eindeutige Entitäten
Problemtyp : Informationen
Beschreibung
Die Anzahl der eindeutigen Entitäten beträgt weniger als 1 500. Erwägen Sie, mehr Daten einzubeziehen, um die Leistung zu verbessern.
Ursache
Diese Informationen werden angezeigt, wenn Ihr Datensatz eine geringere Anzahl eindeutiger Entitäten als die empfohlene Anzahl hat. Das Transaction Fraud Insights (TFI)-Modell verwendet sowohl Zeitreihenaggregate als auch generische Transaktionsfunktionen, um die beste Leistung zu erzielen. Wenn Ihr Datensatz zu wenige eindeutige Entitäten hat, haben die meisten Ihrer generischen Daten wie IP_ADDRESS, EMAIL_ADDRESS möglicherweise keine eindeutigen Werte. Dann besteht auch das Risiko, dass dieser Datensatz nicht allgemein genug ist, um den Feature-Bereich dieser Variablen abzudecken. Daher kann es sein, dass das Modell bei Transaktionen von neuen Entitäten nicht gut generalisiert wird.
Lösung
Fügen Sie weitere Entitäten hinzu. Verlängern Sie Ihren Zeitbereich für Trainingsdaten bei Bedarf.