Einblicke in Online-Betrug - Amazon Fraud Detector

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Einblicke in Online-Betrug

Online Fraud Insights ist ein überwachtes Machine-Learning-Modell, das bedeutet, dass historische Beispiele für betrügerische und legitime Transaktionen verwendet werden, um das Modell zu trainieren. Das Online Fraud Insights-Modell kann Betrug anhand wenig historischer Daten erkennen. Die Eingaben des Modells sind flexibel, sodass Sie es anpassen können, um eine Vielzahl von Betrugsrisiken zu erkennen, darunter Fake Reviews, Missbrauch von Werbeaktionen und Betrug beim Checkout von Kunden.

Das Online Fraud Insights-Modell verwendet ein Ensemble von Machine Learning-Algorithmen für die Datenanreicherung, -transformation und Betrugsklassifizierung. Im Rahmen des Modelltrainingsprozesses fügt Online Fraud Insights Rohdatenelemente wie IP-Adresse und BIN-Nummer mit Daten von Drittanbietern wie der Geolokalisierung der IP-Adresse oder der ausstellenden Bank für eine Kreditkarte hinzu. Zusätzlich zu Daten von Drittanbietern verwendet Online Fraud Insights Deep-Learning-Algorithmen, die Betrugsmuster berücksichtigen, die bei Amazon und beobachtet wurdenAWS. Diese Betrugsmuster werden mithilfe eines Gradient-Baum-Boosting-Algorithmus zu Eingabemerkmalen für Ihr Modell.

Um die Leistung zu erhöhen, optimiert Online Fraud Insights die Hyperparameter des Gradient-Tree-Boosting-Algorithmus über einen Bayesschen Optimierungsprozess. Es trainiert nacheinander Dutzende verschiedener Modelle mit unterschiedlichen Modellparametern (z. B. Anzahl der Bäume, Tiefe der Bäume und Anzahl der Stichproben pro Blatt). Es verwendet auch verschiedene Optimierungsstrategien, wie z. B. die Gewichtung der Betrügergruppe für Nebenbetrug, um sich um sehr niedrige Betrugsraten zu kümmern.

Auswählen der Datenquelle

Beim Training eines Online-Fraud-Insights-Modells können Sie das Modell anhand von Ereignisdaten trainieren, die entweder extern (außerhalb von Amazon Fraud Detector) oder in Amazon Fraud Detector gespeichert werden. Der externe Speicher, den Amazon Fraud Detector derzeit unterstützt, ist Amazon Simple Storage Service (Amazon S3). Wenn Ihr externen Speicher verwendet, muss Ihr Ereignisdatensatz im CSV-Format (durch Kommas getrennte Werte) in einen Amazon S3-Bucket hochgeladen werden. Diese Datenspeicheroptionen werden in der Konfiguration des Modelltrainings als EXTERNAL_EVENTS (für externen Speicher) und INGESTED_EVENTS (für internen Speicher) bezeichnet. Weitere Informationen zu den verfügbaren Datenquellen und zum Speichern von Daten darin finden Sie unter Speicherung der Ereignisdaten.

Vorbereiten von Daten

Unabhängig davon, wo Sie Ihre Ereignisdaten speichern möchten (Amazon S3 oder Amazon Fraud Detector), sind die Anforderungen für den Modelltyp Online Fraud Insights dieselben.

Ihr Datensatz muss den Spalten-Header EVENT_LABEL enthalten. Diese Variable klassifiziert ein Ereignis als betrügerisches oder legitimes Ereignis. Wenn Sie eine CSV-Datei (externer Speicher) verwenden, müssen Sie EVENT_LABEL für jedes Ereignis in die Datei aufnehmen. Für die interne Speicherung ist das Feld EVENT_LABEL optional, aber alle Ereignisse müssen beschriftet werden, um in einen Trainingsdatensatz aufgenommen zu werden. Bei der Konfiguration Ihres Modelltrainings können Sie wählen, ob Ereignisse ohne Label ignoriert, ein legitimes Label für Ereignisse ohne Label angenommen oder ein betrügerisches Label für alle Ereignisse ohne Label angenommen werden soll.

Auswählen von Daten

Informationen zur Auswahl von Daten für das Training Ihres Online Fraud Insights-Modells finden Sie unter Erfassen von Ereignisdaten.

Der Online Fraud Insights-Trainingsprozess nimmt Beispiele für historische Daten auf der Grundlage von EVENT_TIMESTAMP und partitioniert sie. Es ist nicht notwendig, die Daten manuell zu erfassen, und dies kann sich negativ auf Ihre Modellergebnisse auswirken.

Ereignisvariablen

Das Online Fraud Insights-Modell erfordert mindestens zwei Variablen, abgesehen von den erforderlichen Ereignismetadaten, die die Datenvalidierung für das Modelltraining bestanden haben und bis zu 100 Variablen pro Modell zulassen. Je mehr Variablen Sie angeben, desto besser kann das Modell zwischen Betrug und legitimen Ereignissen unterscheiden. Obwohl das Online Fraud Insights-Modell Dutzende von Variablen unterstützen kann, einschließlich benutzerdefinierter Variablen, empfehlen wir, IP-Adresse und E-Mail-Adresse einzubeziehen, da diese Variablen in der Regel am effektivsten bei der Identifizierung der ausgewerteten Entität sind.

Validieren von Daten

Im Rahmen des Trainingsprozesses validiert Online Fraud Insights den Datensatz auf Datenqualitätsprobleme, die sich auf das Modelltraining auswirken können. Nach der Validierung der Daten ergreift Amazon Fraud Detector die entsprechenden Maßnahmen, um das bestmögliche Modell zu erstellen. Dazu gehören die Ausgabe von Warnungen für potenzielle Datenqualitätsprobleme, das automatische Entfernen von Variablen, bei denen Datenqualitätsprobleme auftreten, die Ausgabe eines Fehlers und das Stoppen des Modelltrainingsprozesses. Weitere Informationen finden Sie unter Datensatzvalidierung.