Selezione della fonte di dati Preparazione dei dati Selezione dei dati Variabili di evento Convalida dei dati

Informazioni sulle frodi online

Online Fraud Insights è un modello di machine learning supervisionato, il che significa che utilizza esempi storici di transazioni fraudolente e legittime per addestrare il modello. Il modello Online Fraud Insights è in grado di rilevare le frodi sulla base di pochi dati storici. Gli input del modello sono flessibili, quindi puoi adattarlo per rilevare una serie di rischi di frode, tra cui recensioni false, abusi nelle promozioni e frodi al check-out degli ospiti.

Il modello Online Fraud Insights utilizza un insieme di algoritmi di apprendimento automatico per l'arricchimento, la trasformazione e la classificazione delle frodi dei dati. Come parte del processo di formazione del modello, Online Fraud Insights arricchisce elementi di dati grezzi come l'indirizzo IP e il numero BIN con dati di terze parti come la geolocalizzazione dell'indirizzo IP o la banca emittente di una carta di credito. Oltre ai dati di terze parti, Online Fraud Insights utilizza algoritmi di deep learning che tengono conto dei modelli di frode rilevati su Amazon eAWS. Questi modelli di frode diventano funzionalità di input per il modello utilizzando un algoritmo di potenziamento dell'albero dei gradienti.

Per aumentare le prestazioni, Online Fraud Insights ottimizza gli iperparametri dell'algoritmo di potenziamento dell'albero del gradiente tramite un processo di ottimizzazione bayesiano. Addestra in sequenza dozzine di modelli diversi con diversi parametri del modello (come il numero di alberi, la profondità degli alberi e il numero di campioni per foglia). Utilizza inoltre diverse strategie di ottimizzazione, come l'aumento di peso della popolazione minoritaria responsabile delle frodi per far fronte a tassi di frode molto bassi.

Selezione della fonte di dati

Durante l'addestramento di un modello Online Fraud Insights, puoi scegliere di addestrare il modello sui dati degli eventi archiviati esternamente (al di fuori di Amazon Fraud Detector) o archiviati all'interno di Amazon Fraud Detector. Lo storage esterno attualmente supportato da Amazon Fraud Detector è Amazon Simple Storage Service (Amazon S3). Se utilizzi uno storage esterno, il set di dati degli eventi deve essere caricato come formato di valori separati da virgole (CSV) in un bucket Amazon S3. Queste opzioni di archiviazione dei dati sono indicate nella configurazione di addestramento del modello come EXTERNAL_EVENTS (per lo storage esterno) e INGESTED_EVENTS (per lo storage interno). Per ulteriori informazioni sulle fonti di dati disponibili e su come archiviare i dati al loro interno, vedere. Archiviazione dati eventi

Preparazione dei dati

Indipendentemente da dove scegli di archiviare i dati degli eventi (Amazon S3 o Amazon Fraud Detector), i requisiti per il tipo di modello Online Fraud Insights sono gli stessi.

Il set di dati deve contenere l'intestazione della colonna EVENT_LABEL. Questa variabile classifica un evento come fraudolento o legittimo. Quando si utilizza un file CSV (archiviazione esterna), è necessario includere EVENT_LABEL per ogni evento nel file. Per l'archiviazione interna, il campo EVENT_LABEL è facoltativo, ma tutti gli eventi devono essere etichettati per essere inclusi in un set di dati di formazione. Quando configuri il modello di addestramento, puoi scegliere se ignorare gli eventi senza etichetta, assumere un'etichetta legittima per gli eventi senza etichetta o ipotizzare un'etichetta fraudolenta per tutti gli eventi senza etichetta.

Selezione dei dati

Consulta Raccogliere i dati degli eventi per informazioni sulla selezione dei dati per la formazione del modello Online Fraud Insights.

Il processo di formazione di Online Fraud Insights campiona e partiziona i dati storici in base a EVENT_TIMESTAMP. Non è necessario campionare manualmente i dati e ciò potrebbe influire negativamente sui risultati del modello.

Variabili di evento

Il modello Online Fraud Insights richiede almeno due variabili, oltre ai metadati degli eventi richiesti, che abbiano superato la convalida dei dati per l'addestramento del modello e consenta fino a 100 variabili per modello. In genere, maggiore è il numero di variabili fornite, migliore è la capacità del modello di distinguere tra frodi ed eventi legittimi. Sebbene il modello Online Fraud Insights sia in grado di supportare dozzine di variabili, incluse variabili personalizzate, consigliamo di includere l'indirizzo IP e l'indirizzo e-mail, poiché queste variabili sono in genere le più efficaci per identificare l'entità oggetto di valutazione.

Convalida dei dati

Come parte del processo di formazione, Online Fraud Insights convaliderà il set di dati per rilevare eventuali problemi di qualità dei dati che potrebbero influire sulla formazione dei modelli. Dopo aver convalidato i dati, Amazon Fraud Detector intraprenderà le azioni appropriate per creare il miglior modello possibile. Ciò include l'emissione di avvisi per potenziali problemi di qualità dei dati, la rimozione automatica delle variabili che presentano problemi di qualità dei dati o l'emissione di un errore e l'interruzione del processo di addestramento del modello. Per ulteriori informazioni, consulta Convalida del set di dati.

Avvertimento JavaScript è disabilitato o non è disponibile nel tuo browser.

Per usare la documentazione AWS, JavaScript deve essere abilitato. Consulta le pagine della guida del browser per le istruzioni.

Convenzioni dei documenti

Scegliete un tipo di modello

Informazioni sulle frodi nelle transazioni