Wawasan pengambilalihan akun - Amazon Fraud Detector

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Wawasan pengambilalihan akun

Jenis model Account Takeover Insights (ATI) mengidentifikasi aktivitas online penipuan dengan mendeteksi apakah akun dikompromikan melalui pengambilalihan berbahaya, phishing, atau dari kredensi yang dicuri. Account Takeover Insights adalah model pembelajaran mesin yang menggunakan acara login dari bisnis online Anda untuk melatih model tersebut.

Anda dapat menyematkan model Wawasan Pengambilalihan Akun yang terlatih dalam alur login waktu nyata Anda untuk mendeteksi apakah akun dikompromikan. Model ini menilai berbagai jenis otentikasi dan login. Mereka termasuk login aplikasi web, otentikasi berbasis API, dan single-sign-on (SSO). Untuk menggunakan model Account Takeover Insights, panggil GetEventPredictionAPI setelah kredensyal login yang valid ditampilkan. API menghasilkan skor yang mengukur risiko akun dikompromikan. Amazon Fraud Detector menggunakan skor dan aturan yang Anda tetapkan untuk mengembalikan satu atau beberapa hasil untuk peristiwa login. Hasilnya adalah yang Anda konfigurasikan. Berdasarkan hasil yang Anda terima, Anda dapat mengambil tindakan yang tepat untuk setiap login. Artinya, Anda dapat menyetujui atau menantang kredensyal yang disajikan untuk login. Misalnya, Anda dapat menantang kredensialnya dengan meminta PIN akun sebagai verifikasi tambahan.

Anda juga dapat menggunakan model Account Takeover Insights untuk mengevaluasi login akun secara asinkron dan mengambil tindakan pada akun berisiko tinggi. Misalnya, akun berisiko tinggi dapat ditambahkan ke antrian investigasi untuk peninjau manusia untuk menentukan apakah tindakan lebih lanjut perlu diambil, seperti menangguhkan akun.

Model Account Takeover Insights dilatih menggunakan kumpulan data yang berisi peristiwa login historis bisnis Anda. Anda memberikan data ini. Anda dapat secara opsional melabeli akun sebagai sah atau curang. Namun, ini tidak diperlukan untuk melatih model. Model Account Takeover Insights mendeteksi anomali berdasarkan riwayat login akun yang berhasil. Ini juga mempelajari cara mendeteksi anomali dalam perilaku pengguna yang menunjukkan peningkatan risiko peristiwa pengambilalihan akun berbahaya. Misalnya, pengguna yang biasanya masuk dari perangkat dan alamat IP yang sama. Penipu biasanya masuk dari perangkat dan geolokasi yang berbeda. Teknik ini menghasilkan skor risiko dari suatu aktivitas yang anomali, yang biasanya merupakan karakteristik utama dari pengambilalihan akun berbahaya.

Sebelum melatih model Account Takeover Insights, Amazon Fraud Detector menggunakan kombinasi teknik pembelajaran mesin untuk melakukan pengayaan data, agregasi data, dan transformasi data. Kemudian, selama proses pelatihan, Amazon Fraud Detector memperkaya elemen data mentah yang Anda berikan. Contoh elemen data mentah termasuk alamat IP dan agen pengguna. Amazon Fraud Detector menggunakan elemen-elemen ini untuk membuat input tambahan yang menjelaskan data login. Input ini termasuk perangkat, browser, dan input geolokasi. Amazon Fraud Detector juga menggunakan data login yang Anda berikan untuk terus menghitung variabel agregat yang menggambarkan perilaku pengguna sebelumnya. Contoh perilaku pengguna termasuk berapa kali pengguna masuk dari alamat IP tertentu. Menggunakan pengayaan dan agregat tambahan ini, Amazon Fraud Detector dapat menghasilkan kinerja model yang kuat dari sekumpulan kecil input dari peristiwa login Anda.

Model Account Takeover Insights mendeteksi contoh di mana akun yang sah diakses oleh aktor jahat, terlepas dari apakah aktor jahat itu manusia atau robot. Model ini menghasilkan skor tunggal yang menunjukkan risiko relatif kompromi akun. Akun yang mungkin telah disusupi ditandai sebagai akun berisiko tinggi. Anda dapat memproses akun berisiko tinggi dengan salah satu dari dua cara. Anda juga dapat menerapkan verifikasi identitas tambahan. Atau, Anda dapat mengirim akun ke antrian untuk penyelidikan manual.

Memilih sumber data

Model Account Takeover Insights dilatih pada kumpulan data yang disimpan secara internal, di Amazon Fraud Detector. Untuk menyimpan data peristiwa login Anda dengan Amazon Fraud Detector, buat file CSV dengan peristiwa login pengguna. Untuk setiap acara, sertakan data login seperti stempel waktu acara, ID pengguna, alamat IP, agen pengguna, dan apakah data login valid. Setelah membuat file CSV, pertama upload file ke Amazon Fraud Detector, dan kemudian gunakan fitur impor untuk menyimpan data. Anda kemudian dapat melatih model Anda menggunakan data yang disimpan. Untuk informasi selengkapnya tentang menyimpan kumpulan data acara Anda dengan Amazon Fraud Detector, lihat Simpan data acara Anda secara internal dengan Amazon Fraud Detector

Mempersiapkan data

Amazon Fraud Detector mengharuskan Anda memberikan data login akun pengguna Anda dalam file nilai yang dipisahkan koma (CSV) yang dikodekan dalam format UTF-8. Baris pertama file CSV Anda harus berisi header file. Header file terdiri dari metadata peristiwa dan variabel peristiwa yang menggambarkan setiap elemen data. Data acara mengikuti header. Setiap baris dalam data acara terdiri dari data dari satu peristiwa login.

Untuk model Wawasan Pengambilalihan Akun, Anda harus menyediakan metadata peristiwa dan variabel peristiwa berikut di baris header file CSV Anda.

Metadata acara

Kami menyarankan Anda memberikan metadata berikut di header file CSV Anda. Metadata acara harus dalam huruf besar.

  • EVENT_ID - Sebuah identifier unik untuk acara login.

  • ENTITY_TYPE - Entitas yang melakukan peristiwa login, seperti pedagang atau pelanggan.

  • ENTITY_ID - Sebuah identifier untuk entitas melakukan peristiwa login.

  • EVENT_TIMESTAMP - Stempel waktu saat peristiwa login terjadi. Stempel waktu harus dalam standar ISO 8601 di UTC.

  • EVENT_LABEL (direkomendasikan) - Label yang mengklasifikasikan acara sebagai penipuan atau sah. Anda dapat menggunakan label apa pun, seperti “penipuan”, “legit”, “1", atau “0".

catatan
  • Metadata peristiwa harus dalam huruf besar. Ini peka huruf besar/kecil.

  • Label tidak diperlukan untuk acara login. Namun, kami menyarankan Anda menyertakan metadata EVENT_LABEL dan memberikan label untuk peristiwa login Anda. Tidak apa-apa jika labelnya tidak lengkap atau sporadis. Jika Anda memberikan label, Amazon Fraud Detector akan menggunakannya untuk menghitung Account Takeover Discovery Rate secara otomatis dan menampilkannya dalam bagan dan tabel kinerja model.

Variabel peristiwa

Untuk model Account Takeover Insights, ada variabel wajib (wajib) yang harus Anda sediakan dan variabel opsional. Ketika Anda membuat variabel Anda, pastikan untuk menetapkan variabel ke jenis variabel yang tepat. Sebagai bagian dari proses pelatihan model, Amazon Fraud Detector menggunakan tipe variabel yang terkait dengan variabel untuk melakukan pengayaan variabel dan rekayasa fitur.

catatan

Nama variabel peristiwa harus dalam huruf kecil. Mereka peka huruf besar/kecil.

Variabel wajib

Variabel berikut diperlukan untuk melatih model Accounts Takeover Insights.

Kategori Jenis variabel Deskripsi

Alamat IP

IP_ALAMAT

Alamat IP yang digunakan dalam acara login

Browser dan perangkat

AGEN PENGGUNA

Browser, perangkat, dan OS yang digunakan dalam acara login

Kredensi yang valid

VALIDCRED

Menunjukkan apakah kredensyal yang digunakan untuk login valid

Variabel opsional

Variabel berikut bersifat opsional untuk melatih model Accounts Takeover Insights.

Kategori Tipe Deskripsi

Browser dan perangkat

SIDIK JARI

Pengidentifikasi unik untuk browser atau sidik jari perangkat

Id Sesi

SESSION_ID

Pengidentifikasi untuk sesi otentikasi

Label

EVENT_LABEL

Label yang mengklasifikasikan acara sebagai penipuan atau sah. Anda dapat menggunakan label apa pun, seperti “penipuan”, “legit”, “1", atau “0".

Stempel Waktu

LABEL_TIMESTAMP

Stempel waktu saat label terakhir diperbarui. Ini diperlukan jika EVENT_LABEL disediakan.

catatan
  • Anda dapat memberikan nama variabel untuk kedua variabel wajib variabel opsional. Sangat penting bahwa setiap variabel wajib dan opsional ditetapkan ke jenis variabel yang tepat.

  • Anda dapat memberikan variabel tambahan. Namun, Amazon Fraud Detector tidak akan menyertakan variabel ini untuk melatih model Accounts Takeover Insights.

Memilih data

Mengumpulkan data merupakan langkah penting untuk membuat model Account Takeover Insights Anda. Saat Anda mulai mengumpulkan data login Anda, pertimbangkan persyaratan dan rekomendasi berikut:

Diperlukan

  • Berikan setidaknya 1.500 contoh akun pengguna, masing-masing dengan setidaknya dua peristiwa login terkait.

  • Dataset Anda harus mencakup setidaknya 30 hari peristiwa login. Anda nantinya dapat menentukan rentang waktu tertentu dari peristiwa yang akan digunakan untuk melatih model.

Direkomendasikan

  • Dataset Anda mencakup contoh peristiwa login yang gagal. Anda dapat secara opsional memberi label login yang gagal ini sebagai “penipuan” atau “sah.”

  • Siapkan data historis dengan acara login yang mencakup lebih dari enam bulan dan sertakan 100 ribu entitas.

Jika Anda tidak memiliki kumpulan data yang sudah memenuhi persyaratan minimum, pertimbangkan streaming data peristiwa ke Amazon Fraud Detector dengan memanggil operasi SendEventAPI.

Memvalidasi data

Sebelum membuat model Account Takeover Insights, Amazon Fraud Detector memeriksa apakah metadata dan variabel yang Anda sertakan dalam kumpulan data untuk melatih model memenuhi persyaratan ukuran dan format. Untuk informasi selengkapnya, lihat Validasi data. Ini juga memeriksa persyaratan lain. Jika dataset tidak lulus validasi, model tidak dibuat. Agar model berhasil dibuat, pastikan untuk memperbaiki data yang tidak lulus validasi sebelum Anda berlatih lagi.

Kesalahan kumpulan data umum

Saat memvalidasi kumpulan data untuk melatih model Account Takeover Insights, Amazon Fraud Detector memindai masalah ini dan masalah lainnya dan menimbulkan error jika mengalami satu atau beberapa masalah.

  • File CSV tidak dalam format UTF-8.

  • Header file CSV tidak berisi setidaknya satu dari metadata berikut:EVENT_ID,, ENTITY_ID atau. EVENT_TIMESTAMP

  • Header file CSV tidak berisi setidaknya satu variabel dari jenis variabel berikut:IP_ADDRESS,USERAGENT, atauVALIDCRED.

  • Ada lebih dari satu variabel yang terkait dengan tipe variabel yang sama.

  • Lebih dari 0,1% nilai dalam EVENT_TIMESTAMP berisi nol atau nilai selain format tanggal dan stempel waktu yang didukung.

  • Jumlah hari antara acara pertama dan terakhir kurang dari 30 hari.

  • Lebih dari 10% variabel tipe IP_ADDRESS variabel tidak valid atau null.

  • Lebih dari 50% variabel tipe USERAGENT variabel mengandung null.

  • Semua variabel dari tipe VALIDCRED variabel diatur kefalse.