Variabel - Amazon Fraud Detector

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Variabel

Variabel mewakili elemen data yang ingin Anda gunakan dalam prediksi penipuan. Variabel-variabel ini dapat diambil dari kumpulan data acara yang Anda siapkan untuk melatih model Anda, dari output skor risiko model Amazon Fraud Detector Anda, atau dari model Amazon SageMaker AI. Untuk informasi selengkapnya tentang variabel yang diambil dari kumpulan data peristiwa, lihatDapatkan persyaratan set data acara menggunakan penjelajah model Data.

Variabel yang ingin Anda gunakan dalam prediksi penipuan Anda harus terlebih dahulu dibuat dan kemudian ditambahkan ke acara saat membuat jenis acara Anda. Setiap variabel yang Anda buat harus diberi tipe data, nilai default, dan opsional tipe variabel. Amazon Fraud Detector memperkaya beberapa variabel yang Anda berikan seperti alamat IP, nomor identifikasi bank (BINs), dan nomor telepon, untuk membuat input tambahan dan meningkatkan kinerja model yang menggunakan variabel ini.

Jenis data

Variabel harus memiliki tipe data untuk elemen data yang mewakili variabel dan secara opsional dapat diberikan salah satu yang telah Jenis variabel ditentukan. Untuk variabel yang ditetapkan ke tipe variabel, tipe data dipilih sebelumnya. Jenis data yang mungkin termasuk jenis berikut:

Tipe data Deskripsi Nilai default Contoh nilai
String Kombinasi huruf, bilangan bulat, atau keduanya <empty>

abc, 123, 1D3B

Bilangan Bulat Bilangan bulat positif atau negatif 0 1, -1
Boolean Benar atau Salah False Betul, Salah
DateTime Tanggal dan waktu yang ditentukan dalam format UTC standar ISO 8601 saja <empty> 2019-11-30T 13:01:01 Z
Desimal Angka dengan poin desimal 0.0 4.01, 0,10

Nilai default

Variabel harus memiliki nilai default. Saat Amazon Fraud Detector menghasilkan prediksi penipuan, nilai default ini digunakan untuk menjalankan aturan atau model jika Amazon Fraud Detector tidak menerima nilai untuk variabel. Nilai default yang Anda berikan harus sesuai dengan tipe data yang dipilih. Di AWS Console, Amazon Fraud Detector menetapkan nilai default 0 untuk bilangan bulat, untuk Boolean, false untuk float, dan (kosong) 0.0 untuk string. Anda dapat menetapkan nilai default kustom untuk salah satu tipe data ini.

Jenis variabel

Saat Anda membuat variabel, Anda dapat secara opsional menetapkan variabel ke tipe variabel. Jenis variabel mewakili elemen data umum yang digunakan untuk melatih model dan untuk menghasilkan prediksi penipuan. Hanya variabel dengan tipe variabel terkait yang dapat digunakan untuk pelatihan model. Sebagai bagian dari proses pelatihan model, Amazon Fraud Detector menggunakan tipe variabel yang terkait dengan variabel untuk melakukan pengayaan variabel, rekayasa fitur, dan penilaian risiko.

Amazon Fraud Detector telah menentukan jenis variabel berikut yang dapat digunakan untuk menetapkan variabel Anda.

Kategori Jenis variabel Deskripsi Tipe data Contoh
Sesi IP_ALAMAT Alamat IP yang dikumpulkan selama acara String 192.0.2.0

Catatan: Amazon Fraud Detector memperkaya data ini. Untuk informasi selengkapnya, silakan lihat Pengayaan geolokasi

AGEN PENGGUNA Agen pengguna yang dikumpulkan selama acara String Mozilla 5.0 (Windows NT 10.0, Win64, x64, rv:68.0) Tokek 20100101
SIDIK JARI Pengenal unik untuk perangkat yang digunakan untuk acara String sadfow987u234
SESSION_ID ID sesi untuk sesi aktif acara String sid123456789
ARE_CREDENTIALS_VALID Menunjukkan apakah kredensional yang digunakan untuk login acara valid Boolean True
Pengguna EMAIL_ALAMAT Alamat email yang dikumpulkan selama acara String abc@domain.com
TELEPON_NOMOR Nomor telepon yang dikumpulkan selama acara String +1 555-0100

Catatan: Amazon Fraud Detector memperkaya data ini. Untuk informasi selengkapnya, silakan lihat Pengayaan nomor telepon

Penagihan BILLING_NAME Nama yang terkait dengan alamat penagihan String John Doe
BILLING_PHONE Nomor telepon yang terkait dengan alamat penagihan String +1 555-0100

Catatan: Amazon Fraud Detector memperkaya data ini. Untuk informasi selengkapnya, silakan lihat Pengayaan nomor telepon

BILLING_ADDRESS_L1 Baris pertama dari alamat penagihan String Jalan apa saja
BILLING_ADDRESS_L2 Baris kedua dari alamat penagihan String Setiap unit 123
BILLING_CITY Kota yang ada di alamat penagihan String Kota mana saja
BILLING_STATE Negara bagian atau provinsi yang ada di alamat penagihan String Setiap negara bagian atau provinsi
BILLING_COUNTRY Negara yang ada di alamat penagihan String Negara manapun

Catatan: Amazon Fraud Detector memperkaya data ini. Untuk informasi selengkapnya, silakan lihat Pengayaan geolokasi

TAGIHAN_ZIP Kode pos yang ada di alamat penagihan String 01234

Catatan: Amazon Fraud Detector memperkaya data ini. Untuk informasi selengkapnya, silakan lihat Pengayaan geolokasi

Pengiriman SHIPPING_NAME Nama yang terkait dengan alamat pengiriman String John Doe
SHIPPING_PHONE Nomor telepon yang terkait dengan alamat pengiriman String +1 555-0100

Catatan: Amazon Fraud Detector memperkaya data ini. Untuk informasi selengkapnya, silakan lihat Pengayaan nomor telepon

PENGIRIMAN_ADDRESS_L1 Baris pertama dari alamat pengiriman String 123 Jalan Apa Saja
PENGIRIMAN_ADDRESS_L2 Baris kedua dari alamat pengiriman String Satuan 123
SHIPPING_CITY Kota yang ada di alamat pengiriman String Kota mana saja
SHIPPING_STATE Negara bagian atau provinsi yang ada di alamat pengiriman String Negara manapun
PENGIRIMAN_COUNTRY Negara yang ada di alamat pengiriman String Negara manapun

Catatan: Amazon Fraud Detector memperkaya data ini. Untuk informasi selengkapnya, silakan lihat Pengayaan geolokasi

PENGIRIMAN_ZIP Kode pos yang ada di alamat pengiriman String 01234

Catatan: Amazon Fraud Detector memperkaya data ini. Untuk informasi selengkapnya, silakan lihat Pengayaan geolokasi

Pembayaran ORDER_ID Pengenal unik untuk transaksi String LUX60
HARGA Total harga pesanan String 560,00
CURRENCY_CODE Kode mata uang ISO 4217 String USD
PAYMENT_TYPE Metode pembayaran yang digunakan untuk pembayaran selama acara berlangsung String Kartu kredit
AUTH_KODE Kode alfanumerik yang dikirim oleh penerbit kartu kredit atau bank penerbit String 0000
AVS Kode respons sistem verifikasi alamat (AVS) dari prosesor kartu String T
Produk PRODUCT_CATEGORY Kategori produk barang pesanan String Dapur
Kustom NUMERIC Variabel apa pun yang dapat direpresentasikan sebagai bilangan real Desimal 1.224
KATEGORIS Variabel apa pun yang menggambarkan kategori, segmen, atau grup String Besar
FREE_FORM_TEXT Teks formulir gratis apa pun yang diambil sebagai bagian dari acara (misalnya, ulasan atau komentar pelanggan) String Contoh input teks formulir gratis

Menetapkan variabel ke tipe variabel

Jika Anda berencana menggunakan variabel untuk melatih model Anda, penting bagi Anda untuk memilih jenis variabel yang tepat untuk ditetapkan ke variabel. Penetapan tipe variabel yang salah dapat berdampak negatif pada kinerja model Anda. Ini juga bisa menjadi sangat sulit bagi Anda mengubah tugas nanti, terutama jika beberapa model dan acara telah menggunakan variabel.

Anda dapat menetapkan variabel Anda salah satu dari jenis variabel yang telah ditentukan sebelumnya atau salah satu jenis variabel kustom —FREE_FORM_TEXT,CATEGORICAL, atau. NUMERIC

Catatan penting untuk menetapkan variabel ke tipe variabel yang tepat

  1. Jika variabel cocok dengan salah satu jenis variabel yang telah ditentukan, gunakan itu. Pastikan tipe variabel sesuai dengan variabel. Misalnya, jika Anda menetapkan variabel ip_address ke EMAIL_ADDRESS tipe variabel, variabel ip_address tidak akan diperkaya dengan pengayaan seperti ASN, ISP, geo-location, dan skor risiko. Untuk informasi selengkapnya, lihat Pengayaan variabel.

  2. Jika variabel tidak cocok dengan jenis variabel yang telah ditentukan sebelumnya, ikuti rekomendasi yang tercantum di bawah ini untuk menetapkan salah satu jenis variabel kustom.

  3. Tetapkan tipe CATEGORICAL variabel ke variabel yang biasanya tidak memiliki urutan alami dan dapat dimasukkan ke dalam kategori, segmen, atau grup. Dataset yang Anda gunakan untuk melatih model Anda mungkin memiliki variabel ID seperti, merchant_id, campaign_id, atau policy_id. Variabel ini mewakili grup (misalnya, semua pelanggan dengan policy_id yang sama mewakili grup). Variabel yang memiliki data berikut harus diberi tipe variabel CATEGORICAL -

    • Variabel yang berisi data seperti Customer_ID, Segment_ID, Color_ID, department_code, atau Product_ID.

    • Variabel yang berisi data Boolean dengan nilai true, false, atau null.

    • Variabel yang dapat dimasukkan ke dalam kelompok atau kategori seperti nama perusahaan, kategori produk, jenis kartu, atau media rujukan.

    catatan

    ENTITY_IDadalah tipe variabel cadangan yang digunakan oleh Amazon Fraud Detector untuk menetapkan ke variabel ENTITY_ID. Variabel ENTITY_ID adalah ID entitas yang memulai tindakan yang ingin Anda evaluasi. Jika Anda membuat tipe model Transaction Fraud Insight (TFI), Anda harus menyediakan variabel ENTITY_ID. Anda harus memutuskan variabel mana dalam data Anda yang secara unik mengidentifikasi entitas yang memulai tindakan dan meneruskannya sebagai variabel ENTITY_ID. Tetapkan tipe variabel CATEGORICAL ke semua yang lain IDs dalam dataset Anda, jika ada dan jika Anda menggunakannya untuk pelatihan model. Contoh lain IDs yang bukan entitas dalam kumpulan data Anda dapat berupa Merchant_ID, Policy_ID, dan Campaign_ID.

  4. Tetapkan tipe FREE_FORM_TEXT variabel ke variabel yang berisi blok teks. Contoh tipe variabel FREE_FORM_TEXT adalah — ulasan pengguna, komentar, tanggal, dan kode rujukan. Data FREE_FORM_TEXT berisi beberapa token yang dipisahkan oleh pembatas. Pembatas dapat berupa karakter apa pun selain simbol alfa-numerik dan garis bawah. Misalnya, ulasan dan komentar pengguna dapat dipisahkan oleh pembatas “spasi”, tanggal dan kode rujukan dapat menggunakan tanda hubung sebagai pembatas untuk memisahkan awalan, akhiran, dan bagian tengah. Amazon Fraud Detector menggunakan pembatas untuk mengekstrak data dari variabel FREE_FORM_TEXT.

  5. Tetapkan tipe variabel NUMERIK ke variabel yang merupakan bilangan real dan memiliki urutan yang melekat. Contoh variabel NUMERIK termasuk day_of_the_week, incident_severity, customer_rating. Meskipun, Anda dapat menetapkan tipe variabel CATEGORICAL ke variabel-variabel ini, kami sangat menyarankan untuk menetapkan semua variabel bilangan real dengan urutan yang melekat pada tipe variabel NUMERIK.

Pengayaan variabel

Amazon Fraud Detector memperkaya beberapa elemen data mentah yang Anda berikan seperti alamat IP, nomor identifikasi bank (BINs), dan nomor telepon, untuk membuat input tambahan dan meningkatkan kinerja model yang menggunakan elemen data ini. Pengayaan membantu mengidentifikasi situasi yang berpotensi mencurigakan dan membantu model untuk menangkap lebih banyak penipuan.

Pengayaan nomor telepon

Amazon Fraud Detector memperkaya data nomor telepon dengan informasi tambahan yang berkaitan dengan geolokasi, operator asli, dan validitas nomor telepon. Pengayaan nomor telepon diaktifkan secara otomatis untuk semua model yang dilatih pada atau setelah 13 Desember 2021 dan memiliki nomor telepon yang menyertakan kode negara (+xxx). Jika Anda telah memasukkan variabel nomor telepon ke dalam model Anda dan telah melatihnya sebelum 13 Desember 2021, latih kembali model Anda sehingga dapat memanfaatkan pengayaan ini.

Kami sangat menyarankan Anda menggunakan format berikut untuk variabel nomor telepon untuk memastikan bahwa data Anda berhasil diperkaya.

Variabel format Deskripsi
TELEPON_NOMOR Standar E.164 Pastikan untuk menyertakan kode negara (+xxx) dengan nomor telepon.
BILLING_PHONE dan SHIPPING_PHONE Standar E.164 Pastikan untuk menyertakan kode negara (+xxx) dengan nomor telepon.

Pengayaan geolokasi

Mulai 8 Februari 2022 Amazon Fraud Detector menghitung jarak fisik antara nilai IP_ADDRESS, BILLING_ZIP, dan SHIPPING_ZIP yang Anda berikan untuk suatu peristiwa. Jarak yang dihitung digunakan sebagai input untuk model deteksi penipuan Anda.

Untuk mengaktifkan pengayaan geolokasi, data acara Anda harus menyertakan setidaknya dua dari tiga variabel: IP_ADDRESS, BILLING_ZIP, atau SHIPPING_ZIP. Selain itu, setiap nilai BILLING_ZIP dan SHIPPING_ZIP harus memiliki kode BILLING_COUNTRY yang valid dan kode SHIPPING_COUNTRY masing-masing. Jika Anda memiliki model yang dilatih sebelum 8 Februari 2022 dan menyertakan variabel-variabel ini, Anda harus melatih kembali model tersebut untuk mengaktifkan pengayaan geolokasi.

Jika Amazon Fraud Detector tidak dapat menentukan lokasi yang terkait dengan nilai IP_ADDRESS, BILLING_ZIP, atau SHIPPING_ZIP untuk peristiwa karena data tidak valid, nilai placeholder khusus akan digunakan sebagai gantinya. Misalnya, misalkan suatu peristiwa memiliki nilai IP_ADDRESS dan BILLING_ZIP yang valid, tetapi nilai SHIPPING_ZIP tidak valid. Dalam hal ini, pengayaan dilakukan hanya untuk IP_ADDRESS-> BILLING_ZIP. Pengayaan tidak dilakukan untuk IP_ADDRESS-> SHIPPING_ZIP dan BILLING_ZIP—>SHIPPING_ZIP. Sebaliknya, nilai placeholder digunakan di tempatnya. Tidak masalah apakah pengayaan geolokasi diaktifkan untuk model Anda atau tidak, kinerja model Anda tidak berubah.

Anda dapat memilih keluar dari pengayaan geolokasi dengan memetakan variabel BILLING_ZIP dan SHIPPING_ZIP Anda ke tipe variabel CUSTOM_CATEGORICAL. Mengubah tipe variabel tidak memengaruhi kinerja model Anda.

Format variabel geolokasi

Kami sangat menyarankan Anda menggunakan format berikut untuk variabel geolokasi untuk memastikan bahwa data lokasi Anda berhasil diperkaya.

Variabel format Deskripsi
IP_ALAMAT IPv4alamat Misalnya - 1.1.1.1
BILLING_ZIP dan SHIPPING_ZIP Kode pos ISO 3166-1 alpha-2 untuk negara yang ditentukan Untuk informasi selengkapnya, lihat bagian Kode negara dan wilayah dalam topik ini.
BILLING_COUNTRY dan SHIPPING_COUNTRY Kode negara standar dua huruf ISO 3166-1 alpha-2 Untuk informasi selengkapnya, lihat bagian Kode negara dan wilayah dalam topik ini. Amazon Fraud Detector mencoba mencocokkan semua variasi umum nama suatu negara dengan kode negara standar dua huruf ISO 3166-1 mereka. Namun, kami tidak dapat menjamin mereka akan dicocokkan dengan benar.

Tabel berikut menyediakan daftar lengkap negara dan wilayah yang didukung oleh Amazon Fraud Detector untuk pengayaan geolokasi. Setiap negara dan wilayah memiliki kode negara yang ditetapkan (khususnya, kode negara dua huruf ISO 3166-1 alpha-2) dan kode pos.

Format kode pos

  • 9 - angka

  • a - surat

  • [X] - X adalah opsional. Misalnya, Guersney "GY9[9] 9aa” berarti “9aa” dan “GY9 9aa” GY99 valid. Gunakan satu format.

  • [X/XX] - baik X atau XX dapat digunakan. Misalnya, Bermuda “aa [aa/99]” berarti “aa aa” dan “aa 99" adalah valid. Gunakan salah satu dari format ini, tetapi jangan gunakan keduanya.

  • Beberapa negara memiliki awalan tetap. Misalnya, kode pos untuk Andorra adalah. AD999 Ini berarti kode negara harus dimulai dengan huruf AD diikuti oleh tiga angka.

Code Nama Kode Pos
AD Andorra AD999
AR Antillen Belanda 9999
DI Austria 9999
AU Australia 9999
AZ Azerbaijan AZ 9999
BD Bangladesh 9999
ADA Belgium 9999
BG Bulgaria 9999
BM Bermuda aa [aa/99]
OLEH Belarus 999999
CA Kanada a9a 9a9
CH Swiss 9999
CL Chili 9999999
CO Kolombia 999999
CR Kosta Rika 99999
CY Cyprus 9999
CZ Ceko 999 99
DE Germany 99999
DK Denmark 9999
BERBUAT Republik Dominika 99999
DZ Aljazair 99999
EE Estonia 99999
ES Spain 99999
FI Finland 99999
FM Negara Federasi Mikronesia 99999
FO Kepulauan Faroe 999
FR France 99999
GB Britania Raya a [a] 9 [a/9] 9aa
GG Guernsey GY9[9] 9aa
GL Greenland 9999
GP Guadeloupe 99999
GT Guatemala 99999
GU Guam 99999
JAM Croatia 99999
HU Hungary 9999
YAKNI Ireland a99 [a/9] [a/9] [a/9] [a/9]
IM Pulau Man IM9[9] 9aa
DI DALAM India 999999
ADALAH Islandia 999
IA Italy 99999
JE Jersey JE9[9] 9aa
JP Jepang 999-9999
KR Republik Korea 99999
LI Liechtenstein 9999
LK Sri Lanka 99999
LT Lithuania 99999
LU Luxembourg L-9999
LV Latvia LV-9999
MC Monako 99999
MD Republik Moldova 9999
MH Kepulauan Marshall 99999
MK Makedonia Utara 9999
MP Kepulauan Mariana Utara 99999
MQ Matinique 99999
MT Malta aaa 9999
MX Meksiko 99999
SAYA Malaysia 99999
NL Netherlands 9999 aa
TIDAK Norwegia 9999
NZ Selandia Baru 9999
PH Filipina 9999
PK Pakistan 99999
PL Poland 99-999
PR Puerto Riko 99999
PT Portugal 9999-999
PW Palau 99999
KEMBALI

Reunion

99999
RO Romania 999999
RU Federasi Rusia 999999
SE Sweden 999 99
SG Singapura 999999
SI Slovenia 9999
SK Slovakia 999 99
SM San Marino 99999
TH Thailand 99999
TR Turki 99999
UA Ukraina 99999
AS Amerika Serikat 99999
UY Uruguay 99999
VI Kepulauan Virgin, AS 99999
WF Wallis dan Futuna 99999
YT Mayotte 99999
ZA Afrika Selatan 9999

Pengayaan Useragent

Jika Anda membuat model Account Takeover Insights (ATI), Anda harus menyediakan variabel tipe useragent variabel dalam kumpulan data Anda. Variabel ini berisi browser, perangkat, dan data OS dari peristiwa login. Amazon Fraud Detector memperkaya data agen pengguna dengan informasi tambahan seperti user_agent_familyOS_family, dan. device_family