Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Variabel
Variabel mewakili elemen data yang ingin Anda gunakan dalam prediksi penipuan. Variabel-variabel ini dapat diambil dari kumpulan data acara yang Anda siapkan untuk melatih model Anda, dari output skor risiko model Amazon Fraud Detector Anda, atau dari model Amazon SageMaker AI. Untuk informasi selengkapnya tentang variabel yang diambil dari kumpulan data peristiwa, lihatDapatkan persyaratan set data acara menggunakan penjelajah model Data.
Variabel yang ingin Anda gunakan dalam prediksi penipuan Anda harus terlebih dahulu dibuat dan kemudian ditambahkan ke acara saat membuat jenis acara Anda. Setiap variabel yang Anda buat harus diberi tipe data, nilai default, dan opsional tipe variabel. Amazon Fraud Detector memperkaya beberapa variabel yang Anda berikan seperti alamat IP, nomor identifikasi bank (BINs), dan nomor telepon, untuk membuat input tambahan dan meningkatkan kinerja model yang menggunakan variabel ini.
Jenis data
Variabel harus memiliki tipe data untuk elemen data yang mewakili variabel dan secara opsional dapat diberikan salah satu yang telah Jenis variabel ditentukan. Untuk variabel yang ditetapkan ke tipe variabel, tipe data dipilih sebelumnya. Jenis data yang mungkin termasuk jenis berikut:
Tipe data | Deskripsi | Nilai default | Contoh nilai |
---|---|---|---|
String | Kombinasi huruf, bilangan bulat, atau keduanya | <empty> |
abc, 123, 1D3B |
Bilangan Bulat | Bilangan bulat positif atau negatif | 0 | 1, -1 |
Boolean | Benar atau Salah | False | Betul, Salah |
DateTime | Tanggal dan waktu yang ditentukan dalam format UTC standar ISO 8601 saja | <empty> | 2019-11-30T 13:01:01 Z |
Desimal | Angka dengan poin desimal | 0.0 | 4.01, 0,10 |
Nilai default
Variabel harus memiliki nilai default. Saat Amazon Fraud Detector menghasilkan prediksi penipuan, nilai default ini digunakan untuk menjalankan aturan atau model jika Amazon Fraud Detector tidak menerima nilai untuk variabel. Nilai default yang Anda berikan harus sesuai dengan tipe data yang dipilih. Di AWS Console, Amazon Fraud Detector menetapkan nilai default 0
untuk bilangan bulat, untuk Boolean, false
untuk float, dan (kosong) 0.0
untuk string. Anda dapat menetapkan nilai default kustom untuk salah satu tipe data ini.
Jenis variabel
Saat Anda membuat variabel, Anda dapat secara opsional menetapkan variabel ke tipe variabel. Jenis variabel mewakili elemen data umum yang digunakan untuk melatih model dan untuk menghasilkan prediksi penipuan. Hanya variabel dengan tipe variabel terkait yang dapat digunakan untuk pelatihan model. Sebagai bagian dari proses pelatihan model, Amazon Fraud Detector menggunakan tipe variabel yang terkait dengan variabel untuk melakukan pengayaan variabel, rekayasa fitur, dan penilaian risiko.
Amazon Fraud Detector telah menentukan jenis variabel berikut yang dapat digunakan untuk menetapkan variabel Anda.
Kategori | Jenis variabel | Deskripsi | Tipe data | Contoh |
---|---|---|---|---|
Sesi | IP_ALAMAT | Alamat IP yang dikumpulkan selama acara | String | 192.0.2.0 Catatan: Amazon Fraud Detector memperkaya data ini. Untuk informasi selengkapnya, silakan lihat Pengayaan geolokasi |
AGEN PENGGUNA | Agen pengguna yang dikumpulkan selama acara | String | Mozilla 5.0 (Windows NT 10.0, Win64, x64, rv:68.0) Tokek 20100101 | |
SIDIK JARI | Pengenal unik untuk perangkat yang digunakan untuk acara | String | sadfow987u234 | |
SESSION_ID | ID sesi untuk sesi aktif acara | String | sid123456789 | |
ARE_CREDENTIALS_VALID | Menunjukkan apakah kredensional yang digunakan untuk login acara valid | Boolean | True | |
Pengguna | EMAIL_ALAMAT | Alamat email yang dikumpulkan selama acara | String | abc@domain.com |
TELEPON_NOMOR | Nomor telepon yang dikumpulkan selama acara | String | +1 555-0100 Catatan: Amazon Fraud Detector memperkaya data ini. Untuk informasi selengkapnya, silakan lihat Pengayaan nomor telepon |
|
Penagihan | BILLING_NAME | Nama yang terkait dengan alamat penagihan | String | John Doe |
BILLING_PHONE | Nomor telepon yang terkait dengan alamat penagihan | String | +1 555-0100 Catatan: Amazon Fraud Detector memperkaya data ini. Untuk informasi selengkapnya, silakan lihat Pengayaan nomor telepon |
|
BILLING_ADDRESS_L1 | Baris pertama dari alamat penagihan | String | Jalan apa saja | |
BILLING_ADDRESS_L2 | Baris kedua dari alamat penagihan | String | Setiap unit 123 | |
BILLING_CITY | Kota yang ada di alamat penagihan | String | Kota mana saja | |
BILLING_STATE | Negara bagian atau provinsi yang ada di alamat penagihan | String | Setiap negara bagian atau provinsi | |
BILLING_COUNTRY | Negara yang ada di alamat penagihan | String | Negara manapun Catatan: Amazon Fraud Detector memperkaya data ini. Untuk informasi selengkapnya, silakan lihat Pengayaan geolokasi |
|
TAGIHAN_ZIP | Kode pos yang ada di alamat penagihan | String | 01234 Catatan: Amazon Fraud Detector memperkaya data ini. Untuk informasi selengkapnya, silakan lihat Pengayaan geolokasi |
|
Pengiriman | SHIPPING_NAME | Nama yang terkait dengan alamat pengiriman | String | John Doe |
SHIPPING_PHONE | Nomor telepon yang terkait dengan alamat pengiriman | String | +1 555-0100 Catatan: Amazon Fraud Detector memperkaya data ini. Untuk informasi selengkapnya, silakan lihat Pengayaan nomor telepon |
|
PENGIRIMAN_ADDRESS_L1 | Baris pertama dari alamat pengiriman | String | 123 Jalan Apa Saja | |
PENGIRIMAN_ADDRESS_L2 | Baris kedua dari alamat pengiriman | String | Satuan 123 | |
SHIPPING_CITY | Kota yang ada di alamat pengiriman | String | Kota mana saja | |
SHIPPING_STATE | Negara bagian atau provinsi yang ada di alamat pengiriman | String | Negara manapun | |
PENGIRIMAN_COUNTRY | Negara yang ada di alamat pengiriman | String | Negara manapun Catatan: Amazon Fraud Detector memperkaya data ini. Untuk informasi selengkapnya, silakan lihat Pengayaan geolokasi |
|
PENGIRIMAN_ZIP | Kode pos yang ada di alamat pengiriman | String | 01234 Catatan: Amazon Fraud Detector memperkaya data ini. Untuk informasi selengkapnya, silakan lihat Pengayaan geolokasi |
|
Pembayaran | ORDER_ID | Pengenal unik untuk transaksi | String | LUX60 |
HARGA | Total harga pesanan | String | 560,00 | |
CURRENCY_CODE | Kode mata uang ISO 4217 | String | USD | |
PAYMENT_TYPE | Metode pembayaran yang digunakan untuk pembayaran selama acara berlangsung | String | Kartu kredit | |
AUTH_KODE | Kode alfanumerik yang dikirim oleh penerbit kartu kredit atau bank penerbit | String | 0000 | |
AVS | Kode respons sistem verifikasi alamat (AVS) dari prosesor kartu | String | T | |
Produk | PRODUCT_CATEGORY | Kategori produk barang pesanan | String | Dapur |
Kustom | NUMERIC | Variabel apa pun yang dapat direpresentasikan sebagai bilangan real | Desimal | 1.224 |
KATEGORIS | Variabel apa pun yang menggambarkan kategori, segmen, atau grup | String | Besar | |
FREE_FORM_TEXT | Teks formulir gratis apa pun yang diambil sebagai bagian dari acara (misalnya, ulasan atau komentar pelanggan) | String | Contoh input teks formulir gratis |
Menetapkan variabel ke tipe variabel
Jika Anda berencana menggunakan variabel untuk melatih model Anda, penting bagi Anda untuk memilih jenis variabel yang tepat untuk ditetapkan ke variabel. Penetapan tipe variabel yang salah dapat berdampak negatif pada kinerja model Anda. Ini juga bisa menjadi sangat sulit bagi Anda mengubah tugas nanti, terutama jika beberapa model dan acara telah menggunakan variabel.
Anda dapat menetapkan variabel Anda salah satu dari jenis variabel yang telah ditentukan sebelumnya atau salah satu jenis variabel kustom —FREE_FORM_TEXT
,CATEGORICAL
, atau. NUMERIC
Catatan penting untuk menetapkan variabel ke tipe variabel yang tepat
-
Jika variabel cocok dengan salah satu jenis variabel yang telah ditentukan, gunakan itu. Pastikan tipe variabel sesuai dengan variabel. Misalnya, jika Anda menetapkan variabel ip_address ke
EMAIL_ADDRESS
tipe variabel, variabel ip_address tidak akan diperkaya dengan pengayaan seperti ASN, ISP, geo-location, dan skor risiko. Untuk informasi selengkapnya, lihat Pengayaan variabel. -
Jika variabel tidak cocok dengan jenis variabel yang telah ditentukan sebelumnya, ikuti rekomendasi yang tercantum di bawah ini untuk menetapkan salah satu jenis variabel kustom.
-
Tetapkan tipe
CATEGORICAL
variabel ke variabel yang biasanya tidak memiliki urutan alami dan dapat dimasukkan ke dalam kategori, segmen, atau grup. Dataset yang Anda gunakan untuk melatih model Anda mungkin memiliki variabel ID seperti, merchant_id, campaign_id, atau policy_id. Variabel ini mewakili grup (misalnya, semua pelanggan dengan policy_id yang sama mewakili grup). Variabel yang memiliki data berikut harus diberi tipe variabel CATEGORICAL --
Variabel yang berisi data seperti Customer_ID, Segment_ID, Color_ID, department_code, atau Product_ID.
-
Variabel yang berisi data Boolean dengan nilai true, false, atau null.
-
Variabel yang dapat dimasukkan ke dalam kelompok atau kategori seperti nama perusahaan, kategori produk, jenis kartu, atau media rujukan.
catatan
ENTITY_ID
adalah tipe variabel cadangan yang digunakan oleh Amazon Fraud Detector untuk menetapkan ke variabel ENTITY_ID. Variabel ENTITY_ID adalah ID entitas yang memulai tindakan yang ingin Anda evaluasi. Jika Anda membuat tipe model Transaction Fraud Insight (TFI), Anda harus menyediakan variabel ENTITY_ID. Anda harus memutuskan variabel mana dalam data Anda yang secara unik mengidentifikasi entitas yang memulai tindakan dan meneruskannya sebagai variabel ENTITY_ID. Tetapkan tipe variabel CATEGORICAL ke semua yang lain IDs dalam dataset Anda, jika ada dan jika Anda menggunakannya untuk pelatihan model. Contoh lain IDs yang bukan entitas dalam kumpulan data Anda dapat berupa Merchant_ID, Policy_ID, dan Campaign_ID. -
-
Tetapkan tipe
FREE_FORM_TEXT
variabel ke variabel yang berisi blok teks. Contoh tipe variabel FREE_FORM_TEXT adalah — ulasan pengguna, komentar, tanggal, dan kode rujukan. Data FREE_FORM_TEXT berisi beberapa token yang dipisahkan oleh pembatas. Pembatas dapat berupa karakter apa pun selain simbol alfa-numerik dan garis bawah. Misalnya, ulasan dan komentar pengguna dapat dipisahkan oleh pembatas “spasi”, tanggal dan kode rujukan dapat menggunakan tanda hubung sebagai pembatas untuk memisahkan awalan, akhiran, dan bagian tengah. Amazon Fraud Detector menggunakan pembatas untuk mengekstrak data dari variabel FREE_FORM_TEXT. -
Tetapkan tipe variabel NUMERIK ke variabel yang merupakan bilangan real dan memiliki urutan yang melekat. Contoh variabel NUMERIK termasuk day_of_the_week, incident_severity, customer_rating. Meskipun, Anda dapat menetapkan tipe variabel CATEGORICAL ke variabel-variabel ini, kami sangat menyarankan untuk menetapkan semua variabel bilangan real dengan urutan yang melekat pada tipe variabel NUMERIK.
Pengayaan variabel
Amazon Fraud Detector memperkaya beberapa elemen data mentah yang Anda berikan seperti alamat IP, nomor identifikasi bank (BINs), dan nomor telepon, untuk membuat input tambahan dan meningkatkan kinerja model yang menggunakan elemen data ini. Pengayaan membantu mengidentifikasi situasi yang berpotensi mencurigakan dan membantu model untuk menangkap lebih banyak penipuan.
Pengayaan nomor telepon
Amazon Fraud Detector memperkaya data nomor telepon dengan informasi tambahan yang berkaitan dengan geolokasi, operator asli, dan validitas nomor telepon. Pengayaan nomor telepon diaktifkan secara otomatis untuk semua model yang dilatih pada atau setelah 13 Desember 2021 dan memiliki nomor telepon yang menyertakan kode negara (+xxx). Jika Anda telah memasukkan variabel nomor telepon ke dalam model Anda dan telah melatihnya sebelum 13 Desember 2021, latih kembali model Anda sehingga dapat memanfaatkan pengayaan ini.
Kami sangat menyarankan Anda menggunakan format berikut untuk variabel nomor telepon untuk memastikan bahwa data Anda berhasil diperkaya.
Pengayaan geolokasi
Mulai 8 Februari 2022 Amazon Fraud Detector menghitung jarak fisik antara nilai IP_ADDRESS, BILLING_ZIP, dan SHIPPING_ZIP yang Anda berikan untuk suatu peristiwa. Jarak yang dihitung digunakan sebagai input untuk model deteksi penipuan Anda.
Untuk mengaktifkan pengayaan geolokasi, data acara Anda harus menyertakan setidaknya dua dari tiga variabel: IP_ADDRESS, BILLING_ZIP, atau SHIPPING_ZIP. Selain itu, setiap nilai BILLING_ZIP dan SHIPPING_ZIP harus memiliki kode BILLING_COUNTRY yang valid dan kode SHIPPING_COUNTRY masing-masing. Jika Anda memiliki model yang dilatih sebelum 8 Februari 2022 dan menyertakan variabel-variabel ini, Anda harus melatih kembali model tersebut untuk mengaktifkan pengayaan geolokasi.
Jika Amazon Fraud Detector tidak dapat menentukan lokasi yang terkait dengan nilai IP_ADDRESS, BILLING_ZIP, atau SHIPPING_ZIP untuk peristiwa karena data tidak valid, nilai placeholder khusus akan digunakan sebagai gantinya. Misalnya, misalkan suatu peristiwa memiliki nilai IP_ADDRESS dan BILLING_ZIP yang valid, tetapi nilai SHIPPING_ZIP tidak valid. Dalam hal ini, pengayaan dilakukan hanya untuk IP_ADDRESS-> BILLING_ZIP. Pengayaan tidak dilakukan untuk IP_ADDRESS-> SHIPPING_ZIP dan BILLING_ZIP—>SHIPPING_ZIP. Sebaliknya, nilai placeholder digunakan di tempatnya. Tidak masalah apakah pengayaan geolokasi diaktifkan untuk model Anda atau tidak, kinerja model Anda tidak berubah.
Anda dapat memilih keluar dari pengayaan geolokasi dengan memetakan variabel BILLING_ZIP dan SHIPPING_ZIP Anda ke tipe variabel CUSTOM_CATEGORICAL. Mengubah tipe variabel tidak memengaruhi kinerja model Anda.
Format variabel geolokasi
Kami sangat menyarankan Anda menggunakan format berikut untuk variabel geolokasi untuk memastikan bahwa data lokasi Anda berhasil diperkaya.
Variabel | format | Deskripsi |
---|---|---|
IP_ALAMAT | IPv4 |
Misalnya - 1.1.1.1 |
BILLING_ZIP dan SHIPPING_ZIP | Kode pos ISO 3166-1 alpha-2 |
Untuk informasi selengkapnya, lihat bagian Kode negara dan wilayah dalam topik ini. |
BILLING_COUNTRY dan SHIPPING_COUNTRY | Kode negara standar dua huruf ISO 3166-1 alpha-2 |
Untuk informasi selengkapnya, lihat bagian Kode negara dan wilayah dalam topik ini. Amazon Fraud Detector mencoba mencocokkan semua variasi umum nama suatu negara dengan kode negara standar dua huruf ISO 3166-1 mereka. Namun, kami tidak dapat menjamin mereka akan dicocokkan dengan benar. |
Tabel berikut menyediakan daftar lengkap negara dan wilayah yang didukung oleh Amazon Fraud Detector untuk pengayaan geolokasi. Setiap negara dan wilayah memiliki kode negara yang ditetapkan (khususnya, kode negara dua huruf ISO 3166-1 alpha-2) dan kode pos.
Format kode pos
9 - angka
a - surat
[X] - X adalah opsional. Misalnya, Guersney "GY9[9] 9aa” berarti “9aa” dan “GY9 9aa” GY99 valid. Gunakan satu format.
[X/XX] - baik X atau XX dapat digunakan. Misalnya, Bermuda “aa [aa/99]” berarti “aa aa” dan “aa 99" adalah valid. Gunakan salah satu dari format ini, tetapi jangan gunakan keduanya.
Beberapa negara memiliki awalan tetap. Misalnya, kode pos untuk Andorra adalah. AD999 Ini berarti kode negara harus dimulai dengan huruf AD diikuti oleh tiga angka.
Code | Nama | Kode Pos |
---|---|---|
AD | Andorra | AD999 |
AR | Antillen Belanda | 9999 |
DI | Austria | 9999 |
AU | Australia | 9999 |
AZ | Azerbaijan | AZ 9999 |
BD | Bangladesh | 9999 |
ADA | Belgium | 9999 |
BG | Bulgaria | 9999 |
BM | Bermuda | aa [aa/99] |
OLEH | Belarus | 999999 |
CA | Kanada | a9a 9a9 |
CH | Swiss | 9999 |
CL | Chili | 9999999 |
CO | Kolombia | 999999 |
CR | Kosta Rika | 99999 |
CY | Cyprus | 9999 |
CZ | Ceko | 999 99 |
DE | Germany | 99999 |
DK | Denmark | 9999 |
BERBUAT | Republik Dominika | 99999 |
DZ | Aljazair | 99999 |
EE | Estonia | 99999 |
ES | Spain | 99999 |
FI | Finland | 99999 |
FM | Negara Federasi Mikronesia | 99999 |
FO | Kepulauan Faroe | 999 |
FR | France | 99999 |
GB | Britania Raya | a [a] 9 [a/9] 9aa |
GG | Guernsey | GY9[9] 9aa |
GL | Greenland | 9999 |
GP | Guadeloupe | 99999 |
GT | Guatemala | 99999 |
GU | Guam | 99999 |
JAM | Croatia | 99999 |
HU | Hungary | 9999 |
YAKNI | Ireland | a99 [a/9] [a/9] [a/9] [a/9] |
IM | Pulau Man | IM9[9] 9aa |
DI DALAM | India | 999999 |
ADALAH | Islandia | 999 |
IA | Italy | 99999 |
JE | Jersey | JE9[9] 9aa |
JP | Jepang | 999-9999 |
KR | Republik Korea | 99999 |
LI | Liechtenstein | 9999 |
LK | Sri Lanka | 99999 |
LT | Lithuania | 99999 |
LU | Luxembourg | L-9999 |
LV | Latvia | LV-9999 |
MC | Monako | 99999 |
MD | Republik Moldova | 9999 |
MH | Kepulauan Marshall | 99999 |
MK | Makedonia Utara | 9999 |
MP | Kepulauan Mariana Utara | 99999 |
MQ | Matinique | 99999 |
MT | Malta | aaa 9999 |
MX | Meksiko | 99999 |
SAYA | Malaysia | 99999 |
NL | Netherlands | 9999 aa |
TIDAK | Norwegia | 9999 |
NZ | Selandia Baru | 9999 |
PH | Filipina | 9999 |
PK | Pakistan | 99999 |
PL | Poland | 99-999 |
PR | Puerto Riko | 99999 |
PT | Portugal | 9999-999 |
PW | Palau | 99999 |
KEMBALI |
Reunion |
99999 |
RO | Romania | 999999 |
RU | Federasi Rusia | 999999 |
SE | Sweden | 999 99 |
SG | Singapura | 999999 |
SI | Slovenia | 9999 |
SK | Slovakia | 999 99 |
SM | San Marino | 99999 |
TH | Thailand | 99999 |
TR | Turki | 99999 |
UA | Ukraina | 99999 |
AS | Amerika Serikat | 99999 |
UY | Uruguay | 99999 |
VI | Kepulauan Virgin, AS | 99999 |
WF | Wallis dan Futuna | 99999 |
YT | Mayotte | 99999 |
ZA | Afrika Selatan | 9999 |
Pengayaan Useragent
Jika Anda membuat model Account Takeover Insights (ATI), Anda harus menyediakan variabel tipe useragent
variabel dalam kumpulan data Anda. Variabel ini berisi browser, perangkat, dan data OS dari peristiwa login. Amazon Fraud Detector memperkaya data agen pengguna dengan informasi tambahan seperti user_agent_family
OS_family
, dan. device_family