Kami tidak lagi memperbarui layanan Amazon Machine Learning atau menerima pengguna baru untuk itu. Dokumentasi ini tersedia untuk pengguna yang sudah ada, tetapi kami tidak lagi memperbaruinya. Untuk informasi selengkapnya, lihat Apa itu Amazon Machine Learning.
Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Pentingnya Transformasi Fitur
Pertimbangkan model pembelajaran mesin yang tugasnya adalah untuk memutuskan apakah transaksi kartu kredit adalah penipuan atau tidak. Berdasarkan pengetahuan latar belakang aplikasi dan analisis data, Anda mungkin memutuskan bidang data (atau fitur) mana yang penting untuk disertakan dalam data input. Misalnya, jumlah transaksi, nama pedagang, alamat, dan alamat pemilik kartu kredit penting untuk diberikan kepada proses pembelajaran. Di sisi lain, ID transaksi yang dihasilkan secara acak tidak membawa informasi (jika kita tahu bahwa itu benar-benar acak), dan tidak berguna.
Setelah Anda memutuskan bidang mana yang akan disertakan, Anda mengubah fitur ini untuk membantu proses pembelajaran. Transformasi menambah pengalaman latar belakang ke data input, memungkinkan model pembelajaran mesin untuk mendapatkan keuntungan dari pengalaman ini. Sebagai contoh, alamat merchant berikut direpresentasikan sebagai string:
“123 Jalan Utama, Seattle, WA 98101"
Dengan sendirinya, alamat memiliki kekuatan ekspresif terbatas - ini hanya berguna untuk pola belajar yang terkait dengan alamat yang tepat. Memecahnya menjadi bagian-bagian penyusunnya, bagaimanapun, dapat membuat fitur tambahan seperti “Alamat” (123 Main Street), “Kota” (Seattle), “Negara” (WA) dan “Zip” (98101). Sekarang, algoritma pembelajaran dapat mengelompokkan transaksi yang lebih berbeda bersama-sama, dan menemukan pola yang lebih luas - mungkin beberapa kode pos pedagang mengalami aktivitas yang lebih curang daripada yang lain.
Untuk informasi selengkapnya tentang pendekatan dan proses transformasi fitur, lihatKonsep Machine Learning.