Cocok model: Overfitting vs. Overfitting - Amazon Machine Learning

Kami tidak lagi memperbarui layanan Amazon Machine Learning atau menerima pengguna baru untuk itu. Dokumentasi ini tersedia untuk pengguna yang sudah ada, tetapi kami tidak lagi memperbaruinya. Untuk informasi selengkapnya, lihatApa itu Amazon Machine Learning.

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Cocok model: Overfitting vs. Overfitting

Memahami model fit penting untuk memahami akar penyebab akurasi model yang buruk. Pemahaman ini akan memandu Anda untuk mengambil langkah-langkah korektif. Kita dapat menentukan apakah model prediktif adalah underfitting atau overfitting data pelatihan dengan melihat kesalahan prediksi pada data pelatihan dan data evaluasi.

Three graphs showing underfitting, balanced, and overfitting models with data points and trend lines.

Model Andaunderfittingdata pelatihan ketika model melakukan buruk pada data pelatihan. Hal ini karena model tidak dapat menangkap hubungan antara contoh input (sering disebut X) dan nilai target (sering disebut Y). Model AndaoverfittingData pelatihan Anda ketika Anda melihat bahwa model bekerja dengan baik pada data pelatihan tetapi tidak berkinerja baik pada data evaluasi. Hal ini karena model menghafal data yang telah dilihat dan tidak dapat menggeneralisasi contoh yang tak terlihat.

Kinerja yang buruk pada data pelatihan bisa jadi karena modelnya terlalu sederhana (fitur input tidak cukup ekspresif) untuk menggambarkan target dengan baik. Kinerja dapat ditingkatkan dengan meningkatkan fleksibilitas model. Untuk meningkatkan fleksibilitas model, coba hal berikut:

  • Tambahkan fitur khusus domain baru dan lebih banyak fitur produk Cartesian, dan ubah jenis pemrosesan fitur yang digunakan (misalnya, meningkatkan ukuran n-gram)

  • Mengurangi jumlah regularisasi yang digunakan

Jika model Anda kelebihan data pelatihan, masuk akal untuk mengambil tindakan yang mengurangi fleksibilitas model. Untuk mengurangi fleksibilitas model, coba hal berikut:

  • Pilihan fitur: pertimbangkan untuk menggunakan kombinasi fitur yang lebih sedikit, kurangi ukuran n-gram, dan kurangi jumlah tempat sampah atribut numerik.

  • Meningkatkan jumlah regularisasi yang digunakan.

Akurasi pada data pelatihan dan uji bisa menjadi buruk karena algoritma pembelajaran tidak memiliki cukup data untuk dipelajari. Anda dapat meningkatkan kinerja dengan melakukan hal berikut:

  • Meningkatkan jumlah contoh data pelatihan.

  • Tingkatkan jumlah pass pada data pelatihan yang ada.