Menyetel Model K-NN - Amazon SageMaker

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Menyetel Model K-NN

Algoritma Amazon SageMaker k-terdekat tetangga adalah algoritma yang diawasi. Algoritma menggunakan kumpulan data uji dan memancarkan metrik tentang akurasi untuk tugas klasifikasi atau tentang kesalahan kuadrat rata-rata untuk tugas regresi. Metrik akurasi ini membandingkan prediksi model untuk tugas masing-masing dengan kebenaran dasar yang disediakan oleh data uji empiris. Untuk menemukan model terbaik yang melaporkan akurasi tertinggi atau kesalahan terendah pada kumpulan data pengujian, jalankan pekerjaan penyetelan hiperparameter untuk k-NN.

Penyetelan model otomatis, juga dikenal sebagai tuning hyperparameter, menemukan versi terbaik dari model dengan menjalankan banyak pekerjaan yang menguji berbagai hiperparameter pada kumpulan data Anda. Anda memilih hyperparameters yang dapat disetel, rentang nilai untuk masing-masing, dan metrik objektif. Anda memilih metrik objektif yang sesuai untuk tugas prediksi algoritma. Penyetelan model otomatis mencari hiperparameter yang dipilih untuk menemukan kombinasi nilai yang menghasilkan model yang mengoptimalkan metrik objektif. Hiperparameter hanya digunakan untuk membantu memperkirakan parameter model dan tidak digunakan oleh model terlatih untuk membuat prediksi.

Untuk informasi selengkapnya tentang penyetelan model, lihatPenyetelan model otomatis dengan SageMaker.

Metrik yang Dihitung oleh Algoritma K-NN

Algoritma k-terdekat tetangga menghitung salah satu dari dua metrik dalam tabel berikut selama pelatihan tergantung pada jenis tugas yang ditentukan oleh parameter hiper. predictor_type

  • classifier menentukan tugas klasifikasi dan menghitung test:accuracy

  • regressor menentukan tugas regresi dan menghitung. test:mse

Pilih predictor_type nilai yang sesuai untuk jenis tugas yang dilakukan untuk menghitung metrik tujuan yang relevan saat menyetel model.

Nama Metrik Deskripsi Arah Optimasi
test:accuracy

Ketika predictor_type diatur ke pengklasifikasi, k-NN membandingkan label yang diprediksi, berdasarkan rata-rata label tetangga terdekat k, dengan label kebenaran dasar yang disediakan dalam data saluran uji. Akurasi yang dilaporkan berkisar dari 0,0 (0%) hingga 1,0 (100%).

Maksimalkan

test:mse

Ketika predictor_type diatur ke regressor, k-NN membandingkan label yang diprediksi, berdasarkan rata-rata label tetangga terdekat k, dengan label kebenaran dasar yang disediakan dalam data saluran uji. Kesalahan kuadrat rata-rata dihitung dengan membandingkan dua label.

Minimalkan

Hiperparameter K-nn yang dapat disetel

Setel model tetangga Amazon SageMaker k-terdekat dengan hyperparameter berikut.

Nama Parameter Jenis Parameter Rentang yang Direkomendasikan
k

IntegerParameterRanges

MinValue: 1, MaxValue: 1024

sample_size

IntegerParameterRanges

MinValue: 256, MaxValue: 20000000