Menyetel model pembelajar linier - Amazon SageMaker

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Menyetel model pembelajar linier

Penyetelan model otomatis, juga dikenal sebagai tuning hyperparameter, menemukan versi terbaik dari model dengan menjalankan banyak pekerjaan yang menguji berbagai hiperparameter pada kumpulan data Anda. Anda memilih hyperparameters yang dapat disetel, rentang nilai untuk masing-masing, dan metrik objektif. Anda memilih metrik objektif dari metrik yang dihitung algoritme. Penyetelan model otomatis mencari hiperparameter yang dipilih untuk menemukan kombinasi nilai yang menghasilkan model yang mengoptimalkan metrik objektif.

Algoritma pembelajar linier juga memiliki mekanisme internal untuk menyetel hiperparameter yang terpisah dari fitur penyetelan model otomatis yang dijelaskan di sini. Secara default, algoritme pembelajar linier menyetel hiperparameter dengan melatih beberapa model secara paralel. Saat Anda menggunakan penyetelan model otomatis, mekanisme penyetelan internal pelajar linier dimatikan secara otomatis. Ini menetapkan jumlah model paralel,num_models, ke 1. Algoritma mengabaikan nilai apa pun yang Anda tetapkannum_models.

Untuk informasi selengkapnya tentang penyetelan model, lihatPenyetelan model otomatis dengan SageMaker.

Metrik dihitung dengan algoritma pembelajar linier

Algoritma pembelajar linier melaporkan metrik dalam tabel berikut, yang dihitung selama pelatihan. Pilih salah satunya sebagai metrik objektif. Untuk menghindari overfitting, kami sarankan untuk menyetel model terhadap metrik validasi alih-alih metrik pelatihan.

Nama Metrik Deskripsi Arah Optimasi
test:absolute_loss

Hilangnya mutlak model akhir pada dataset pengujian. Metrik objektif ini hanya berlaku untuk regresi.

Minimalkan

test:binary_classification_accuracy

Keakuratan model akhir pada dataset pengujian. Metrik objektif ini hanya berlaku untuk klasifikasi biner.

Maksimalkan

test:binary_f_beta

Skor F-beta dari model akhir pada dataset pengujian. Secara default, ini adalah skor F1, yang merupakan rata-rata harmonik presisi dan ingatan. Metrik objektif ini hanya berlaku untuk klasifikasi biner.

Maksimalkan

test:dcg

Keuntungan kumulatif diskon dari model akhir pada dataset pengujian. Metrik objektif ini hanya berlaku untuk klasifikasi multiclass.

Maksimalkan

test:macro_f_beta

Skor F-beta dari model akhir pada dataset pengujian. Metrik objektif ini hanya berlaku untuk klasifikasi multiclass.

Maksimalkan

test:macro_precision

Skor presisi model akhir pada dataset pengujian. Metrik objektif ini hanya berlaku untuk klasifikasi multiclass.

Maksimalkan

test:macro_recall

Skor recall model akhir pada dataset tes. Metrik objektif ini hanya berlaku untuk klasifikasi multiclass.

Maksimalkan

test:mse

Kesalahan kuadrat rata-rata dari model akhir pada dataset pengujian. Metrik objektif ini hanya berlaku untuk regresi.

Minimalkan

test:multiclass_accuracy

Keakuratan model akhir pada dataset pengujian. Metrik objektif ini hanya berlaku untuk klasifikasi multiclass.

Maksimalkan

test:multiclass_top_k_accuracy

Akurasi di antara label k teratas yang diprediksi pada kumpulan data pengujian. Jika Anda memilih metrik ini sebagai tujuan, sebaiknya atur nilai k menggunakan accuracy_top_k hyperparameter. Metrik objektif ini hanya berlaku untuk klasifikasi multiclass.

Maksimalkan

test:objective_loss

Nilai rata-rata dari fungsi kerugian objektif pada dataset uji setelah model dilatih. Secara default, kerugian adalah kerugian logistik untuk klasifikasi biner dan kerugian kuadrat untuk regresi. Untuk mengatur kerugian ke jenis lain, gunakan loss hyperparameter.

Minimalkan

test:precision

Ketepatan model akhir pada dataset pengujian. Jika Anda memilih metrik ini sebagai tujuan, kami sarankan untuk menetapkan penarikan target dengan menyetel binary_classifier_model_selection hyperparameter ke precision_at_target_recall dan menetapkan nilai untuk target_recall hyperparameter. Metrik objektif ini hanya berlaku untuk klasifikasi biner.

Maksimalkan

test:recall

Penarikan kembali model akhir pada dataset pengujian. Jika Anda memilih metrik ini sebagai tujuan, kami sarankan untuk menetapkan presisi target dengan menyetel binary_classifier_model_selection hyperparameter ke recall_at_target_precision dan menetapkan nilai untuk target_precision hyperparameter. Metrik objektif ini hanya berlaku untuk klasifikasi biner.

Maksimalkan

test:roc_auc_score

Area di bawah kurva karakteristik operasi penerima (kurva ROC) dari model akhir pada kumpulan data pengujian. Metrik objektif ini hanya berlaku untuk klasifikasi biner.

Maksimalkan

validation:absolute_loss

Hilangnya mutlak model akhir pada dataset validasi. Metrik objektif ini hanya berlaku untuk regresi.

Minimalkan

validation:binary_classification_accuracy

Keakuratan model akhir pada dataset validasi. Metrik objektif ini hanya berlaku untuk klasifikasi biner.

Maksimalkan

validation:binary_f_beta

Skor F-beta dari model akhir pada dataset validasi. Secara default, skor F-beta adalah skor F1, yang merupakan rata-rata harmonik dari metrik dan. validation:precision validation:recall Metrik objektif ini hanya berlaku untuk klasifikasi biner.

Maksimalkan

validation:dcg

Keuntungan kumulatif diskon dari model akhir pada dataset validasi. Metrik objektif ini hanya berlaku untuk klasifikasi multiclass.

Maksimalkan

validation:macro_f_beta

Skor F-beta dari model akhir pada dataset validasi. Metrik objektif ini hanya berlaku untuk klasifikasi multiclass.

Maksimalkan

validation:macro_precision

Skor presisi model akhir pada dataset validasi. Metrik objektif ini hanya berlaku untuk klasifikasi multiclass.

Maksimalkan

validation:macro_recall

Skor recall model akhir pada dataset validasi. Metrik objektif ini hanya berlaku untuk klasifikasi multiclass.

Maksimalkan

validation:mse

Kesalahan kuadrat rata-rata dari model akhir pada dataset validasi. Metrik objektif ini hanya berlaku untuk regresi.

Minimalkan

validation:multiclass_accuracy

Keakuratan model akhir pada dataset validasi. Metrik objektif ini hanya berlaku untuk klasifikasi multiclass.

Maksimalkan

validation:multiclass_top_k_accuracy

Akurasi di antara label k teratas yang diprediksi pada kumpulan data validasi. Jika Anda memilih metrik ini sebagai tujuan, sebaiknya atur nilai k menggunakan accuracy_top_k hyperparameter. Metrik objektif ini hanya berlaku untuk klasifikasi multiclass.

Maksimalkan

validation:objective_loss

Nilai rata-rata dari fungsi kerugian objektif pada dataset validasi setiap zaman. Secara default, kerugian adalah kerugian logistik untuk klasifikasi biner dan kerugian kuadrat untuk regresi. Untuk mengatur kerugian ke jenis lain, gunakan loss hyperparameter.

Minimalkan

validation:precision

Ketepatan model akhir pada dataset validasi. Jika Anda memilih metrik ini sebagai tujuan, kami sarankan untuk menetapkan penarikan target dengan menyetel binary_classifier_model_selection hyperparameter ke precision_at_target_recall dan menetapkan nilai untuk target_recall hyperparameter. Metrik objektif ini hanya berlaku untuk klasifikasi biner.

Maksimalkan

validation:recall

Penarikan kembali model akhir pada dataset validasi. Jika Anda memilih metrik ini sebagai tujuan, kami sarankan untuk menetapkan presisi target dengan menyetel binary_classifier_model_selection hyperparameter ke recall_at_target_precision dan menetapkan nilai untuk target_precision hyperparameter. Metrik objektif ini hanya berlaku untuk klasifikasi biner.

Maksimalkan

validation:rmse

Kesalahan kuadrat rata-rata akar dari model akhir pada kumpulan data validasi. Metrik objektif ini hanya berlaku untuk regresi.

Minimalkan

validation:roc_auc_score

Area di bawah kurva karakteristik operasi penerima (kurva ROC) dari model akhir pada kumpulan data validasi. Metrik objektif ini hanya berlaku untuk klasifikasi biner.

Maksimalkan

Menyetel hiperparameter pelajar linier

Anda dapat menyetel model pembelajar linier dengan hyperparameters berikut.

Nama Parameter Jenis Parameter Rentang yang Direkomendasikan
wd

ContinuousParameterRanges

MinValue: 1e-7, MaxValue: 1

l1

ContinuousParameterRanges

MinValue: 1e-7, MaxValue: 1

learning_rate

ContinuousParameterRanges

MinValue: 1e-5, MaxValue: 1

mini_batch_size

IntegerParameterRanges

MinValue: 100, MaxValue: 5000

use_bias

CategoricalParameterRanges

[True, False]

positive_example_weight_mult

ContinuousParameterRanges

MinValue: 1e-5,: MaxValue 1e5