Hiperparameter pelajar linier - Amazon SageMaker

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Hiperparameter pelajar linier

Tabel berikut berisi hyperparameters untuk algoritma pembelajar linier. Ini adalah parameter yang ditetapkan oleh pengguna untuk memfasilitasi estimasi parameter model dari data. Hyperparameter yang diperlukan yang harus ditetapkan terdaftar terlebih dahulu, dalam urutan abjad. Hyperparameter opsional yang dapat diatur tercantum berikutnya, juga dalam urutan abjad. Ketika hyperparameter disetel keauto, Amazon SageMaker akan secara otomatis menghitung dan menetapkan nilai hyperparameter itu.

Nama Parameter Deskripsi
num_classes

Jumlah kelas untuk variabel respons. Algoritma mengasumsikan bahwa kelas diberi label0,...,. num_classes - 1

Diperlukan kapan predictor_typemulticlass_classifier. Jika tidak, algoritma mengabaikannya.

Nilai yang valid: Bilangan bulat dari 3 hingga 1.000.000

predictor_type

Menentukan jenis variabel target sebagai klasifikasi biner, klasifikasi multiclass, atau regresi.

Diperlukan

Nilai valid: binary_classifier, multiclass_classifier, atau regressor

accuracy_top_k

Saat menghitung metrik akurasi top-k untuk klasifikasi multiclass, nilai k. Jika model menetapkan salah satu skor top-k ke label sebenarnya, sebuah contoh dinilai sebagai benar.

Opsional

Nilai yang valid: Bilangan bulat positif

Nilai default: 3

balance_multiclass_weights

Menentukan apakah akan menggunakan bobot kelas, yang memberikan masing-masing kelas sama pentingnya dalam fungsi kerugian. Digunakan hanya ketika predictor_type adamulticlass_classifier.

Opsional

Nilai yang valid: true, false

Nilai default: false

beta_1

Tingkat peluruhan eksponensial untuk perkiraan momen pertama. Berlaku hanya jika optimizer nilainyaadam.

Opsional

Nilai valid: auto atau nilai floating-point antara 0 dan 1.0

Nilai default: auto

beta_2

Tingkat peluruhan eksponensial untuk perkiraan momen kedua. Berlaku hanya jika optimizer nilainyaadam.

Opsional

Nilai yang valid: auto atau bilangan bulat floating-point antara 0 dan 1.0

Nilai default: auto

bias_lr_mult

Memungkinkan tingkat pembelajaran yang berbeda untuk istilah bias. Tingkat pembelajaran aktual untuk bias adalah learning_rate *bias_lr_mult.

Opsional

Nilai yang valid: auto atau bilangan bulat floating-point positif

Nilai default: auto

bias_wd_mult

Memungkinkan regularisasi yang berbeda untuk istilah bias. Bobot regularisasi L2 aktual untuk bias adalah *. wd bias_wd_mult Secara default, tidak ada regularisasi pada istilah bias.

Opsional

Nilai yang valid: auto atau bilangan bulat floating-point non-negatif

Nilai default: auto

binary_classifier_model_selection_criteria

Kapan predictor_type disetel kebinary_classifier, kriteria evaluasi model untuk kumpulan data validasi (atau untuk kumpulan data pelatihan jika Anda tidak memberikan kumpulan data validasi). Kriteria meliputi:

  • accuracy—Model dengan akurasi tertinggi.

  • f_beta—Model dengan skor F1 tertinggi. Defaultnya adalah F1.

  • precision_at_target_recall—Model dengan presisi tertinggi pada target penarikan yang diberikan.

  • recall_at_target_precision—Model dengan recall tertinggi pada target presisi tertentu.

  • loss_function—Model dengan nilai terendah dari fungsi kerugian yang digunakan dalam pelatihan.

Opsional

Nilai yang valid:accuracy,f_beta,precision_at_target_recall,recall_at_target_precision, atau loss_function

Nilai default: accuracy

early_stopping_patience Jika tidak ada perbaikan yang dilakukan dalam metrik yang relevan, jumlah zaman yang harus menunggu sebelum mengakhiri pelatihan. Jika Anda telah memberikan nilai binary_classifier_model_selection_criteria untuk. metrik adalah nilai itu. Jika tidak, metriknya sama dengan nilai yang ditentukan untuk loss hyperparameter.

Metrik dievaluasi pada data validasi. Jika Anda belum memberikan data validasi, metrik selalu sama dengan nilai yang ditentukan untuk loss hyperparameter dan dievaluasi pada data pelatihan. Untuk menonaktifkan penghentian awal, atur early_stopping_patience ke nilai yang lebih besar dari nilai yang ditentukan untukepochs.

Opsional

Nilai yang valid: Bilangan bulat positif

Nilai default: 3

early_stopping_tolerance

Toleransi relatif untuk mengukur peningkatan kerugian. Jika rasio peningkatan kerugian dibagi dengan kerugian terbaik sebelumnya lebih kecil dari nilai ini, penghentian awal menganggap peningkatan menjadi nol.

Opsional

Nilai yang valid: Bilangan bulat floating-point positif

Nilai default: 0,001

epochs

Jumlah maksimum lintasan atas data pelatihan.

Opsional

Nilai yang valid: Bilangan bulat positif

Nilai default: 15

f_beta

Nilai beta yang digunakan saat menghitung metrik skor F untuk klasifikasi biner atau multiclass. Juga digunakan jika nilai yang ditentukan untuk binary_classifier_model_selection_criteria adalahf_beta.

Opsional

Nilai yang valid: Bilangan bulat floating-point positif

Nilai default: 1.0

feature_dim

Jumlah fitur dalam data input.

Opsional

Nilai yang valid: auto atau bilangan bulat positif

Nilai default: auto

huber_delta

Parameter untuk kerugian Huber. Selama pelatihan dan evaluasi metrik, hitung kerugian L2 untuk kesalahan yang lebih kecil dari delta dan kerugian L1 untuk kesalahan yang lebih besar dari delta.

Opsional

Nilai yang valid: Bilangan bulat floating-point positif

Nilai default: 1.0

init_bias

Bobot awal untuk istilah bias.

Opsional

Nilai yang valid: Integer Floating-point

Nilai default: 0

init_method

Menetapkan fungsi distribusi awal yang digunakan untuk bobot model. Fungsi meliputi:

  • uniform—Didistribusikan secara seragam antara (-skala, +skala)

  • normalDistribusi normal, dengan rata-rata 0 dan sigma

Opsional

Nilai yang valid: uniform or normal

Nilai default: uniform

init_scale

Menimbang distribusi seragam awal untuk bobot model. Berlaku hanya ketika init_method hyperparameter disetel keuniform.

Opsional

Nilai yang valid: Bilangan bulat floating-point positif

Nilai default: 0,07

init_sigma

Standar deviasi awal untuk distribusi normal. Berlaku hanya ketika init_method hyperparameter disetel kenormal.

Opsional

Nilai yang valid: Bilangan bulat floating-point positif

Nilai default: 0,01

l1

Parameter regularisasi L1. Jika Anda tidak ingin menggunakan regularisasi L1, atur nilainya ke 0.

Opsional

Nilai yang valid: auto atau float non-negatif

Nilai default: auto

learning_rate

Ukuran langkah yang digunakan oleh pengoptimal untuk pembaruan parameter.

Opsional

Nilai yang valid: auto atau bilangan bulat floating-point positif

Nilai default:auto, yang nilainya tergantung pada pengoptimal yang dipilih.

loss

Menentukan fungsi kerugian.

Fungsi kerugian yang tersedia dan nilai defaultnya bergantung pada nilaipredictor_type:

  • Jika predictor_type diatur keregressor, opsi yang tersedia adalahauto,,squared_loss, absolute_losseps_insensitive_squared_loss,eps_insensitive_absolute_loss,quantile_loss, danhuber_loss. Nilai default-nya auto is squared_loss.

  • Jika predictor_type diatur kebinary_classifier, opsi yang tersedia adalahauto,logistic, danhinge_loss. Nilai default-nya auto is logistic.

  • Jika predictor_type diatur kemulticlass_classifier, opsi yang tersedia adalah auto dansoftmax_loss. Nilai default-nya auto is softmax_loss.

Nilai yang valid: autologistic,squared_loss,absolute_loss,hinge_loss,eps_insensitive_squared_loss,eps_insensitive_absolute_loss,quantile_loss, atau huber_loss

Opsional

Nilai default: auto

loss_insensitivity

Parameter untuk tipe kerugian epsilon-insensitive. Selama pelatihan dan evaluasi metrik, kesalahan yang lebih kecil dari nilai ini dianggap nol.

Opsional

Nilai yang valid: Bilangan bulat floating-point positif

Nilai default: 0,01

lr_scheduler_factor

Untuk setiap lr_scheduler_step hiperparameter, tingkat pembelajaran menurun dengan kuantitas ini. Berlaku hanya ketika use_lr_scheduler hyperparameter disetel ketrue.

Opsional

Nilai yang valid: auto atau bilangan bulat floating-point positif antara 0 dan 1

Nilai default: auto

lr_scheduler_minimum_lr

Tingkat pembelajaran tidak pernah menurun ke nilai yang lebih rendah dari nilai yang ditetapkanlr_scheduler_minimum_lr. Berlaku hanya ketika use_lr_scheduler hyperparameter disetel ketrue.

Opsional

Nilai yang valid: auto atau bilangan bulat floating-point positif

Nilai default: auto

lr_scheduler_step

Jumlah langkah antara penurunan tingkat pembelajaran. Berlaku hanya ketika use_lr_scheduler hyperparameter disetel ketrue.

Opsional

Nilai yang valid: auto atau bilangan bulat positif

Nilai default: auto

margin

Margin untuk hinge_loss fungsi tersebut.

Opsional

Nilai yang valid: Bilangan bulat floating-point positif

Nilai default: 1.0

mini_batch_size

Jumlah pengamatan per mini-batch untuk iterator data.

Opsional

Nilai yang valid: Bilangan bulat positif

Nilai default: 1000

momentum

Momentum sgd pengoptimal.

Opsional

Nilai yang valid: auto atau bilangan bulat floating-point antara 0 dan 1.0

Nilai default: auto

normalize_data

Menormalkan data fitur sebelum pelatihan. Normalisasi data menggeser data untuk setiap fitur untuk memiliki rata-rata nol dan menskalakannya untuk memiliki standar deviasi unit.

Opsional

Nilai valid: auto, true, atau false

Nilai default: true

normalize_label

Menormalkan label. Normalisasi label menggeser label untuk memiliki rata-rata nol dan menskalakannya untuk memiliki satuan standar deviasi.

Nilai auto default menormalkan label untuk masalah regresi tetapi tidak untuk masalah klasifikasi. Jika Anda mengatur normalize_label hyperparameter true untuk masalah klasifikasi, algoritme mengabaikannya.

Opsional

Nilai valid: auto, true, atau false

Nilai default: auto

num_calibration_samples

Jumlah pengamatan dari dataset validasi yang akan digunakan untuk kalibrasi model (saat menemukan ambang batas terbaik).

Opsional

Nilai yang valid: auto atau bilangan bulat positif

Nilai default: auto

num_models

Jumlah model untuk dilatih secara paralel. Untuk default,auto, algoritma menentukan jumlah model paralel untuk dilatih. Satu model dilatih sesuai dengan parameter pelatihan yang diberikan (regularisasi, pengoptimal, kehilangan), dan sisanya dengan parameter dekat.

Opsional

Nilai yang valid: auto atau bilangan bulat positif

Nilai default: auto

num_point_for_scaler

Jumlah titik data yang digunakan untuk menghitung normalisasi atau tidak bias istilah.

Opsional

Nilai yang valid: Bilangan bulat positif

Nilai default: 10.000

optimizer

Algoritma optimasi untuk digunakan.

Opsional

Nilai yang valid:

  • auto—Nilai default.

  • sgd—Penurunan gradien stokastik.

  • adamEstimasi momentum adaptif.

  • rmsprop—Teknik optimasi berbasis gradien yang menggunakan rata-rata bergerak gradien kuadrat untuk menormalkan gradien.

Nilai default:auto. Pengaturan default untuk auto adalahadam.

positive_example_weight_mult

Bobot diberikan pada contoh positif saat melatih pengklasifikasi biner. Bobot contoh negatif ditetapkan pada 1. Jika Anda ingin algoritme memilih bobot sehingga kesalahan dalam mengklasifikasikan contoh negatif vs. positif memiliki dampak yang sama pada kehilangan pelatihan, tentukan. balanced Jika Anda ingin algoritme memilih bobot yang mengoptimalkan kinerja, tentukanauto.

Opsional

Nilai yang valid:balanced,auto, atau bilangan bulat floating-point positif

Nilai default: 1.0

quantile

Kuantil untuk kerugian kuantil. Untuk kuantil q, model mencoba menghasilkan prediksi sehingga nilai lebih besar dari true_label prediksi dengan probabilitas q.

Opsional

Nilai yang valid: Integer Floating-point antara 0 dan 1

Nilai default: 0,5

target_precision

Ketepatan target. Jika binary_classifier_model_selection_criteria yarecall_at_target_precision, maka presisi dipertahankan pada nilai ini sementara recall dimaksimalkan.

Opsional

Nilai yang valid: Integer Floating-point antara 0 dan 1.0

Nilai default: 0,8

target_recall

Target recall. Jika binary_classifier_model_selection_criteria yaprecision_at_target_recall, maka recall ditahan pada nilai ini sementara presisi dimaksimalkan.

Opsional

Nilai yang valid: Integer Floating-point antara 0 dan 1.0

Nilai default: 0,8

unbias_data

Tidak bias fitur sebelum pelatihan sehingga rata-ratanya adalah 0. Secara default, data tidak bias karena use_bias hyperparameter disetel ke. true

Opsional

Nilai valid: auto, true, atau false

Nilai default: auto

unbias_label

Label tidak bias sebelum pelatihan sehingga rata-ratanya adalah 0. Berlaku untuk regresi hanya jika use_bias hyperparameter disetel ke. true

Opsional

Nilai valid: auto, true, atau false

Nilai default: auto

use_bias

Menentukan apakah model harus menyertakan istilah bias, yang merupakan suku intersep dalam persamaan linier.

Opsional

Nilai yang valid: true or false

Nilai default: true

use_lr_scheduler

Apakah akan menggunakan penjadwal untuk tingkat pembelajaran. Jika Anda ingin menggunakan penjadwal, tentukantrue.

Opsional

Nilai yang valid: true or false

Nilai default: true

wd

Parameter peluruhan berat, juga dikenal sebagai parameter regularisasi L2. Jika Anda tidak ingin menggunakan regularisasi L2, atur nilainya ke 0.

Opsional

Nilai yang valid: auto atau bilangan bulat floating-point non-negatif

Nilai default: auto