Klasifikasi Teks - TensorFlow Hyperparameters - Amazon SageMaker

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Klasifikasi Teks - TensorFlow Hyperparameters

Hyperparameters adalah parameter yang ditetapkan sebelum model pembelajaran mesin mulai belajar. Hyperparameter berikut didukung oleh TensorFlow algoritma Deteksi Objek SageMaker bawaan Amazon. Lihat Menyetel Klasifikasi Teks - TensorFlow model untuk informasi tentang tuning hyperparameter.

Nama Parameter Deskripsi
batch_size

Ukuran batch untuk pelatihan. Untuk pelatihan tentang instance dengan beberapaGPUs, ukuran batch ini digunakan di seluruh. GPUs

Nilai yang valid: bilangan bulat positif.

Nilai default:32.

beta_1

Beta1 untuk "adam" dan "adamw" pengoptimal. Merupakan tingkat peluruhan eksponensial untuk perkiraan momen pertama. Diabaikan untuk pengoptimal lainnya.

Nilai yang valid: float, range: [0.0,1.0].

Nilai default:0.9.

beta_2

Beta2 untuk "adam" dan "adamw" pengoptimal. Merupakan tingkat peluruhan eksponensial untuk perkiraan momen kedua. Diabaikan untuk pengoptimal lainnya.

Nilai yang valid: float, range: [0.0,1.0].

Nilai default:0.999.

dropout_rate

Tingkat putus sekolah untuk lapisan putus sekolah di lapisan klasifikasi atas. Digunakan hanya ketika reinitialize_top_layer diatur ke"True".

Nilai yang valid: float, range: [0.0,1.0].

Nilai default: 0.2

early_stopping

Atur "True" untuk menggunakan logika penghentian awal selama pelatihan. Jika"False", berhenti dini tidak digunakan.

Nilai yang valid: string, baik: ("True"atau"False").

Nilai default:"False".

early_stopping_min_delta Perubahan minimum yang diperlukan untuk memenuhi syarat sebagai perbaikan. Perubahan absolut kurang dari nilai early_stopping_min_delta tidak memenuhi syarat sebagai perbaikan. Digunakan hanya ketika early_stopping diatur ke"True".

Nilai yang valid: float, range: [0.0,1.0].

Nilai default:0.0.

early_stopping_patience

Jumlah zaman untuk melanjutkan pelatihan tanpa perbaikan. Digunakan hanya ketika early_stopping diatur ke"True".

Nilai yang valid: bilangan bulat positif.

Nilai default:5.

epochs

Jumlah zaman pelatihan.

Nilai yang valid: bilangan bulat positif.

Nilai default:10.

epsilon

Epsilon untuk"adam",, "rmsprop""adadelta", dan "adagrad" pengoptimal. Biasanya diatur ke nilai kecil untuk menghindari pembagian dengan 0. Diabaikan untuk pengoptimal lainnya.

Nilai yang valid: float, range: [0.0,1.0].

Nilai default:1e-7.

initial_accumulator_value

Nilai awal untuk akumulator, atau nilai momentum per parameter, untuk pengoptimal. "adagrad" Diabaikan untuk pengoptimal lainnya.

Nilai yang valid: float, range: [0.0,1.0].

Nilai default:0.0001.

learning_rate Tingkat pembelajaran pengoptimal.

Nilai yang valid: float, range: [0.0,1.0].

Nilai default:0.001.

momentum

Momentum untuk "sgd" dan "nesterov" pengoptimal. Diabaikan untuk pengoptimal lainnya.

Nilai yang valid: float, range: [0.0,1.0].

Nilai default:0.9.

optimizer

Jenis pengoptimal. Untuk informasi selengkapnya, lihat Pengoptimal dalam dokumentasi. TensorFlow

Nilai yang valid: string, salah satu dari berikut ini: ("adamw""adam","sgd","nesterov","rmsprop", "adagrad","adadelta").

Nilai default:"adam".

regularizers_l2

Faktor regularisasi L2 untuk lapisan padat di lapisan klasifikasi. Digunakan hanya ketika reinitialize_top_layer diatur ke"True".

Nilai yang valid: float, range: [0.0,1.0].

Nilai default:0.0001.

reinitialize_top_layer

Jika disetel ke"Auto", parameter lapisan klasifikasi atas diinisialisasi ulang selama fine-tuning. Untuk pelatihan tambahan, parameter lapisan klasifikasi teratas tidak diinisialisasi ulang kecuali disetel ke. "True"

Nilai yang valid: string, salah satu dari berikut ini: ("Auto", "True" atau"False").

Nilai default:"Auto".

rho

Faktor diskon untuk gradien "adadelta" dan "rmsprop" pengoptimal. Diabaikan untuk pengoptimal lainnya.

Nilai yang valid: float, range: [0.0,1.0].

Nilai default:0.95.

train_only_on_top_layer

Jika"True", hanya parameter lapisan klasifikasi teratas yang disetel dengan baik. Jika"False", semua parameter model disetel dengan baik.

Nilai yang valid: string, baik: ("True"atau"False").

Nilai default:"False".

validation_split_ratio

Fraksi data pelatihan untuk dibagi secara acak untuk membuat data validasi. Hanya digunakan jika data validasi tidak disediakan melalui validation saluran.

Nilai yang valid: float, range: [0.0,1.0].

Nilai default:0.2.

warmup_steps_fraction

Fraksi dari jumlah total langkah pembaruan gradien, di mana tingkat pembelajaran meningkat dari 0 ke tingkat pembelajaran awal sebagai pemanasan. Hanya digunakan dengan adamw pengoptimal.

Nilai yang valid: float, range: [0.0,1.0].

Nilai default:0.1.