Hiperparameter NTM - Amazon SageMaker

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Hiperparameter NTM

Nama Parameter Deskripsi

feature_dim

Ukuran kosakata dari dataset.

Diperlukan

Nilai yang valid: Bilangan bulat positif (min: 1, maks: 1.000.000)

num_topics

Jumlah topik yang diperlukan.

Diperlukan

Nilai yang valid: Bilangan bulat positif (min: 2, maks: 1000)

batch_norm

Apakah akan menggunakan normalisasi batch selama pelatihan.

Opsional

Nilai yang valid: benar atau salah

Nilai default: false

clip_gradient

Besarnya maksimum untuk setiap komponen gradien.

Opsional

Nilai yang valid: Float (min: 1e-3)

Nilai default: Infinity

encoder_layers

Jumlah lapisan dalam encoder dan ukuran output dari setiap lapisan. Ketika diatur ke auto, algoritma menggunakan dua lapisan ukuran 3 x num_topics dan 2 x num_topics masing-masing.

Opsional

Nilai yang valid: Daftar bilangan bulat positif atau auto yang dipisahkan koma

Nilai default: auto

encoder_layers_activation

Fungsi aktivasi untuk digunakan dalam lapisan encoder.

Opsional

Nilai yang valid:

Nilai default: sigmoid

epochs

Jumlah maksimum lintasan atas data pelatihan.

Opsional

Nilai yang valid: Bilangan bulat positif (min: 1)

Nilai default: 50

learning_rate

Tingkat pembelajaran untuk pengoptimal.

Opsional

Nilai yang valid: Float (min: 1e-6, maks: 1.0)

Nilai default: 0,001

mini_batch_size

Jumlah contoh di setiap batch mini.

Opsional

Nilai yang valid: Bilangan bulat positif (min: 1, maks: 10000)

Nilai default: 256

num_patience_epochs

Jumlah zaman berturut-turut di mana kriteria penghentian awal dievaluasi. Penghentian awal dipicu ketika perubahan fungsi kerugian turun di bawah yang ditentukan tolerance dalam num_patience_epochs jumlah epoch terakhir. Untuk menonaktifkan penghentian awal, atur num_patience_epochs ke nilai yang lebih besar dariepochs.

Opsional

Nilai yang valid: Bilangan bulat positif (min: 1)

Nilai default: 3

optimizer

Pengoptimal untuk digunakan untuk pelatihan.

Opsional

Nilai yang valid:

Nilai default: adadelta

rescale_gradient

Faktor penskalaan ulang untuk gradien.

Opsional

Nilai yang valid: float (min: 1e-3, maks: 1.0)

Nilai default: 1.0

sub_sample

Fraksi data pelatihan untuk sampel untuk pelatihan per zaman.

Opsional

Nilai yang valid: Float (min: 0.0, max: 1.0)

Nilai default: 1.0

tolerance

Perubahan relatif maksimum dalam fungsi kerugian. Penghentian awal dipicu ketika perubahan fungsi kerugian turun di bawah nilai ini dalam num_patience_epochs jumlah zaman terakhir.

Opsional

Nilai yang valid: Float (min: 1e-6, maks: 0.1)

Nilai default: 0,001

weight_decay

Koefisien peluruhan berat. Menambahkan regularisasi L2.

Opsional

Nilai yang valid: Float (min: 0.0, max: 1.0)

Nilai default: 0.0