Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Menyetel BlazingText Model
Penyetelan model otomatis, juga dikenal sebagai tuning hyperparameter, menemukan versi terbaik dari model dengan menjalankan banyak pekerjaan yang menguji berbagai hiperparameter pada kumpulan data Anda. Anda memilih hyperparameters yang dapat disetel, rentang nilai untuk masing-masing, dan metrik objektif. Anda memilih metrik objektif dari metrik yang dihitung oleh algoritme. Penyetelan model otomatis mencari hiperparameter yang dipilih untuk menemukan kombinasi nilai yang menghasilkan model yang mengoptimalkan metrik objektif.
Untuk informasi selengkapnya tentang penyetelan model, lihatPenyetelan model otomatis dengan AI SageMaker .
Metrik yang Dihitung oleh Algoritma BlazingText
Algoritma BlazingText Word2Vec (skipgram
,cbow
, dan batch_skipgram
mode) melaporkan satu metrik selama pelatihan:. train:mean_rho
Metrik ini dihitung pada kumpulan data kesamaan kata WS-353
Algoritma Klasifikasi BlazingText Teks (supervised
mode), juga melaporkan satu metrik selama pelatihan:validation:accuracy
. Saat menyetel nilai hyperparameter untuk algoritma klasifikasi teks, gunakan metrik ini sebagai tujuannya.
Nama Metrik | Deskripsi | Arah Optimasi |
---|---|---|
train:mean_rho |
Rho rata-rata (koefisien korelasi peringkat Spearman) pada kumpulan data kesamaan kata WS-353 |
Maksimalkan |
validation:accuracy |
Akurasi klasifikasi pada kumpulan data validasi yang ditentukan pengguna |
Maksimalkan |
Hiperparameter yang dapat disetel BlazingText
Hiperparameter yang dapat disetel untuk Algoritma Word2Vec
Setel model Amazon SageMaker AI BlazingText Word2Vec dengan hyperparameter berikut. Hiperparameter yang memiliki dampak terbesar pada metrik objektif Word2Vec adalah:mode
,,,, learning_rate
dan. window_size
vector_dim
negative_samples
Nama Parameter | Jenis Parameter | Rentang atau Nilai yang Direkomendasikan |
---|---|---|
batch_size |
|
[8-32] |
epochs |
|
[5-15] |
learning_rate |
|
MinValue: 0,005, MaxValue: 0,01 |
min_count |
|
[0-100] |
mode |
|
[ |
negative_samples |
|
[5-25] |
sampling_threshold |
|
MinValue: 0,0001, MaxValue: 0,001 |
vector_dim |
|
[32-300] |
window_size |
|
[1-10] |
Hiperparameter yang dapat disetel untuk Algoritma Klasifikasi Teks
Sesuaikan model klasifikasi BlazingText teks Amazon SageMaker AI dengan hyperparameter berikut.
Nama Parameter | Jenis Parameter | Rentang atau Nilai yang Direkomendasikan |
---|---|---|
buckets |
|
[1000000-10000000] |
epochs |
|
[5-15] |
learning_rate |
|
MinValue: 0,005, MaxValue: 0,01 |
min_count |
|
[0-100] |
vector_dim |
|
[32-300] |
word_ngrams |
|
[1-3] |