Menyetel BlazingText Model - Amazon SageMaker

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Menyetel BlazingText Model

Penyetelan model otomatis, juga dikenal sebagai tuning hyperparameter, menemukan versi terbaik dari model dengan menjalankan banyak pekerjaan yang menguji berbagai hiperparameter pada kumpulan data Anda. Anda memilih hyperparameters yang dapat disetel, rentang nilai untuk masing-masing, dan metrik objektif. Anda memilih metrik objektif dari metrik yang dihitung algoritme. Penyetelan model otomatis mencari hiperparameter yang dipilih untuk menemukan kombinasi nilai yang menghasilkan model yang mengoptimalkan metrik objektif.

Untuk informasi lebih lanjut tentang penyetelan model, lihatLakukan penyetelan model otomatis dengan SageMaker.

Metrik yang Dihitung oleh Algoritma BlazingText

Algoritma BlazingText Word2Vec (skipgram,cbow, dan batch_skipgram mode) melaporkan satu metrik selama pelatihan:. train:mean_rho Metrik ini dihitung pada kumpulan data kesamaan kata WS-353. Saat menyetel nilai hyperparameter untuk algoritma Word2Vec, gunakan metrik ini sebagai tujuannya.

Algoritma Klasifikasi BlazingText Teks (supervisedmode), juga melaporkan satu metrik selama pelatihan:validation:accuracy. Saat menyetel nilai hyperparameter untuk algoritma klasifikasi teks, gunakan metrik ini sebagai tujuannya.

Nama Metrik Deskripsi Arah Optimasi
train:mean_rho

Rho rata-rata (koefisien korelasi peringkat Spearman) pada kumpulan data kesamaan kata WS-353

Maksimalkan

validation:accuracy

Akurasi klasifikasi pada kumpulan data validasi yang ditentukan pengguna

Maksimalkan

Hiperparameter yang dapat disetel BlazingText

Hiperparameter yang dapat disetel untuk Algoritma Word2Vec

Tune model Amazon SageMaker BlazingText Word2Vec dengan hyperparameter berikut. Hiperparameter yang memiliki dampak terbesar pada metrik objektif Word2Vec adalah:mode,,,, learning_rate dan. window_size vector_dim negative_samples

Nama Parameter Jenis Parameter Rentang atau Nilai yang Direkomendasikan
batch_size

IntegerParameterRange

[8-32]

epochs

IntegerParameterRange

[5-15]

learning_rate

ContinuousParameterRange

MinValue: 0,005, MaxValue: 0,01

min_count

IntegerParameterRange

[0-100]

mode

CategoricalParameterRange

['batch_skipgram', 'skipgram', 'cbow']

negative_samples

IntegerParameterRange

[5-25]

sampling_threshold

ContinuousParameterRange

MinValue: 0,0001, MaxValue: 0,001

vector_dim

IntegerParameterRange

[32-300]

window_size

IntegerParameterRange

[1-10]

Hiperparameter yang dapat disetel untuk Algoritma Klasifikasi Teks

Sesuaikan model klasifikasi SageMaker BlazingText teks Amazon dengan hyperparameter berikut.

Nama Parameter Jenis Parameter Rentang atau Nilai yang Direkomendasikan
buckets

IntegerParameterRange

[1000000-10000000]

epochs

IntegerParameterRange

[5-15]

learning_rate

ContinuousParameterRange

MinValue: 0,005, MaxValue: 0,01

min_count

IntegerParameterRange

[0-100]

vector_dim

IntegerParameterRange

[32-300]

word_ngrams

IntegerParameterRange

[1-3]