Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
BlazingText Hiperparameter
Saat Anda memulai pekerjaan pelatihan dengan CreateTrainingJob
permintaan, Anda menentukan algoritma pelatihan. Anda juga dapat menentukan hyperparameter khusus algoritme sebagai peta. string-to-string Hiperparameter untuk BlazingText algoritme bergantung pada mode mana yang Anda gunakan: Word2Vec (tanpa pengawasan) dan Klasifikasi Teks (diawasi).
Hyperparameter Word2Vec
Tabel berikut mencantumkan hyperparameters untuk algoritma pelatihan BlazingText Word2Vec yang disediakan oleh Amazon. SageMaker
Nama Parameter | Deskripsi |
---|---|
mode |
Arsitektur Word2vec digunakan untuk pelatihan. Diperlukan Nilai valid: |
batch_size |
Ukuran setiap batch saat Opsional Nilai yang valid: Bilangan bulat positif Nilai default: 11 |
buckets |
Jumlah bucket hash yang digunakan untuk subkata. Opsional Nilai yang valid: bilangan bulat positif Nilai default: 2000000 |
epochs |
Jumlah lintasan lengkap melalui data pelatihan. Opsional Nilai yang valid: Bilangan bulat positif Nilai default: 5 |
evaluation |
Apakah model terlatih dievaluasi menggunakan Tes WordSimilarity-353 Opsional Nilai yang valid: (Boolean) Nilai default: |
learning_rate |
Ukuran langkah yang digunakan untuk pembaruan parameter. Opsional Nilai yang valid: Float positif Nilai default: 0,05 |
min_char |
Jumlah minimum karakter yang digunakan untuk subkata/karakter n-gram. Opsional Nilai yang valid: bilangan bulat positif Nilai default: 3 |
min_count |
Kata-kata yang muncul kurang dari Opsional Nilai yang valid: Bilangan bulat non-negatif Nilai default: 5 |
max_char |
Jumlah maksimum karakter yang akan digunakan untuk subkata/karakter n-gram Opsional Nilai yang valid: bilangan bulat positif Nilai default: 6 |
negative_samples |
Jumlah sampel negatif untuk strategi berbagi sampel negatif. Opsional Nilai yang valid: Bilangan bulat positif Nilai default: 5 |
sampling_threshold |
Ambang batas untuk terjadinya kata-kata. Kata-kata yang muncul dengan frekuensi lebih tinggi dalam data pelatihan diambil sampelnya secara acak. Opsional Nilai yang valid: Fraksi positif. Rentang yang disarankan adalah (0, 1e-3] Nilai default: 0,0001 |
subwords |
Apakah akan mempelajari penyematan subkata pada tidak. Opsional Nilai yang valid: (Boolean) Nilai default: |
vector_dim |
Dimensi kata vektor yang dipelajari algoritma. Opsional Nilai yang valid: Bilangan bulat positif Nilai default: 100 |
window_size |
Ukuran jendela konteks. Jendela konteks adalah jumlah kata yang mengelilingi kata target yang digunakan untuk pelatihan. Opsional Nilai yang valid: Bilangan bulat positif Nilai default: 5 |
Klasifikasi Teks Hyperparameters
Tabel berikut mencantumkan hyperparameters untuk algoritma pelatihan Klasifikasi Teks yang disediakan oleh Amazon SageMaker.
catatan
Meskipun beberapa parameter umum antara mode Klasifikasi Teks dan Word2Vec, mereka mungkin memiliki arti yang berbeda tergantung pada konteksnya.
Nama Parameter | Deskripsi |
---|---|
mode |
Mode pelatihan. Diperlukan Nilai yang valid: |
buckets |
Jumlah ember hash yang digunakan untuk kata n-gram. Opsional Nilai yang valid: Bilangan bulat positif Nilai default: 2000000 |
early_stopping |
Apakah akan menghentikan pelatihan jika akurasi validasi tidak membaik setelah Opsional Nilai yang valid: (Boolean) Nilai default: |
epochs |
Jumlah maksimum lintasan lengkap melalui data pelatihan. Opsional Nilai yang valid: Bilangan bulat positif Nilai default: 5 |
learning_rate |
Ukuran langkah yang digunakan untuk pembaruan parameter. Opsional Nilai yang valid: Float positif Nilai default: 0,05 |
min_count |
Kata-kata yang muncul kurang dari Opsional Nilai yang valid: Bilangan bulat non-negatif Nilai default: 5 |
min_epochs |
Jumlah minimum zaman untuk dilatih sebelum logika penghentian awal dipanggil. Opsional Nilai yang valid: Bilangan bulat positif Nilai default: 5 |
patience |
Jumlah epoch yang harus menunggu sebelum menerapkan penghentian awal ketika tidak ada kemajuan yang dibuat pada set validasi. Digunakan hanya ketika Opsional Nilai yang valid: Bilangan bulat positif Nilai default: 4 |
vector_dim |
Dimensi lapisan embedding. Opsional Nilai yang valid: Bilangan bulat positif Nilai default: 100 |
word_ngrams |
Jumlah fitur kata n-gram yang digunakan. Opsional Nilai yang valid: Bilangan bulat positif Nilai default: 2 |