Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
TabTransformer hiperparameter
Tabel berikut berisi subset hiperparameter yang diperlukan atau paling umum digunakan untuk algoritma Amazon SageMaker AI TabTransformer . Pengguna mengatur parameter ini untuk memfasilitasi estimasi parameter model dari data. TabTransformerAlgoritma SageMaker AI adalah implementasi dari TabTransformer
catatan
Hyperparameter default didasarkan pada contoh kumpulan data di file. TabTransformer contoh buku catatan
TabTransformer Algoritma SageMaker AI secara otomatis memilih metrik evaluasi dan fungsi objektif berdasarkan jenis masalah klasifikasi. TabTransformer Algoritma mendeteksi jenis masalah klasifikasi berdasarkan jumlah label dalam data Anda. Untuk masalah regresi, metrik evaluasi adalah r kuadrat dan fungsi tujuannya adalah kesalahan kuadrat rata-rata. Untuk masalah klasifikasi biner, metrik evaluasi dan fungsi objektif keduanya adalah entropi silang biner. Untuk masalah klasifikasi multikelas, metrik evaluasi dan fungsi objektif keduanya adalah entropi silang multikelas.
catatan
Metrik TabTransformer evaluasi dan fungsi objektif saat ini tidak tersedia sebagai hiperparameter. Alih-alih, algoritme TabTransformer bawaan SageMaker AI secara otomatis mendeteksi jenis tugas klasifikasi (regresi, biner, atau multiclass) berdasarkan jumlah bilangan bulat unik di kolom label dan menetapkan metrik evaluasi dan fungsi objektif.
Nama Parameter | Deskripsi |
---|---|
n_epochs |
Jumlah zaman untuk melatih jaringan saraf dalam. Nilai yang valid: bilangan bulat, rentang: Bilangan bulat positif. Nilai default: |
patience |
Pelatihan akan berhenti jika satu metrik dari satu titik data validasi tidak membaik di Nilai yang valid: integer, range: ( Nilai default: |
learning_rate |
Tingkat di mana bobot model diperbarui setelah mengerjakan setiap batch contoh pelatihan. Nilai yang valid: float, range: Nomor floating point positif. Nilai default: |
batch_size |
Jumlah contoh disebarkan melalui jaringan. Nilai yang valid: integer, range: ( Nilai default: |
input_dim |
Dimensi penyematan untuk menyandikan kolom kategoris dan/atau kontinu. Nilai yang valid: string, salah satu dari berikut ini: Nilai default: |
n_blocks |
Jumlah blok encoder Transformer. Nilai yang valid: integer, range: ( Nilai default: |
attn_dropout |
Tingkat putus sekolah diterapkan pada lapisan Multi-Head Attention. Nilai yang valid: float, range: ( Nilai default: |
mlp_dropout |
Tingkat putus sekolah diterapkan ke FeedForward jaringan dalam lapisan encoder dan lapisan MLP akhir di atas encoder Transformer. Nilai yang valid: float, range: ( Nilai default: |
frac_shared_embed |
Fraksi embeddings dibagi oleh semua kategori yang berbeda untuk satu kolom tertentu. Nilai yang valid: float, range: ( Nilai default: |