Hiperparameter Segmentasi Semantik - Amazon SageMaker

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Hiperparameter Segmentasi Semantik

Tabel berikut mencantumkan hyperparameters yang didukung oleh algoritma segmentasi SageMaker semantik Amazon untuk arsitektur jaringan, input data, dan pelatihan. Anda menentukan Segmentasi Semantik untuk pelatihan dalam permintaanAlgorithmName. CreateTrainingJob

Hiperparameter Arsitektur Jaringan

Nama Parameter Deskripsi
backbone

Tulang punggung yang digunakan untuk komponen encoder algoritma.

Opsional

Nilai yang valid: resnet-50, resnet-101

Nilai default: resnet-50

use_pretrained_model

Apakah model yang telah dilatih sebelumnya akan digunakan untuk tulang punggung.

Opsional

Nilai yang valid: True, False

Nilai default: True

algorithm

Algoritma yang digunakan untuk segmentasi semantik.

Opsional

Nilai yang valid:

Nilai default: fcn

Hiperparameter Data

Nama Parameter Deskripsi
num_classes

Jumlah kelas untuk segmen.

Diperlukan

Nilai yang valid: 2 ≤ bilangan bulat positif ≤ 254

num_training_samples

Jumlah sampel dalam data pelatihan. Algoritma menggunakan nilai ini untuk mengatur penjadwal tingkat pembelajaran.

Diperlukan

Nilai yang valid: bilangan bulat positif

base_size

Mendefinisikan bagaimana gambar diskalakan ulang sebelum dipotong. Gambar diskalakan ulang sedemikian rupa sehingga panjang ukuran panjang diatur untuk base_size dikalikan dengan angka acak dari 0,5 hingga 2,0, dan ukuran pendek dihitung untuk mempertahankan rasio aspek.

Opsional

Nilai yang valid: bilangan bulat positif> 16

Nilai default: 520

crop_size

Ukuran gambar untuk input selama pelatihan. Kami secara acak mengubah skala gambar input berdasarkanbase_size, dan kemudian mengambil potongan persegi acak dengan panjang sisi sama dengan. crop_size crop_sizeAkan secara otomatis dibulatkan ke kelipatan 8.

Opsional

Nilai yang valid: bilangan bulat positif> 16

Nilai default: 240

Pelatihan Hyperparameters

Nama Parameter Deskripsi
early_stopping

Apakah akan menggunakan logika penghentian dini selama pelatihan.

Opsional

Nilai yang valid: True, False

Nilai default: False

early_stopping_min_epochs

Jumlah minimum epoch yang harus dijalankan.

Opsional

Nilai yang valid: integer

Nilai default: 5

early_stopping_patience

Jumlah epoch yang memenuhi toleransi untuk kinerja yang lebih rendah sebelum algoritme memberlakukan penghentian awal.

Opsional

Nilai yang valid: integer

Nilai default: 4

early_stopping_tolerance

Jika peningkatan relatif dari skor pekerjaan pelatihan, MiOu, lebih kecil dari nilai ini, penghentian awal menganggap zaman tidak membaik. Ini hanya digunakan ketika early_stopping =True.

Opsional

Nilai yang valid: 0 ≤ float ≤ 1

Nilai default: 0.0

epochs

Jumlah zaman yang digunakan untuk melatih.

Opsional

Nilai yang valid: bilangan bulat positif

Nilai default: 10

gamma1

Faktor peluruhan untuk rata-rata bergerak gradien kuadrat untuk. rmsprop Digunakan hanya untukrmsprop.

Opsional

Nilai yang valid: 0 ≤ float ≤ 1

Nilai default: 0,9

gamma2

Faktor momentum untukrmsprop.

Opsional

Nilai yang valid: 0 ≤ float ≤ 1

Nilai default: 0,9

learning_rate

Tingkat pembelajaran awal.

Opsional

Nilai yang valid: 0 < float ≤ 1

Nilai default: 0,001

lr_scheduler

Bentuk jadwal tingkat pembelajaran yang mengontrol penurunannya dari waktu ke waktu.

Opsional

Nilai yang valid:

  • step: Peluruhan bertahap, di mana tingkat pembelajaran dikurangi (dikalikan) dengan zaman lr_scheduler_factor setelah yang ditentukan oleh. lr_scheduler_step

  • poly: Peluruhan halus menggunakan fungsi polinomial.

  • cosine: Peluruhan halus menggunakan fungsi kosinus.

Nilai default: poly

lr_scheduler_factor

Jika lr_scheduler diatur kestep, rasio yang digunakan untuk mengurangi (multipy) learning_rate setelah masing-masing zaman yang ditentukan oleh. lr_scheduler_step Kalau tidak, diabaikan.

Opsional

Nilai yang valid: 0 ≤ float ≤ 1

Nilai default: 0,1

lr_scheduler_step

Daftar zaman yang dibatasi koma setelah itu dikurangi (dikalikan) dengan learning_rate a. lr_scheduler_factor Misalnya, jika nilainya diatur ke"10, 20", maka learning-rate dikurangi lr_scheduler_factor setelah zaman ke-10 dan lagi oleh faktor ini setelah zaman ke-20.

Diperlukan secara kondisional jika lr_scheduler diatur kestep. Kalau tidak, diabaikan.

Nilai yang valid: string

Nilai default: (Tidak ada default, karena nilainya diperlukan saat digunakan.)

mini_batch_size

Ukuran batch untuk pelatihan. Menggunakan yang besar mini_batch_size biasanya menghasilkan pelatihan yang lebih cepat, tetapi mungkin menyebabkan Anda kehabisan memori. Penggunaan memori dipengaruhi oleh nilai-nilai mini_batch_size dan image_shape parameter, dan arsitektur backbone.

Opsional

Nilai yang valid: bilangan bulat positif

Nilai default: 16

momentum

Momentum untuk sgd pengoptimal. Saat Anda menggunakan pengoptimal lain, algoritma segmentasi semantik mengabaikan parameter ini.

Opsional

Nilai yang valid: 0 < float ≤ 1

Nilai default: 0,9

optimizer

Jenis pengoptimal. Untuk informasi lebih lanjut tentang pengoptimal, pilih tautan yang sesuai:

Opsional

Nilai yang valid:adam,adagrad,nag,rmsprop, sgd

Nilai default: sgd

syncbn

Jika disetel keTrue, rata-rata normalisasi batch dan varians dihitung atas semua sampel yang diproses di seluruh GPU.

Opsional

Nilai yang valid: True, False

Nilai default: False

validation_mini_batch_size

Ukuran batch untuk validasi. Sebuah besar mini_batch_size biasanya menghasilkan pelatihan yang lebih cepat, tetapi mungkin menyebabkan Anda kehabisan memori. Penggunaan memori dipengaruhi oleh nilai-nilai mini_batch_size dan image_shape parameter, dan arsitektur backbone.

  • Untuk menilai validasi pada seluruh gambar tanpa memotong gambar, atur parameter ini ke 1. Gunakan opsi ini jika Anda ingin mengukur kinerja pada seluruh gambar secara keseluruhan.

    catatan

    Mengatur validation_mini_batch_size parameter ke 1 menyebabkan algoritme membuat model jaringan baru untuk setiap gambar. Ini mungkin memperlambat validasi dan pelatihan.

  • Untuk memotong gambar ke ukuran yang ditentukan dalam crop_size parameter, bahkan selama evaluasi, atur parameter ini ke nilai yang lebih besar dari 1.

Opsional

Nilai yang valid: bilangan bulat positif

Nilai default: 16

weight_decay

Koefisien peluruhan berat untuk sgd pengoptimal. Saat Anda menggunakan pengoptimal lain, algoritme mengabaikan parameter ini.

Opsional

Nilai yang valid: 0 < float < 1

Nilai default: 0,0001