DeepAR Hyperparameter - Amazon SageMaker

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

DeepAR Hyperparameter

Tabel berikut mencantumkan hyperparameters yang dapat Anda atur saat berlatih dengan algoritme peramalan Amazon SageMaker DeepAR.

Nama Parameter Deskripsi
context_length

Jumlah titik waktu yang dapat dilihat model sebelum membuat prediksi. Nilai untuk parameter ini harus hampir sama denganprediction_length. Model ini juga menerima input tertinggal dari target, sehingga context_length bisa jauh lebih kecil daripada musim biasa. Misalnya, deret waktu harian dapat memiliki musim tahunan. Model secara otomatis menyertakan jeda satu tahun, sehingga panjang konteksnya bisa lebih pendek dari satu tahun. Nilai lag yang dipilih model bergantung pada frekuensi deret waktu. Misalnya, nilai lag untuk frekuensi harian adalah minggu sebelumnya, 2 minggu, 3 minggu, 4 minggu, dan tahun.

Diperlukan

Nilai yang valid: Bilangan bulat positif

epochs

Jumlah maksimum lintasan atas data pelatihan. Nilai optimal tergantung pada ukuran data dan tingkat pembelajaran Anda. Lihat juga early_stopping_patience. Nilai tipikal berkisar dari 10 hingga 1000.

Diperlukan

Nilai yang valid: Bilangan bulat positif

prediction_length

Jumlah langkah waktu yang dilatih model untuk diprediksi, juga disebut cakrawala ramalan. Model terlatih selalu menghasilkan prakiraan dengan panjang ini. Itu tidak dapat menghasilkan perkiraan yang lebih lama. prediction_lengthItu diperbaiki ketika model dilatih dan tidak dapat diubah nanti.

Diperlukan

Nilai yang valid: Bilangan bulat positif

time_freq

Perincian deret waktu dalam kumpulan data. Gunakan time_freq untuk memilih fitur dan kelambatan tanggal yang sesuai. Model ini mendukung frekuensi dasar berikut. Ini juga mendukung kelipatan frekuensi dasar ini. Misalnya, 5min menentukan frekuensi 5 menit.

  • M: bulanan

  • W: mingguan

  • D: setiap hari

  • H: per jam

  • min: setiap menit

Diperlukan

Nilai yang valid: Sebuah bilangan bulat diikuti oleh M, W, D, H, atau min. Misalnya,5min.

cardinality

Saat menggunakan fitur kategoris (cat), cardinality adalah array yang menentukan jumlah kategori (grup) per fitur kategoris. Setel ini auto untuk menyimpulkan kardinalitas dari data. autoMode ini juga berfungsi ketika tidak ada fitur kategoris yang digunakan dalam kumpulan data. Ini adalah pengaturan yang disarankan untuk parameter.

Atur kardinalitas ignore untuk memaksa DeepAR untuk tidak menggunakan fitur kategoris, bahkan itu ada dalam data.

Untuk melakukan validasi data tambahan, dimungkinkan untuk secara eksplisit mengatur parameter ini ke nilai aktual. Misalnya, jika dua fitur kategoris disediakan di mana yang pertama memiliki 2 dan yang lainnya memiliki 3 nilai yang mungkin, atur ini ke [2, 3].

Untuk informasi selengkapnya tentang cara menggunakan fitur kategoris, lihat bagian data di halaman dokumentasi utama DeepAR.

Opsional

Nilai yang valid: autoignore,, array bilangan bulat positif, string kosong, atau

Nilai default: auto

dropout_rate

Tingkat putus sekolah untuk digunakan selama pelatihan. Model ini menggunakan regularisasi zoneout. Untuk setiap iterasi, subset acak dari neuron tersembunyi tidak diperbarui. Nilai tipikal kurang dari 0,2.

Opsional

Nilai yang valid: float

Nilai default: 0.1

early_stopping_patience

Jika parameter ini diatur, pelatihan berhenti ketika tidak ada kemajuan yang dibuat dalam jumlah yang ditentukanepochs. Model yang memiliki kerugian terendah dikembalikan sebagai model akhir.

Opsional

Nilai yang valid: integer

embedding_dimension

Ukuran vektor penyematan yang dipelajari per fitur kategoris (nilai yang sama digunakan untuk semua fitur kategoris).

Model DeepAR dapat mempelajari pola deret waktu tingkat grup ketika fitur pengelompokan kategoris disediakan. Untuk melakukan ini, model mempelajari vektor penyematan ukuran embedding_dimension untuk setiap grup, menangkap properti umum dari semua deret waktu dalam grup. Yang lebih besar embedding_dimension memungkinkan model untuk menangkap pola yang lebih kompleks. Namun, karena meningkatkan peningkatan jumlah parameter dalam model, lebih banyak data pelatihan diperlukan untuk mempelajari parameter ini secara akurat. embedding_dimension Nilai tipikal untuk parameter ini adalah antara 10-100.

Opsional

Nilai yang valid: bilangan bulat positif

Nilai default: 10

learning_rate

Tingkat pembelajaran yang digunakan dalam pelatihan. Nilai tipikal berkisar dari 1e-4 hingga 1e-1.

Opsional

Nilai yang valid: float

Nilai default: 1e-3

likelihood

Model menghasilkan perkiraan probabilistik, dan dapat memberikan kuantil distribusi dan sampel pengembalian. Bergantung pada data Anda, pilih kemungkinan yang sesuai (model kebisingan) yang digunakan untuk perkiraan ketidakpastian. Kemungkinan berikut dapat dipilih:

  • gaussian: Gunakan untuk data bernilai nyata.

  • beta: Gunakan untuk target bernilai nyata antara 0 dan 1 inklusif.

  • negatif-binomial: Digunakan untuk menghitung data (bilangan bulat non-negatif).

  • Student-T: Alternatif untuk data bernilai nyata yang berfungsi dengan baik untuk data yang meledak.

  • Deterministic-L1: Fungsi kerugian yang tidak memperkirakan ketidakpastian dan hanya mempelajari perkiraan titik.

Opsional

Nilai yang valid: Salah satu gaussian, beta, negatif-binomial, student-T, atau deterministic-L1.

Nilai default: student-T

mini_batch_size

Ukuran mini-batch yang digunakan selama pelatihan. Nilai tipikal berkisar dari 32 hingga 512.

Opsional

Nilai yang valid: bilangan bulat positif

Nilai default: 128

num_cells

Jumlah sel yang akan digunakan di setiap lapisan tersembunyi dariRNN. Nilai tipikal berkisar antara 30 hingga 100.

Opsional

Nilai yang valid: bilangan bulat positif

Nilai default: 40

num_dynamic_feat

Jumlah yang dynamic_feat disediakan dalam data. Setel ini auto untuk menyimpulkan jumlah fitur dinamis dari data. autoMode ini juga berfungsi ketika tidak ada fitur dinamis yang digunakan dalam kumpulan data. Ini adalah pengaturan yang disarankan untuk parameter.

Untuk memaksa DeepAR untuk tidak menggunakan fitur dinamis, bahkan itu mereka hadir dalam data, diatur num_dynamic_feat ke. ignore

Untuk melakukan validasi data tambahan, dimungkinkan untuk secara eksplisit mengatur parameter ini ke nilai integer yang sebenarnya. Misalnya, jika dua fitur dinamis disediakan, atur ini ke 2.

Opsional

Nilai yang valid:auto,ignore, bilangan bulat positif, atau string kosong

Nilai default: auto

num_eval_samples

Jumlah sampel yang digunakan per deret waktu saat menghitung metrik akurasi pengujian. Parameter ini tidak memiliki pengaruh pada pelatihan atau model akhir. Secara khusus, model dapat ditanyakan dengan jumlah sampel yang berbeda. Parameter ini hanya mempengaruhi skor akurasi yang dilaporkan pada saluran tes setelah pelatihan. Nilai yang lebih kecil menghasilkan evaluasi yang lebih cepat, tetapi skor evaluasi biasanya lebih buruk dan lebih tidak pasti. Saat mengevaluasi dengan kuantil yang lebih tinggi, misalnya 0,95, mungkin penting untuk meningkatkan jumlah sampel evaluasi.

Opsional

Nilai yang valid: integer

Nilai default: 100

num_layers

Jumlah lapisan tersembunyi diRNN. Nilai tipikal berkisar dari 1 hingga 4.

Opsional

Nilai yang valid: bilangan bulat positif

Nilai default: 2

test_quantiles

Kuantil untuk menghitung kerugian kuantil pada saluran uji.

Opsional

Nilai yang valid: array float

Nilai default: [0.1, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8, 0.9]