Iperparametri DeepAR - Amazon SageMaker

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Iperparametri DeepAR

La tabella seguente elenca gli iperparametri che puoi impostare durante l'allenamento con l'algoritmo di previsione Amazon SageMaker DeepAR.

Nome parametro Descrizione
context_length

Il numero di punti temporali ottenuti dal modello prima di effettuare la previsione. Il valore di questo parametro deve essere più o meno lo stesso di prediction_length. Il modello, inoltre, riceve input ritardati dalla destinazione, perciò context_length può essere molto inferiore rispetto alle stagionalità tipiche. Ad esempio, una serie temporale giornaliera può avere una stagionalità annuale. Il modello include automaticamente un ritardo di un anno, pertanto la lunghezza del contesto può essere inferiore a un anno. I valori di ritardo che il modello preleva dipendono dalla frequenza della serie temporale. Ad esempio, i valori di ritardo per la frequenza giornaliera sono settimana precedente, 2 settimane, 3 settimane, 4 settimane e anno.

Campo obbligatorio

Valori validi: numeri interi positivi

epochs

Numero massimo di passate sui dati di addestramento. Il valore ottimale dipende dalle dimensioni dei dati e dalla velocità di apprendimento. Consulta anche early_stopping_patience. I valori tipici sono compresi tra 10 e 1000.

Campo obbligatorio

Valori validi: numeri interi positivi

prediction_length

Numero di fasi temporali che il modello è in grado di prevedere, noto anche come orizzonte di previsione. Il modello addestrato genera sempre previsioni con questa durata. Non è in grado di generare previsioni più lunghe. Il valore prediction_length viene fissato quando un modello viene addestrato e non può essere modificato in un secondo momento.

Campo obbligatorio

Valori validi: numeri interi positivi

time_freq

Granularità della serie temporale nel set di dati. Utilizza time_freq per selezionare i ritardi e le funzionalità relative alla data. Il modello supporta solo le seguenti frequenze di base. Inoltre, supporta più frequenze di base. Ad esempio, 5min specifica una frequenza di 5 minuti.

  • M: mensilmente

  • W: settimanalmente

  • D: giornalmente

  • H: orario

  • min: ogni minuto

Campo obbligatorio

I valori validi: un numero intero seguito da M, W, D, H o min. Ad esempio, 5min.

cardinality

Quando utilizzi la caratteristiche di categoria (cat), cardinality è una matrice che specifica il numero di categorie (gruppi) per ogni caratteristica di categoria. Imposta il valore su auto per dedurre la cardinalità dai dati. La modalità auto funziona anche quando nel set di dati non vengono utilizzate caratteristiche di categoria. Questa è l'impostazione consigliata per il parametro.

Imposta la cardinalità su ignore per forzare DeepAR a non utilizzare le caratteristiche di categoria, anche se presenti nei dati.

Per eseguire ulteriori convalide dei dati, è possibile impostare esplicitamente questo parametro sul valore effettivo. Ad esempio, se vengono fornite due caratteristiche di categoria in cui la prima ha 2 e l'altra ha 3 valori possibili, imposta il parametro su [2, 3].

Per ulteriori informazioni su come utilizzare la caratteristica di categoria, consulta la sezione dei dati nella pagina della documentazione principale di DeepAR.

Opzionale

I valori validi: auto, ignore, array di interi positivi, stringa vuota oppure

Valore predefinito: auto

dropout_rate

Tasso di abbandono da utilizzare durante l’addestramento. Il modello utilizza la regolarizzazione del metodo zoneout. Per ogni iterazione un sottoinsieme casuale di neuroni nascosti non viene aggiornato. I valori tipici sono inferiori a 0,2.

Opzionale

Valori validi: float.

Valore predefinito: 0,1

early_stopping_patience

Se questo parametro è impostato, l’addestramento si interrompe quando non si registrano progressi entro il numero specificato di epochs. Il modello con la perdita più bassa viene restituito come modello finale.

Opzionale

Valori validi: numero intero

embedding_dimension

La dimensione del vettore di incorporamento appreso per caratteristica di categoria (lo stesso valore è utilizzato per tutte le caratteristiche di categoria).

Il modello DeepAR può apprendere modelli di serie temporali a livello di gruppo quando viene fornita una caratteristica di raggruppamento categorica. Per eseguire questa operazione, il modello apprende un vettore di incorporamento di dimensioni embedding_dimension per ciascun gruppo e acquisisce le proprietà comuni a tutte le serie temporali del gruppo. Un valore embedding_dimension più grande consente al modello di acquisire modelli più complessi. Tuttavia, perché l'aumento di embedding_dimension aumenti il numero di parametri nel modello, sono necessari più dati di addestramento per apprendere correttamente questi parametri. I valori tipici di questo parametro sono compresi tra 10 e 100.

Opzionale

Valori validi: numeri interi positivi

Valore predefinito: 10

learning_rate

Velocità di apprendimento utilizzata durante l’addestramento. I valori tipici sono compresi tra 1e-4 e 1e-1.

Opzionale

Valori validi: float.

Valore predefinito: 1e-3

likelihood

Il modello genera una previsione probabilistica e può fornire quantili della distribuzione e restituire campioni. A seconda dei tuoi dati, seleziona una probabilità appropriata (modello di disturbo) utilizzata per le stime di incertezza. È possibile selezionare le probabilità seguenti:

  • gaussian (gaussiano): si utilizza per i dati più importanti.

  • beta: si utilizza per i target a valori reali compresi tra 0 e 1 inclusi.

  • negative-binomial (binomial negativo): si utilizza per i dati di conteggio (numeri interi non negativi).

  • student-T (T studente): un'alternativa per i dati a valore reale ideali per i dati con lunghi intervalli di inattività.

  • deterministic-L1 (L1 deterministico): una funzione di perdita che non valuta l'incertezza e apprende unicamente una previsione di punti.

Opzionale

Valori validi: uno tra gaussian (gaussiano), beta, negative-binomial (binomial negativo), student-T (T studente) e deterministic-L1 (L1 deterministico).

Valore predefinito: student-T

mini_batch_size

Dimensione dei mini batch usati durante l’addestramento. I valori tipici sono compresi tra 32 e 512.

Opzionale

Valori validi: numeri interi positivi

Valore predefinito: 128

num_cells

Il numero di celle da utilizzare in ogni livello nascosto di. RNN I valori tipici sono compresi tra 30 e 100.

Opzionale

Valori validi: numeri interi positivi

Valore predefinito: 40

num_dynamic_feat

Il numero di dynamic_feat forniti nei dati. Imposta il valore su auto per dedurre il numero di caratteristiche dinamiche dai dati. La modalità auto funziona anche quando nel set di dati non vengono utilizzate caratteristiche dinamiche. Questa è l'impostazione consigliata per il parametro.

Per forzare DeepAR a non utilizzare le caratteristiche dinamiche, anche se presenti nei dati, imposta num_dynamic_feat su ignore.

Per eseguire ulteriori convalide dei dati, è possibile impostare esplicitamente questo parametro sul numero intero effettivo. Ad esempio, se vengono fornite due caratteristiche dinamiche, imposta questo valore su 2.

Opzionale

I valori validi: auto, ignore, numero intero positivo o stringa vuota

Valore predefinito: auto

num_eval_samples

Il numero di esempi utilizzati per ogni serie temporale quando si calcolano i parametri di accuratezza del test. Questo parametro non ha alcuna influenza sull’addestramento o sul modello finale. In particolare, è possibile eseguire le query sul modello con un numero di esempi diverso. Questo parametro influisce solo sui punteggi di accuratezza riportati nel canale di test dopo l’addestramento. I valori più piccoli producono una valutazione più rapidamente, ma i punteggi di valutazione sono in genere peggiori e meno accurati. Quando si valuta con quantili più elevati, ad esempio 0,95, può essere importante aumentare il numero di esempi di valutazione.

Opzionale

Valori validi: numero intero

Valore predefinito: 100

num_layers

Il numero di livelli nascosti inRNN. I valori tipici sono compresi tra 1 e 4.

Opzionale

Valori validi: numeri interi positivi

Valore predefinito: 2

test_quantiles

Quantili per i quali calcolare lo scarto quantile sul canale di test.

Opzionale

Valori validi: array di float

Valore predefinito: [0.1, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8, 0.9]