DeepAR-Hyperparameter - Amazon SageMaker

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

DeepAR-Hyperparameter

In der folgenden Tabelle sind die Hyperparameter aufgeführt, die Sie beim Training mit dem Amazon SageMaker DeepAR-Prognosealgorithmus festlegen können.

Name des Parameters Beschreibung
context_length

Die Anzahl der Zeitpunkte, die dem Modell zur Verfügung gestellt werden, bevor die Prognose erfolgt. Der Wert für diesen Parameter sollte in etwa prediction_length entsprechen. Das Modell erhält zudem verzögerte Eingaben vom Ziel, sodass context_length viel geringer sein kann als typische Saisonabhängigkeiten. Beispielsweise kann für eine tägliche Zeitreihe eine jährliche Saisonabhängigkeit vorliegen. Das Modell bindet dann automatisch eine Verzögerung von einem Jahr ein, folglich kann die Kontextlänge weniger als ein Jahr betragen. Die vom Modell ausgewählten Verzögerungswerte hängen von der Frequenz der Zeitreihe ab. Verzögerungswerte für die Frequenz "Täglich" sind beispielsweise vorherige Woche, zwei Wochen, drei Wochen, vier Wochen und Jahr.

Erforderlich

Gültige Werte: Positive Ganzzahl

epochs

Die maximale Anzahl von Durchläufen der Trainingsdaten. Der optimale Wert hängt von Ihrer Datengröße und Lernrate ab. Siehe auch early_stopping_patience. Typische Werte liegen zwischen 10 und 1000.

Erforderlich

Gültige Werte: Positive Ganzzahl

prediction_length

Die Anzahl der Zeitschritte, für deren Prognose das Modell trainiert wurde. Dies wird auch als Prognosehorizont bezeichnet. Das trainierte Modell generiert stets Prognosen mit dieser Länge. Längere Prognosen kann das Modell nicht erstellen. Der Wert prediction_length wird beim Schulen eines Modells festgelegt und kann später nicht mehr geändert werden.

Erforderlich

Gültige Werte: Positive Ganzzahl

time_freq

Die Granularität der Zeitreihe im Datensatz. Verwenden Sie time_freq zur Auswahl geeigneter Datumsfunktionen und Verzögerungen. Das Modell unterstützt die folgenden Basishäufigkeiten. Außerdem unterstützt es ein Vielfaches dieser Basishäufigkeiten. Beispielsweise gibt 5min eine Häufigkeit von 5 Minuten an.

  • M: monatlich

  • W: wöchentlich

  • D: täglich

  • H: stündlich

  • min: jede Minute

Erforderlich

Gültige Werte: Eine Ganzzahl, gefolgt von M, WDH oder min. Z.B. 5min.

cardinality

Bei Verwendung der kategorischen Features (cat) ist cardinality ein Array, das die Anzahl von Kategorien (Gruppen) pro kategorischem Feature angibt. Legen Sie diesen Wert auf auto fest, um die Kardinalität aus den Daten abzuleiten. Der auto-Modus funktioniert auch, wenn keine kategorischen Features im Datensatz verwendet werden. Dies ist die empfohlene Einstellung für den Parameter.

Legen Sie die Kardinalität auf ignore fest, um zu erzwingen, dass DeepAR keine kategorischen Features verwendet, auch wenn sie in den Daten vorhanden sind.

Zum Ausführen einer zusätzlichen Datenvalidierung kann dieser Parameter auf den Istwert festgelegt werden. Beispiel: Wenn zwei kategorische Features bereitgestellt werden und die erste 2 und die zweite 3 mögliche Werte hat, legen Sie diesen Wert auf [2, 3] fest.

Weitere Informationen zur Verwendung der kategorischen Features finden Sie im Datenabschnitt auf der Seite für DeepAR der Hauptdokumentation.

Optional

Gültige Werte: auto, ignore, Array von positive Ganzzahlen, leere Zeichenfolge oder

Standardwert: auto

dropout_rate

Die Ausfallrate, die während des Trainings zu verwenden ist. Das Modell verwendet eine Zoneout-Regularisierung. Bei jedem Durchlauf wird eine zufällige Teilmenge ausgeblendeter Neuronen nicht aktualisiert. Typische Werte sind unter 0,2.

Optional

Gültige Werte: Gleitkommazahl

Standardwert: 0.1

early_stopping_patience

Ist dieser Parameter gesetzt, wird das Training gestoppt, wenn keine Fortschritte innerhalb der festgelegten Anzahl von epochs zu verzeichnen ist. Das Modell mit der niedrigsten Verlustrate wird als endgültiges Modell zurückgegeben.

Optional

Gültige Werte: Ganzzahl

embedding_dimension

Die Größe des pro kategorischem Features gelernten eingebetteten Vektors (für alle kategorischen Features wird derselbe Wert verwendet).

Das DeepAR-Modell kann Zeitreihenmuster auf Gruppenebene lernen, sofern eine kategorische Gruppenfunktion angegeben wird. Dazu lernt das Modell einen eingebetteten Vektor der Größe embedding_dimension für jede Gruppe und erfasst die häufigen Eigenschaften aller Zeitreihen in der Gruppe. Bei einem höheren embedding_dimension-Wert kann das Modell komplexere Muster erfassen. Da durch eine Erhöhung von embedding_dimension auch die Anzahl von Parametern im Modell steigt, werden mehr Trainingsdaten zum Lernen dieser Parameter benötigt. Typische Werte für diesen Parameter sind zwischen 10 und 100.

Optional

Gültige Werte: positive Ganzzahl

Standardwert: 10

learning_rate

Die Lernrate in des Trainings. Typische Werte liegen zwischen 1e-4 und 1e-1.

Optional

Gültige Werte: Gleitkommazahl

Standardwert: 1e-3

likelihood

Das Modell generiert eine probabilistische Prognose und liefert Quantile für Verteilung und Rückgabe der Stichprobe. Wählen Sie abhängig von Ihren Daten eine geeignete Wahrscheinlichkeit (Stördatenmodell) aus, die für Unsicherheitsschätzungen verwendet wird. Folgende Wahrscheinlichkeiten sind auswählbar:

  • Gaußsche: Verwendung für reellwertige Daten.

  • Beta: Verwendung für reellwertige Ziele zwischen 0 und 1 inklusive.

  • Negativ-binomial: Verwendung für Zähldaten (positive Ganzzahlen).

  • Studentsche-T: Eine Alternative zu reellwertigen Daten, die gut für stoßweise Daten geeignet ist.

  • Deterministisch-L1: Ein Verlustfunktion, die keine Unsicherheit einschätzt und nur eine Punktprognose lernt.

Optional

Gültige Werte: Entweder Gaußsche, Beta, Negativ-binomial, Studentsche-T oder Deterministisch-L1.

Standardwert: student-T

mini_batch_size

Die Größe der im Rahmen des Trainings verwendeten Mini-Stapel. Typische Werte liegen zwischen 32 und 512.

Optional

Gültige Werte: positive Ganzzahl

Standardwert: 128

num_cells

Die Anzahl der Zellen, die in jeder verborgenen Ebene von verwendet werden sollen. RNN Typische Werte liegen zwischen 30 und 100.

Optional

Gültige Werte: positive Ganzzahl

Standardwert: 40

num_dynamic_feat

Anzahl von dynamic_feat in den Daten. Legen Sie diesen Wert auf auto fest, um die Anzahl von dynamischen Funktionen aus den Daten abzuleiten. Der auto-Modus funktioniert auch, wenn keine dynamischen Funktionen im Datensatz verwendet werden. Dies ist die empfohlene Einstellung für den Parameter.

Legen Sie num_dynamic_feat auf ignore fest, um zu erzwingen, dass DeepAR keine dynamischen Funktionen verwendet, auch wenn sie in den Daten vorhanden sind.

Zum Ausführen einer zusätzlichen Datenvalidierung kann dieser Parameter auf den tatsächlichen Ganzzahlwert festgelegt werden. Wenn z. B. zwei dynamische Funktionen bereitgestellt werden, legen Sie diesen Wert auf 2 fest.

Optional

Gültige Werte: auto, ignore, positive Ganzzahl oder leere Zeichenfolge

Standardwert: auto

num_eval_samples

Die Anzahl von Stichproben, die pro Zeitreihe zur Berechnung der Test-Genauigkeitsmetriken verwendet werden. Dieser Parameter hat keinen Einfluss auf das Training oder das endgültige Modell. Das Modell kann insbesondere mit einer anderen Anzahl von Stichproben abgefragt werden. Dieser Parameter wirkt sich nur auf die gemeldeten Genauigkeitswerte im Testkanal nach dem Training aus. Kleinere Werte führen zu einer schnelleren Auswertung, die Auswertungsbewertungen sind in der Regel jedoch schlechter und ungenauer. Bei einer Auswertung mit höheren Quantilen wie 0,95 sollte die Anzahl von Auswertungsstichproben ggf. erhöht werden.

Optional

Gültige Werte: Ganzzahl

Standardwert: 100

num_layers

Die Anzahl der versteckten Ebenen in derRNN. Typische Werte liegen zwischen 1 und 4.

Optional

Gültige Werte: positive Ganzzahl

Standardwert: 2

test_quantiles

Quantile, für die der Quantilverlust im Testkanal berechnet werden soll

Optional

Gültige Werte: Array von Gleitkommazahlen

Standardwert: [0.1, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8, 0.9]