BlazingText Hyperparameter - Amazon SageMaker

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

BlazingText Hyperparameter

Wenn Sie einen Schulungsauftrag mit einer CreateTrainingJob Anforderung beginnen, geben Sie einen Schulungsalgorithmus an. Sie können auch Algorithmus-spezifische Hyperparameter als string-to-string Zuordnungen angeben. Die Hyperparameter für den BlazingText Algorithmus hängen davon ab, welchen Modus Sie verwenden: Word2Vec (unüberwacht) und Textklassifizierung (überwacht).

Word2Vec-Hyperparameter

In der folgenden Tabelle sind die Hyperparameter für den von Amazon bereitgestellten BlazingText Word2Vec-Trainingsalgorithmus aufgeführt SageMaker.

Name des Parameters Beschreibung
mode

Die für das Training verwendete Word2vec-Architektur.

Erforderlich

Gültige Werte: batch_skipgram, skipgram oder cbow

batch_size

Die Größe jedes Stapels, wenn mode auf batch_skipgram festgelegt ist. Festgelegt auf eine Zahl zwischen 10 und 20.

Optional

Gültige Werte: Positive Ganzzahl

Standardwert: 11

buckets

Die Anzahl von Hash-Buckets für Teilwörter.

Optional

Gültige Werte: positive Ganzzahl

Standardwert: 2000000

epochs

Die Anzahl von abgeschlossenen Durchläufe durch die Schulungsdaten.

Optional

Gültige Werte: Positive Ganzzahl

Standardwert: 5

evaluation

Ob das trainierte Modell mit dem WordSimilarity-353 Test ausgewertet wird.

Optional

Gültige Werte: (Boolescher Wert) True oder False

Standardwert: True

learning_rate

Die für Parameteraktualisierungen verwendete Schrittgröße.

Optional

Gültige Werte: Positive Gleitkommazahl

Standardwert: 0.05

min_char

Die Mindestanzahl der Zeichen für N-Gramm-Zeichen/Teilwörter.

Optional

Gültige Werte: positive Ganzzahl

Standardwert: 3

min_count

Wörter, die weniger als min_count-mal angezeigt werden, werden verworfen.

Optional

Gültige Werte: Positive Ganzzahl

Standardwert: 5

max_char

Die Höchstanzahl der Zeichen für N-Gramm-Zeichen/Teilwörter.

Optional

Gültige Werte: positive Ganzzahl

Standardwert: 6

negative_samples

Die Anzahl der negativen Beispiele für die Strategie des Austauschs von Negativbeispielen.

Optional

Gültige Werte: Positive Ganzzahl

Standardwert: 5

sampling_threshold

Der Schwellenwert für die Häufigkeit von Wörtern. Wörter, die mit höheren Frequenz in den Trainingsdaten erscheinen, werden nach dem Zufallsprinzip heruntergesampelt.

Optional

Gültige Werte: Positive Bruchzahl. Der empfohlene Bereich ist (0, 1e-3]

Standardwert: 0.0001

subwords

Gibt an, ob Teilworteinbettungen zu lernen sind oder nicht.

Optional

Gültige Werte: (Boolescher Wert) True oder False

Standardwert: False

vector_dim

Die Dimension der Wortvektoren, die der Algorithmus lernt.

Optional

Gültige Werte: Positive Ganzzahl

Standardwert: 100

window_size

Die Größe des Kontextfensters. Das Kontextfenster ist die Anzahl der Wörter, die das für die Schulung verwendete Zielwort umgeben.

Optional

Gültige Werte: Positive Ganzzahl

Standardwert: 5

Textklassifizierungs-Hyperparameter

In der folgenden Tabelle sind die Hyperparameter für den von Amazon bereitgestellten Textklassifizierungs-Trainingsalgorithmus aufgeführt SageMaker.

Anmerkung

Auch wenn einige der Parameter in den Textklassifizierungs- und Word2Vec-Modi gängig sind, haben sie möglicherweise je nach Kontext unterschiedliche Bedeutungen.

Name des Parameters Beschreibung
mode

Der Schulungsmodus

Erforderlich

Zulässige Werte: supervised

buckets

Die Anzahl der Hash-Buckets für N-Gramm-Wörter.

Optional

Gültige Werte: Positive Ganzzahl

Standardwert: 2000000

early_stopping

Gibt an, ob die Schulung angehalten wird, wenn sich die Validierungsgenauigkeit nach einer patience Reihe von Epochen nicht verbessert. Beachten Sie, dass ein Validierungskanal erforderlich ist, wenn ein Early-Stopping verwendet wird.

Optional

Gültige Werte: (Boolescher Wert) True oder False

Standardwert: False

epochs

Die maximale Anzahl abgeschlossener Durchläufe durch die Schulungsdaten.

Optional

Gültige Werte: Positive Ganzzahl

Standardwert: 5

learning_rate

Die für Parameteraktualisierungen verwendete Schrittgröße.

Optional

Gültige Werte: Positive Gleitkommazahl

Standardwert: 0.05

min_count

Wörter, die weniger als min_count-mal angezeigt werden, werden verworfen.

Optional

Gültige Werte: Positive Ganzzahl

Standardwert: 5

min_epochs

Die Mindestanzahl der Epochen, die geschult werden sollen, bevor die Logik zum Early-Stopping aufgerufen wird.

Optional

Gültige Werte: Positive Ganzzahl

Standardwert: 5

patience

Die Anzahl der Epochen, die gewartet werden soll, bevor ein Early-Stopping durchgeführt wird, wenn keine Fortschritte hinsichtlich der festgelegten Validierung erfolgen. Nur verwendet, wenn early_stopping True ist.

Optional

Gültige Werte: Positive Ganzzahl

Standardwert: 4

vector_dim

Die Dimension der Einbettungsebene.

Optional

Gültige Werte: Positive Ganzzahl

Standardwert: 100

word_ngrams

Die Anzahl der N-Gramm-Wort-Funktionen, die verwendet werden sollen.

Optional

Gültige Werte: Positive Ganzzahl

Standardwert: 2