Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
BlazingText Hyperparameter
Wenn Sie einen Schulungsauftrag mit einer CreateTrainingJob
Anforderung beginnen, geben Sie einen Schulungsalgorithmus an. Sie können auch Algorithmus-spezifische Hyperparameter als string-to-string Zuordnungen angeben. Die Hyperparameter für den BlazingText Algorithmus hängen davon ab, welchen Modus Sie verwenden: Word2Vec (unüberwacht) und Textklassifizierung (überwacht).
Word2Vec-Hyperparameter
In der folgenden Tabelle sind die Hyperparameter für den von Amazon bereitgestellten BlazingText Word2Vec-Trainingsalgorithmus aufgeführt SageMaker.
Name des Parameters | Beschreibung |
---|---|
mode |
Die für das Training verwendete Word2vec-Architektur. Erforderlich Gültige Werte: |
batch_size |
Die Größe jedes Stapels, wenn Optional Gültige Werte: Positive Ganzzahl Standardwert: 11 |
buckets |
Die Anzahl von Hash-Buckets für Teilwörter. Optional Gültige Werte: positive Ganzzahl Standardwert: 2000000 |
epochs |
Die Anzahl von abgeschlossenen Durchläufe durch die Schulungsdaten. Optional Gültige Werte: Positive Ganzzahl Standardwert: 5 |
evaluation |
Ob das trainierte Modell mit dem WordSimilarity-353 Test Optional Gültige Werte: (Boolescher Wert) Standardwert: |
learning_rate |
Die für Parameteraktualisierungen verwendete Schrittgröße. Optional Gültige Werte: Positive Gleitkommazahl Standardwert: 0.05 |
min_char |
Die Mindestanzahl der Zeichen für N-Gramm-Zeichen/Teilwörter. Optional Gültige Werte: positive Ganzzahl Standardwert: 3 |
min_count |
Wörter, die weniger als Optional Gültige Werte: Positive Ganzzahl Standardwert: 5 |
max_char |
Die Höchstanzahl der Zeichen für N-Gramm-Zeichen/Teilwörter. Optional Gültige Werte: positive Ganzzahl Standardwert: 6 |
negative_samples |
Die Anzahl der negativen Beispiele für die Strategie des Austauschs von Negativbeispielen. Optional Gültige Werte: Positive Ganzzahl Standardwert: 5 |
sampling_threshold |
Der Schwellenwert für die Häufigkeit von Wörtern. Wörter, die mit höheren Frequenz in den Trainingsdaten erscheinen, werden nach dem Zufallsprinzip heruntergesampelt. Optional Gültige Werte: Positive Bruchzahl. Der empfohlene Bereich ist (0, 1e-3] Standardwert: 0.0001 |
subwords |
Gibt an, ob Teilworteinbettungen zu lernen sind oder nicht. Optional Gültige Werte: (Boolescher Wert) Standardwert: |
vector_dim |
Die Dimension der Wortvektoren, die der Algorithmus lernt. Optional Gültige Werte: Positive Ganzzahl Standardwert: 100 |
window_size |
Die Größe des Kontextfensters. Das Kontextfenster ist die Anzahl der Wörter, die das für die Schulung verwendete Zielwort umgeben. Optional Gültige Werte: Positive Ganzzahl Standardwert: 5 |
Textklassifizierungs-Hyperparameter
In der folgenden Tabelle sind die Hyperparameter für den von Amazon bereitgestellten Textklassifizierungs-Trainingsalgorithmus aufgeführt SageMaker.
Anmerkung
Auch wenn einige der Parameter in den Textklassifizierungs- und Word2Vec-Modi gängig sind, haben sie möglicherweise je nach Kontext unterschiedliche Bedeutungen.
Name des Parameters | Beschreibung |
---|---|
mode |
Der Schulungsmodus Erforderlich Zulässige Werte: |
buckets |
Die Anzahl der Hash-Buckets für N-Gramm-Wörter. Optional Gültige Werte: Positive Ganzzahl Standardwert: 2000000 |
early_stopping |
Gibt an, ob die Schulung angehalten wird, wenn sich die Validierungsgenauigkeit nach einer Optional Gültige Werte: (Boolescher Wert) Standardwert: |
epochs |
Die maximale Anzahl abgeschlossener Durchläufe durch die Schulungsdaten. Optional Gültige Werte: Positive Ganzzahl Standardwert: 5 |
learning_rate |
Die für Parameteraktualisierungen verwendete Schrittgröße. Optional Gültige Werte: Positive Gleitkommazahl Standardwert: 0.05 |
min_count |
Wörter, die weniger als Optional Gültige Werte: Positive Ganzzahl Standardwert: 5 |
min_epochs |
Die Mindestanzahl der Epochen, die geschult werden sollen, bevor die Logik zum Early-Stopping aufgerufen wird. Optional Gültige Werte: Positive Ganzzahl Standardwert: 5 |
patience |
Die Anzahl der Epochen, die gewartet werden soll, bevor ein Early-Stopping durchgeführt wird, wenn keine Fortschritte hinsichtlich der festgelegten Validierung erfolgen. Nur verwendet, wenn Optional Gültige Werte: Positive Ganzzahl Standardwert: 4 |
vector_dim |
Die Dimension der Einbettungsebene. Optional Gültige Werte: Positive Ganzzahl Standardwert: 100 |
word_ngrams |
Die Anzahl der N-Gramm-Wort-Funktionen, die verwendet werden sollen. Optional Gültige Werte: Positive Ganzzahl Standardwert: 2 |