Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Object2Vec-Hyperparameter
In der Anforderung CreateTrainingJob
geben Sie den Trainingsalgorithmus an. Sie können auch algorithmusspezifische Hyperparameter als Maps angeben. string-to-string In der folgenden Tabelle sind die Hyperparameter für den Object2Vec-Trainingsalgorithmus aufgeführt.
Name des Parameters | Beschreibung |
---|---|
enc0_max_seq_len |
Die maximale Squenzlänge für den enc0-Encoder. Erforderlich Gültige Werte: 1 ≤ Ganzzahl ≤ 5000 |
enc0_vocab_size |
Die Vokabulargröße von enc0-Token. Erforderlich Gültige Werte: 2 ≤ Ganzzahl ≤ 3000000 |
bucket_width |
Der erlaubte Unterschied zwischen der Datensequenzlänge, wenn Bucketing aktiviert ist. Um das Bucketing zu aktivieren, geben Sie einen Wert ungleich Null für diesen Parameter an. Optional Gültige Werte: 0 ≤ Ganzzahl ≤ 100 Standardwert: 0 (kein Bucketing) |
comparator_list |
Eine Liste zum Anpassen der Art und Weise, wie zwei Einbettungen verglichen werden. Die Ebene des Object2Vec-Vergleichsoperators nimmt die Kodierungen von beiden Encodern als Eingaben und gibt einen einzelnen Vektor aus. Dieser Vektor ist eine Verkettung von SubVectors. Die Zeichenfolgenwerte, die an die Optional Gültige Werte: Eine Zeichenfolge, die eine beliebige Kombination aus den Namen der drei binären Operatoren enthält:
Standardwert: |
dropout |
Die Dropout-Wahrscheinlichkeit Netzwerk-Layer. Bei Dropout handelt es sich um eine Form der Regularisierung, die in neuronalen Netzwerken verwendet wird und Überanpassung durch Kürzen koabhängiger Neuronen reduziert. Optional Gültige Werte: 0,0 ≤ Gleitkommazahl ≤ 1,0 Standardwert: 0.0 |
early_stopping_patience |
Die Anzahl der aufeinanderfolgenden Epochen ohne Verbesserung, die zulässig ist, bevor das frühzeitige Beenden erfolgt. Verbesserung wird durch den Hyperparameter Optional Gültige Werte: 1 ≤ Ganzzahl ≤ 5 Standardwert: 3 |
early_stopping_tolerance |
Die Verringerung in der Verlustfunktion, die ein Algorithmus zwischen aufeinanderfolgenden Epochen erreichen muss, um ein frühes Anhalten zu vermeiden, nachdem die Anzahl der aufeinanderfolgenden im Hyperparameter Optional Gültige Werte: 0,000001 ≤ Gleitkommazahl ≤ 0,1 Standardwert: 0.01 |
enc_dim |
Die Dimension der Ausgabe des einbettenden Layers. Optional Gültige Werte: 4 ≤ Ganzzahl ≤ 10000 Standardwert: 4096 |
enc0_network |
Das Netzwerkmodell für den enc0-Encoder. Optional Gültige Werte:
Standardwert: |
enc0_cnn_filter_width |
Die Filterbreite des Enc0-Encoders für das Convolutional Neural Network (). CNN Bedingt Gültige Werte: 1 ≤ Ganzzahl ≤ 9 Standardwert: 3 |
enc0_freeze_pretrained_embedding |
Gibt an, ob mit enc0 vortrainierte Einbettungsgewichtungen eingefroren werden sollen. Bedingt Gültige Werte: Standardwert: |
enc0_layers |
Die Anzahl der Layer im enc0-Encoder. Bedingt Gültige Werte:
Standardwert: |
enc0_pretrained_embedding_file |
Der Dateiname der vortrainierten enc0-Token-Einbettungsdatei im zusätzlichen Datenkanal. Bedingt Gültige Werte: Zeichenfolge mit alphanumerischen Zeichen, Unterstrich oder Punkt. [A-Za-z0-9\.\_] Standardwert: "" (eine leere Zeichenfolge) |
enc0_token_embedding_dim |
Die Ausgabedimension des einbettenden Layers des enc0-Tokens. Bedingt Gültige Werte: 2 ≤ Ganzzahl ≤ 1000 Standardwert: 300 |
enc0_vocab_file |
Die Vokabeldatei für die Zuordnung von vortrainierten enc0-Token-Einbettungsvektoren zum numerischen Vokabular. IDs Bedingt Gültige Werte: Zeichenfolge mit alphanumerischen Zeichen, Unterstrich oder Punkt. [A-Za-z0-9\.\_] Standardwert: "" (eine leere Zeichenfolge) |
enc1_network |
Das Netzwerkmodell für den enc1-Encoder. Wenn Sie möchten, dass der enc1-Encoder das gleiche Netzwerkmodell wie enc0 verwendet (einschließlich der Hyperparameterwerte), legen Sie den Wert auf AnmerkungAuch wenn die enc0- und enc1-Encoder-Netzwerke symmetrische Architekturen haben, können Sie Parameterwerte für diese Netzwerke nicht gemeinsam nutzen. Optional Gültige Werte:
Standardwert: |
enc1_cnn_filter_width |
Die Filterbreite des CNN Enc1-Encoders. Bedingt Gültige Werte: 1 ≤ Ganzzahl ≤ 9 Standardwert: 3 |
enc1_freeze_pretrained_embedding |
Gibt an, ob mit enc1 vortrainierte Einbettungsgewichtungen eingefroren werden sollen. Bedingt Gültige Werte: Standardwert: |
enc1_layers |
Die Anzahl der Layer im enc1-Encoder. Bedingt Gültige Werte:
Standardwert: |
enc1_max_seq_len |
Die maximale Squenzlänge für den enc1-Encoder. Bedingt Gültige Werte: 1 ≤ Ganzzahl ≤ 5000 |
enc1_pretrained_embedding_file |
Der Dateiname der vortrainierten enc1-Token-Einbettungsdatei im zusätzlichen Datenkanal. Bedingt Gültige Werte: Zeichenfolge mit alphanumerischen Zeichen, Unterstrich oder Punkt. [A-Za-z0-9\.\_] Standardwert: "" (eine leere Zeichenfolge) |
enc1_token_embedding_dim |
Die Ausgabedimension des einbettenden Layers des enc1-Tokens. Bedingt Gültige Werte: 2 ≤ Ganzzahl ≤ 1000 Standardwert: 300 |
enc1_vocab_file |
Die Vokabeldatei für die Zuordnung vortrainierter enc1-Token-Einbettungen zum Vokabular. IDs Bedingt Gültige Werte: Zeichenfolge mit alphanumerischen Zeichen, Unterstrich oder Punkt. [A-Za-z0-9\.\_] Standardwert: "" (eine leere Zeichenfolge) |
enc1_vocab_size |
Die Vokabulargröße von enc0-Token. Bedingt Gültige Werte: 2 ≤ Ganzzahl ≤ 3000000 |
epochs |
Die Anzahl der für das Training auszuführenden Epochen. Optional Gültige Werte: 1 ≤ Ganzzahl ≤ 100 Standardwert: 30 |
learning_rate |
Die Lernrate für das Training. Optional Gültige Werte: 1.0E-6 ≤ Gleitkommazahl ≤ 1,0 Standardwert: 0.0004 |
mini_batch_size |
Die Stapelgröße, in die der Datensatz für einen Optional Gültige Werte: 1 ≤ Ganzzahl ≤ 10000 Standardwert: 32 |
mlp_activation |
Die Art der Aktivierungsfunktion für die mehrschichtige Perzeptron () -Schicht. MLP Optional Gültige Werte:
Standardwert: |
mlp_dim |
Die Dimension der Ausgabe von MLP Schichten. Optional Gültige Werte: 2 ≤ Ganzzahl ≤ 10000 Standardwert: 512 |
mlp_layers |
Die Anzahl der MLP Schichten im Netzwerk. Optional Gültige Werte: 0 ≤ Ganzzahl ≤ 10 Standardwert: 2 |
negative_sampling_rate |
Das Verhältnis der negativen Stichproben, die generiert wurden, um das Training des Algorithmus zu unterstützen, zu den positiven Stichproben, die von Benutzern bereitgestellt werden. Negative Stichproben stehen für Daten, die in Wirklichkeit wahrscheinlich nicht eintreten, und für das Training negativ gekennzeichnet sind. Sie erleichtern das Training eines Modells, um zwischen den beobachteten positiven Stichproben und den nicht beobachteten negativen Stichproben zu unterscheiden. Um das Verhältnis von negativen zu positiven Stichproben zur Verwendung im Training anzugeben, legen Sie den Wert auf eine positive Ganzzahl fest. Wenn Sie beispielsweise den Algorithmus auf Eingabedaten trainieren, in denen alle Stichproben positiv sind und Optional Gültige Werte: 0 ≤ Ganzzahl Standardwert: 0 (aus) |
num_classes |
Die Anzahl der Klassen für das Klassifizierungstraining. Amazon SageMaker AI ignoriert diesen Hyperparameter bei Regressionsproblemen. Optional Gültige Werte: 2 ≤ Ganzzahl ≤ 30 Standardwert: 2 |
optimizer |
Der Optimierer-Typ. Optional Gültige Werte: Standardwert: |
output_layer |
Der Typ des Ausgabe-Layers, in dem Sie angeben, dass es sich bei der Aufgabe um eine Regression oder Klassifikation handelt. Optional Gültige Werte:
Standardwert: |
tied_token_embedding_weight |
Ob eine gemeinsame Einbettungsebene für beide Encoder verwendet werden soll. Wenn die Eingabewerte für beide Encoder die gleichen Einheiten auf Token-Ebene verwenden, verwenden Sie eine gemeinsame Token-Einbettungsebene. Wenn z. B. für eine Sammlung von Dokumenten ein Encoder Sätze und ein anderer ganze Dokumente kodiert, können Sie eine gemeinsame Token-Einbettungsebene verwenden. Dies liegt daran, dass sowohl Sätze als auch Dokumente aus Wort-Token desselben Vokabulars bestehen. Optional Gültige Werte: Standardwert: |
token_embedding_storage_type |
Der während des Trainings verwendete Modus der Gradientenaktualisierung: Bei Verwendung des Modus
Optional Gültige Werte: Standardwert: |
weight_decay |
Der Weight-Decay-Parameter, der zur Optimierung verwendet wird. Optional Gültige Werte: 0 ≤ Gleitkommazahl ≤ 10000 Standardwert: 0 (kein Verfall) |