

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

# Object2Vec-Hyperparameter
<a name="object2vec-hyperparameters"></a>

In der Anforderung `CreateTrainingJob` geben Sie den Trainingsalgorithmus an. Sie können auch algorithmusspezifische Hyperparameter als Maps angeben. string-to-string In der folgenden Tabelle sind die Hyperparameter für den Object2Vec-Trainingsalgorithmus aufgeführt.


| Name des Parameters | Description | 
| --- | --- | 
| enc0\$1max\$1seq\$1len |  Die maximale Squenzlänge für den enc0-Encoder. **Erforderlich** Gültige Werte: 1 ≤ Ganzzahl ≤ 5000  | 
| enc0\$1vocab\$1size |  Die Vokabulargröße von enc0-Token. **Erforderlich** Gültige Werte: 2 ≤ Ganzzahl ≤ 3000000  | 
| bucket\$1width |  Der erlaubte Unterschied zwischen der Datensequenzlänge, wenn Bucketing aktiviert ist. Um das Bucketing zu aktivieren, geben Sie einen Wert ungleich Null für diesen Parameter an. **Optional** Gültige Werte: 0 ≤ Ganzzahl ≤ 100 Standardwert: 0 (kein Bucketing)  | 
| comparator\$1list |  Eine Liste zum Anpassen der Art und Weise, wie zwei Einbettungen verglichen werden. Die Ebene des Object2Vec-Vergleichsoperators nimmt die Kodierungen von beiden Encodern als Eingaben und gibt einen einzelnen Vektor aus. Dieser Vektor ist eine Verkettung von SubVectors. Die Zeichenfolgenwerte, die an die `comparator_list` übergeben werden, sowie die Reihenfolge dieser Übergabe bestimmen, wie diese SubVectors zusammengesetzt werden. Bei `comparator_list="hadamard, concat"` erstellt der Vergleichsoperator beispielsweise den Vektor, indem er das Hadamard-Produkt von zwei Kodierungen und die Verkettung von zwei Kodierungen verkettet. Bei `comparator_list="hadamard"` hingegen erstellt der Vergleichsoperator den Vektor als Hadamard-Produkt von nur zwei Kodierungen.  **Optional** Gültige Werte: Eine Zeichenfolge, die eine beliebige Kombination aus den Namen der drei binären Operatoren enthält: `hadamard`, `concat` oder `abs_diff`. Der Object2Vec-Algorithmus erfordert derzeit, dass die beiden Vektorkodierungen die gleiche Dimension haben. Diese Operatoren erzeugen SubVectors wie folgt: [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/de_de/sagemaker/latest/dg/object2vec-hyperparameters.html) Standardwert: `"hadamard, concat, abs_diff"`  | 
| dropout |  Die Dropout-Wahrscheinlichkeit Netzwerk-Layer. Bei *Dropout* handelt es sich um eine Form der Regularisierung, die in neuronalen Netzwerken verwendet wird und Überanpassung durch Kürzen koabhängiger Neuronen reduziert. **Optional** Gültige Werte: 0,0 ≤ Gleitkommazahl ≤ 1,0 Standardwert: 0.0  | 
| early\$1stopping\$1patience |  Die Anzahl der aufeinanderfolgenden Epochen ohne Verbesserung, die zulässig ist, bevor das frühzeitige Beenden erfolgt. Verbesserung wird durch den Hyperparameter `early_stopping_tolerance` definiert. **Optional** Gültige Werte: 1 ≤ Ganzzahl ≤ 5 Standardwert: 3  | 
| early\$1stopping\$1tolerance |  Die Verringerung in der Verlustfunktion, die ein Algorithmus zwischen aufeinanderfolgenden Epochen erreichen muss, um ein frühes Anhalten zu vermeiden, nachdem die Anzahl der aufeinanderfolgenden im Hyperparameter `early_stopping_patience` festgelegten Epochen abgeschlossen ist. **Optional** Gültige Werte: 0,000001 ≤ Gleitkommazahl ≤ 0,1 Standardwert: 0.01  | 
| enc\$1dim |  Die Dimension der Ausgabe des einbettenden Layers. **Optional** Gültige Werte: 4 ≤ Ganzzahl ≤ 10000 Standardwert: 4096  | 
| enc0\$1network |  Das Netzwerkmodell für den enc0-Encoder. **Optional** Gültige Werte: `hcnn`, `bilstm` oder `pooled_embedding` [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/de_de/sagemaker/latest/dg/object2vec-hyperparameters.html) Standardwert: `hcnn`  | 
| enc0\$1cnn\$1filter\$1width |  Die Filterbreite des Convolutional Neural Network (CNN) enc0-Encoders. **Bedingt** Gültige Werte: 1 ≤ Ganzzahl ≤ 9 Standardwert: 3  | 
| enc0\$1freeze\$1pretrained\$1embedding |  Gibt an, ob mit enc0 vortrainierte Einbettungsgewichtungen eingefroren werden sollen. **Bedingt** Gültige Werte: `True` oder `False`. Standardwert: `True`  | 
| enc0\$1layers  |  Die Anzahl der Layer im enc0-Encoder. **Bedingt** Gültige Werte: `auto` oder 1 ≤ Ganzzahl ≤ 4 [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/de_de/sagemaker/latest/dg/object2vec-hyperparameters.html) Standardwert: `auto`  | 
| enc0\$1pretrained\$1embedding\$1file |  Der Dateiname der vortrainierten enc0-Token-Einbettungsdatei im zusätzlichen Datenkanal. **Bedingt** Gültige Werte: Zeichenfolge mit alphanumerischen Zeichen, Unterstrich oder Punkt. [A-Za-z0-9\$1.\$1\$1]  Standardwert: "" (eine leere Zeichenfolge)  | 
| enc0\$1token\$1embedding\$1dim |  Die Ausgabedimension des einbettenden Layers des enc0-Tokens. **Bedingt** Gültige Werte: 2 ≤ Ganzzahl ≤ 1000 Standardwert: 300  | 
| enc0\$1vocab\$1file |  Die Vokabeldatei für die Zuordnung vortrainierter enc0-Token-Einbettungsvektoren zum numerischen Vokabular. IDs **Bedingt** Gültige Werte: Zeichenfolge mit alphanumerischen Zeichen, Unterstrich oder Punkt. [A-Za-z0-9\$1.\$1\$1]  Standardwert: "" (eine leere Zeichenfolge)  | 
| enc1\$1network |  Das Netzwerkmodell für den enc1-Encoder. Wenn Sie möchten, dass der enc1-Encoder das gleiche Netzwerkmodell wie enc0 verwendet (einschließlich der Hyperparameterwerte), legen Sie den Wert auf `enc0` fest.   Auch wenn die enc0- und enc1-Encoder-Netzwerke symmetrische Architekturen haben, können Sie Parameterwerte für diese Netzwerke nicht gemeinsam nutzen.  **Optional** Gültige Werte: `enc0`, `hcnn`, `bilstm` oder `pooled_embedding` [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/de_de/sagemaker/latest/dg/object2vec-hyperparameters.html) Standardwert: `enc0`  | 
| enc1\$1cnn\$1filter\$1width |  Die Filterbreite des CNN enc1-Encoders. **Bedingt** Gültige Werte: 1 ≤ Ganzzahl ≤ 9 Standardwert: 3  | 
| enc1\$1freeze\$1pretrained\$1embedding |  Gibt an, ob mit enc1 vortrainierte Einbettungsgewichtungen eingefroren werden sollen. **Bedingt** Gültige Werte: `True` oder `False`. Standardwert: `True`  | 
| enc1\$1layers  |  Die Anzahl der Layer im enc1-Encoder. **Bedingt** Gültige Werte: `auto` oder 1 ≤ Ganzzahl ≤ 4 [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/de_de/sagemaker/latest/dg/object2vec-hyperparameters.html) Standardwert: `auto`  | 
| enc1\$1max\$1seq\$1len |  Die maximale Squenzlänge für den enc1-Encoder. **Bedingt** Gültige Werte: 1 ≤ Ganzzahl ≤ 5000  | 
| enc1\$1pretrained\$1embedding\$1file |  Der Dateiname der vortrainierten enc1-Token-Einbettungsdatei im zusätzlichen Datenkanal. **Bedingt** Gültige Werte: Zeichenfolge mit alphanumerischen Zeichen, Unterstrich oder Punkt. [A-Za-z0-9\$1.\$1\$1]  Standardwert: "" (eine leere Zeichenfolge)  | 
| enc1\$1token\$1embedding\$1dim |  Die Ausgabedimension des einbettenden Layers des enc1-Tokens. **Bedingt** Gültige Werte: 2 ≤ Ganzzahl ≤ 1000 Standardwert: 300  | 
| enc1\$1vocab\$1file |  Die Vokabeldatei für die Zuordnung vortrainierter enc1-Token-Einbettungen zu Vokabeln. IDs **Bedingt** Gültige Werte: Zeichenfolge mit alphanumerischen Zeichen, Unterstrich oder Punkt. [A-Za-z0-9\$1.\$1\$1]  Standardwert: "" (eine leere Zeichenfolge)  | 
| enc1\$1vocab\$1size |  Die Vokabulargröße von enc0-Token. **Bedingt** Gültige Werte: 2 ≤ Ganzzahl ≤ 3000000  | 
| epochs |  Die Anzahl der für das Training auszuführenden Epochen.  **Optional** Gültige Werte: 1 ≤ Ganzzahl ≤ 100 Standardwert: 30  | 
| learning\$1rate |  Die Lernrate für das Training. **Optional** Gültige Werte: 1.0E-6 ≤ Gleitkommazahl ≤ 1,0 Standardwert: 0.0004  | 
| mini\$1batch\$1size |  Die Stapelgröße, in die der Datensatz für einen `optimizer` während des Trainings aufgeteilt wird. **Optional** Gültige Werte: 1 ≤ Ganzzahl ≤ 10000 Standardwert: 32  | 
| mlp\$1activation |  Der Typ der Aktivierungsfunktion für das Multi-Layer-Perceptron (MLP)-Layer. **Optional** Gültige Werte: `tanh`, `relu` oder `linear` [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/de_de/sagemaker/latest/dg/object2vec-hyperparameters.html) Standardwert: `linear`  | 
| mlp\$1dim |  Die Dimension der Ausgabe von MLP-Layern. **Optional** Gültige Werte: 2 ≤ Ganzzahl ≤ 10000 Standardwert: 512  | 
| mlp\$1layers |  Die Anzahl der MLP-Layer im Netzwerk. **Optional** Gültige Werte: 0 ≤ Ganzzahl ≤ 10 Standardwert: 2  | 
| negative\$1sampling\$1rate |  Das Verhältnis der negativen Stichproben, die generiert wurden, um das Training des Algorithmus zu unterstützen, zu den positiven Stichproben, die von Benutzern bereitgestellt werden. Negative Stichproben stehen für Daten, die in Wirklichkeit wahrscheinlich nicht eintreten, und für das Training negativ gekennzeichnet sind. Sie erleichtern das Training eines Modells, um zwischen den beobachteten positiven Stichproben und den nicht beobachteten negativen Stichproben zu unterscheiden. Um das Verhältnis von negativen zu positiven Stichproben zur Verwendung im Training anzugeben, legen Sie den Wert auf eine positive Ganzzahl fest. Wenn Sie beispielsweise den Algorithmus auf Eingabedaten trainieren, in denen alle Stichproben positiv sind und `negative_sampling_rate` auf 2 festgelegt ist, erzeugt der Object2Vec-Algorithmus intern zwei negative Stichproben pro positiver Stichprobe. Wenn Sie beim Training keine negativen Stichproben generieren oder verwenden möchten, legen Sie den Wert auf 0 fest.  **Optional** Gültige Werte: 0 ≤ Ganzzahl Standardwert: 0 (aus)  | 
| num\$1classes |  Die Anzahl der Klassen für das Klassifizierungstraining. Amazon SageMaker AI ignoriert diesen Hyperparameter bei Regressionsproblemen. **Optional** Gültige Werte: 2 ≤ Ganzzahl ≤ 30 Standardwert: 2  | 
| optimizer |  Der Optimierer-Typ. **Optional** Gültige Werte: `adadelta`, `adagrad`, `adam`, `sgd` oder `rmsprop`. [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/de_de/sagemaker/latest/dg/object2vec-hyperparameters.html) Standardwert: `adam`  | 
| output\$1layer |  Der Typ des Ausgabe-Layers, in dem Sie angeben, dass es sich bei der Aufgabe um eine Regression oder Klassifikation handelt. **Optional** Gültige Werte: `softmax` oder `mean_squared_error`. [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/de_de/sagemaker/latest/dg/object2vec-hyperparameters.html) Standardwert: `softmax`  | 
| tied\$1token\$1embedding\$1weight |  Ob eine gemeinsame Einbettungsebene für beide Encoder verwendet werden soll. Wenn die Eingabewerte für beide Encoder die gleichen Einheiten auf Token-Ebene verwenden, verwenden Sie eine gemeinsame Token-Einbettungsebene. Wenn z. B. für eine Sammlung von Dokumenten ein Encoder Sätze und ein anderer ganze Dokumente kodiert, können Sie eine gemeinsame Token-Einbettungsebene verwenden. Dies liegt daran, dass sowohl Sätze als auch Dokumente aus Wort-Token desselben Vokabulars bestehen. **Optional** Gültige Werte: `True` oder `False`. Standardwert: `False`  | 
| token\$1embedding\$1storage\$1type |  Der während des Trainings verwendete Modus der Gradientenaktualisierung: Bei Verwendung des Modus `dense` berechnet der Optimierer die vollständige Gradientenmatrix für die Token-Einbettungsebene selbst dann, wenn die meisten Zeilen des Gradienten den Wert 0 haben. Wenn der Modus `sparse` verwendet wird, speichert der Optimierer nur Zeilen des Gradienten, die im Mini-Stapel tatsächlich genutzt werden. Wenn Sie möchten, dass der Algorithmus träge Gradientaktualisierungen durchführt, bei denen die Gradienten nur in Nicht-Null-Zeilen berechnet werden, was das Training beschleunigt, geben Sie `row_sparse` an. Wenn der Wert auf `row_sparse` festgelegt ist, werden die für andere Hyperparameter verfügbaren Werte wie folgt eingeschränkt:  [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/de_de/sagemaker/latest/dg/object2vec-hyperparameters.html) **Optional** Gültige Werte: `dense` oder `row_sparse`. Standardwert: `dense`  | 
| weight\$1decay |  Der Weight-Decay-Parameter, der zur Optimierung verwendet wird. **Optional** Gültige Werte: 0 ≤ Gleitkommazahl ≤ 10000 Standardwert: 0 (kein Verfall)  | 