Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Bildklassifizierungs-Hyperparameter
Hyperparameter sind Parameter, die festgelegt werden, bevor ein Machine-Learning-Modell mit dem Lernen beginnt. Die folgenden Hyperparameter werden vom SageMaker integrierten Bildklassifizierungsalgorithmus von Amazon unterstützt. Informationen Optimieren eines Bildklassifizierungsmodells zum Optimieren von Hyperparametern für die Bildklassifizierung finden Sie unter.
Name des Parameters | Beschreibung |
---|---|
num_classes |
Anzahl der Ausgabeklassen. Dieser Parameter definiert die Dimensionen der Netzwerkausgabe und ist in der Regel auf die Anzahl der Klassen im Datensatz festgelegt. Neben der Mehrklassen-Klassifizierung wird auch die Multi-Label-Klassifizierung unterstützt. Weitere Informationen zur Arbeit mit Multi-Label-Klassifizierung mit erweiterten Manifestdateien finden Sie unter E/A-Schnittstelle für den Bildklassifikationsalgorithmus. Erforderlich Gültige Werte: positive Ganzzahl |
num_training_samples |
Anzahl der Trainingsbeispiele im Eingabedatensatz. Wenn keine Übereinstimmung zwischen diesem Wert und der Anzahl der Beispiele im Trainingssatz gibt, dann ist das Verhalten des Erforderlich Gültige Werte: positive Ganzzahl |
augmentation_type |
Datenaugmentationstyp. Die Eingabebilder können auf verschiedene Weise erweitert werden, wie unten angegeben.
Optional Gültige Werte: Standardwert: keiner |
beta_1 |
Der beta1-Wert für Optional Gültige Werte: Gleitkommazahl. Bereich [0, 1]. Standardwert: 0.9 |
beta_2 |
Der beta2-Wert für Optional Gültige Werte: Gleitkommazahl. Bereich [0, 1]. Standardwert: 0.999 |
checkpoint_frequency |
Zeitraum für das Speichern der Modellparameter (in Anzahl von Epochen). Beachten Sie, dass alle Prüfpunktdateien als Teil der endgültigen Modelldatei „model.tar.gz“ gespeichert und in S3 an den angegebenen Modellspeicherort hochgeladen werden. Dadurch wird die Größe der Modelldatei proportional zur Anzahl der während des Trainings gespeicherten Prüfpunkte erhöht. Optional Gültige Werte: positive Ganzzahl, die nicht größer ist als Standardwert: keiner (speichern Sie den Prüfpunkt in der Epoche mit der besten Validierungsgenauigkeit). |
early_stopping |
Mit Optional Gültige Werte: Standardwert: |
early_stopping_min_epochs |
Die Mindestanzahl der Epochen, die ausgeführt werden müssen, bevor die Logik zum frühzeitigen Beenden aufgerufen werden kann. Sie wird nur verwendet, wenn Optional Gültige Werte: positive Ganzzahl Standardwert: 10 |
early_stopping_patience |
Die Anzahl der abzuwartenden Epochen, bevor das Training endet, wenn keine Verbesserung in der entsprechenden Metrik erzielt wird. Sie wird nur verwendet, wenn Optional Gültige Werte: positive Ganzzahl Standardwert: 5 |
early_stopping_tolerance |
Relative Toleranz zur Messung von Verbesserungen der Genauigkeitsvalidierungsmetrik. Wenn das Verhältnis der Genauigkeitsverbesserung dividiert durch die vorherige beste Genauigkeit kleiner als der Optional Gültige Werte: 0 ≤ Float ≤ 1 Standardwert: 0.0 |
epochs |
Anzahl der Trainingsepochen. Optional Gültige Werte: positive Ganzzahl Standardwert: 30 |
eps |
Die epsilon-Wert für Optional Gültige Werte: Gleitkommazahl. Bereich [0, 1]. Standardwert: 1e-8 |
gamma |
Der gamma-Wert für Optional Gültige Werte: Gleitkommazahl. Bereich [0, 1]. Standardwert: 0.9 |
image_shape |
Die Abmessungen des Eingabebildes, was der Größe der Eingabeschicht des Netzwerks entspricht. Das Format ist definiert als " Beim Training schlägt das Training fehl, wenn ein Eingabebild in einer beliebigen Dimension kleiner als dieser Parameter ist. Wenn ein Bild größer ist, wird ein Teil des Bilds beschnitten, wobei der beschnittene Bereich durch diesen Parameter festgelegt wird. Wenn der Hyperparameter gesetzt Bei der Inferenz wird die Größe der Eingabebilder an die Größe angepasst, Optional Gültige Werte: Zeichenfolge Standardwert: '3.224.224' |
kv_store |
Synchronisierungsmodus der Gewichtungsaktualisierungen während des verteilten Trainings. Die Gewichtungsaktualisierungen können entweder synchron oder asynchron über mehrere Maschinen hinweg aktualisiert werden. Synchrone Aktualisierungen bieten in der Regel eine bessere Genauigkeit als asynchrone Aktualisierungen, können aber langsamer sein. Weitere Informationen finden Sie unter Distributed Training inMXNet. Dieser Parameter gilt nicht für das Einzel-Maschinen-Training.
Optional Gültige Werte: Standardwert: keiner |
learning_rate |
Anfängliche Lernrate. Optional Gültige Werte: Gleitkommazahl. Bereich [0, 1]. Standardwert: 0.1 |
lr_scheduler_factor |
Das Verhältnis zur Reduzierung der Lernrate, verwendet in Verbindung mit dem Optional Gültige Werte: Gleitkommazahl. Bereich [0, 1]. Standardwert: 0.1 |
lr_scheduler_step |
Die Epochen für das Reduzieren der Lernrate. Wie im Optional Gültige Werte: Zeichenfolge Standardwert: keiner |
mini_batch_size |
Die Batch-Größe für das Training. In einer GPU Einstellung für mehrere Geräte GPU verarbeitet jeder Computer Optional Gültige Werte: positive Ganzzahl Standardwert: 32 |
momentum |
Das Moment für Optional Gültige Werte: Gleitkommazahl. Bereich [0, 1]. Standardwert: 0.9 |
multi_label |
Flag für die Multi-Label-Klassifizierung, wobei jedem Beispiel mehrere Bezeichnungen zugewiesen werden können. Durchschnittliche Genauigkeit für alle protokollierten Klassen. Optional Gültige Werte: 0 oder 1 Standardwert: 0 |
num_layers |
Anzahl der Schichten für das Netzwerk. Für Daten mit einer großen Bildgröße (z. B. 224x224 ImageNet) empfehlen wir, die Anzahl der Ebenen aus dem Satz [18, 34, 50, 101, 152, 200] auszuwählen. Für Daten mit einer kleinen Bildgröße (z. B. 28x28CIFAR) empfehlen wir, die Anzahl der Ebenen aus dem Satz [20, 32, 44, 56, 110] auszuwählen. Die Anzahl der Schichten in jedem Satz basiert auf dem ResNet paper. Für Transferlernen definiert die Anzahl der Schichten die Architektur des Basisnetzwerks und kann somit nur aus dem Satz [18, 34, 50, 101, 152, 200] ausgewählt werden. Optional Gültige Werte: positive Ganzzahl in [18, 34, 50, 101, 152, 200] oder [20, 32, 44, 56, 110]. Standardwert: 152 |
optimizer |
Der Optimierer-Typ. Weitere Informationen zu den Parametern für die Optimierer finden Sie MXNet unter. API Optional Gültige Werte: Entweder Standardwert: |
precision_dtype |
Die Genauigkeit der Gewichtungen, die für das Training verwendet werden. Der Algorithmus kann entweder einfache Präzision ( Optional Gültige Werte: Standardwert: |
resize |
Die Anzahl der Pixel auf der kürzesten Seite eines Bilds nach der Größenänderung für das Training. Wenn der Parameter nicht festgelegt ist, werden die Trainingsdaten ohne Änderung der Größe verwendet. Der Parameter sollte größer sein als die Breiten- und die Höhenkomponente von Erforderlich bei Verwendung von Bildinhaltstypen Optional bei Verwendung des Inhaltstyps RecordIO Gültige Werte: positive Ganzzahl Standardwert: keiner |
top_k |
Meldet die Top-K-Genauigkeit während des Trainings. Dieser Parameter muss größer als 1 sein, da die Top-1-Trainingsgenauigkeit dasselbe ist wie die reguläre Trainingsgenauigkeit, die bereits gemeldet wurde. Optional Gültige Werte: positive Ganzzahl größer als 1. Standardwert: keiner |
use_pretrained_model |
Kennzeichen, das angibt, ob ein vortrainiertes Modell für das Training verwendet werden soll. Wenn dieser Wert auf 1 festgelegt ist, wird das vortrainierte Modell mit der entsprechenden Anzahl von Schichten geladen und für das Training verwendet. Nur die obere, vollständig verbundene Schichtwird mit zufälligen Gewichtungen neu initialisiert. Andernfalls wird das Netzwerk von Grund auf neu trainiert. Optional Gültige Werte: 0 oder 1 Standardwert: 0 |
use_weighted_loss |
Flag, das angibt, ob der gewichteten Kreuz-Entropie-Verlust für die Multi-Label-Klassifizierung verwendet werden soll (nur verwendet, wenn Optional Gültige Werte: 0 oder 1 Standardwert: 0 |
weight_decay |
Der Zerfall der Gewichtung des Koeffizienten für Optional Gültige Werte: Gleitkommazahl. Bereich [0, 1]. Standardwert: 0.0001 |