Hyperparameter zur Modellanpassung von Anthropic Claude 3 - Amazon Bedrock

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Hyperparameter zur Modellanpassung von Anthropic Claude 3

Die Modelle von Anthropic Claude 3 unterstützen die folgenden Hyperparameter für die Modellanpassung:

Name der Konsole API-Name Definition Standard Minimum Maximum
Anzahl der Epochen epochCount Die maximale Anzahl von Iterationen im gesamten Trainingsdatensatz 2 1 10
Batch-Größe batchSize Anzahl der Stichproben, die vor der Aktualisierung der Modellparameter verarbeitet wurden 32 4 256
Multiplikator für die Lernrate learningRateMultiplier Multiplikator, der die Lernrate beeinflusst, mit der Modellparameter nach jeder Charge aktualisiert werden 1 0.1 2
Schwellenwert für frühes Abbrechen earlyStoppingThreshold Minimale Verbesserung des Validierungsverlusts erforderlich, um ein vorzeitiges Abbrechen des Schulungsprozesses zu verhindern 0.001 0 0.1
Frühzeitiges Aufhören der Geduld earlyStoppingPatience Toleranz gegenüber Stagnation bei der Metrik zum Verlust der Validierung, bevor der Trainingsprozess beendet wird 2 1 10