Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Hyperparameter zur Modellanpassung von Anthropic Claude 3
Modelle von Anthropic Claude 3 unterstützen die folgenden Hyperparameter für die Modellanpassung:
Name der Konsole | API-Name | Definition | Standard | Minimum | Maximum |
---|---|---|---|---|---|
Anzahl der Epochen | epochCount | Die maximale Anzahl von Iterationen im gesamten Trainingsdatensatz | 2 | 1 | 10 |
Batch-Größe | batchSize | Anzahl der Stichproben, die vor der Aktualisierung der Modellparameter verarbeitet wurden | 32 | 4 | 256 |
Multiplikator für die Lernrate | learningRateMultiplier | Multiplikator, der die Lernrate beeinflusst, mit der Modellparameter nach jeder Charge aktualisiert werden | 1 | 0.1 | 2 |
Schwellenwert für frühes Abbrechen | earlyStoppingThreshold | Minimale Verbesserung des Validierungsverlusts erforderlich, um ein vorzeitiges Abbrechen des Schulungsprozesses zu verhindern | 0.001 | 0 | 0.1 |
Frühzeitiges Aufhören der Geduld | earlyStoppingPatience | Toleranz gegenüber Stagnation bei der Metrik zum Verlust der Validierung, bevor der Trainingsprozess beendet wird | 2 | 1 | 10 |