Tunen Sie ein CatBoost Modell - Amazon SageMaker

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Tunen Sie ein CatBoost Modell

Die automatische Modelloptimierung, auch bekannt als Hyperparameteroptimierung, sucht die beste Version eines Modells, indem viele Aufträge ausgeführt werden, die einen Bereich von Hyperparametern in Ihrem Datensatz testen. Die Modelloptimierung konzentriert sich auf die folgenden Hyperparameter:

Anmerkung

Die Lernverlust-Funktion wird automatisch auf der Grundlage der Art der Klassifikationsaufgabe zugewiesen, die durch die Anzahl der eindeutigen Ganzzahlen in der Beschriftungsspalte bestimmt wird. Weitere Informationen finden Sie unter CatBoost Hyperparameter.

  • Eine Lernverlust-Funktion zur Optimierung beim Modelltraining

  • Eine Bewertungsmetrik, die verwendet wird, um die Modellleistung während der Validierung zu bewerten

  • Ein Satz von Hyperparametern und ein Wertebereich für jeden, der bei der automatischen Abstimmung des Modells verwendet werden kann

Die automatische Modelloptimierung durchsucht die ausgewählten Hyperparameter nach der Kombination von Werten, die das Modell ergeben, das die objektive Metrik optimiert.

Anmerkung

Die automatische Modelloptimierung für CatBoost ist nur bei Amazon verfügbar SageMaker SDKs, nicht über die SageMaker Konsole.

Mehr Informationen über die Modelloptimierung finden Sie unter Automatische Modelloptimierung mit SageMaker.

Vom Algorithmus berechnete Bewertungsmetriken CatBoost

Der SageMaker CatBoost Algorithmus berechnet die folgenden Metriken, die für die Modellvalidierung verwendet werden sollen. Die Bewertungsmetrik wird automatisch auf der Grundlage der Art der Klassifizierungsaufgabe zugewiesen, die durch die Anzahl der eindeutigen Ganzzahlen in der Beschriftungspalte bestimmt wird.

Metrikname Beschreibung Optimierungsrichtung Regex-Muster
RMSE Wurzel des mittleren quadratischen Fehlers Minimieren "bestTest = ([0-9\\.]+)"
MAE Mittlerer absoluter Fehler. Minimieren "bestTest = ([0-9\\.]+)"
MedianAbsoluteError Mittlerer absoluter Fehler. Minimieren "bestTest = ([0-9\\.]+)"
R2 R2-Wert Maximieren "bestTest = ([0-9\\.]+)"
Logloss Binärkreuzentropie Maximieren "bestTest = ([0-9\\.]+)"
Precision precision Maximieren "bestTest = ([0-9\\.]+)"
Recall Rückruf Maximieren "bestTest = ([0-9\\.]+)"
F1 F1-Ergebnis Maximieren "bestTest = ([0-9\\.]+)"
AUC AUC-Wert Maximieren "bestTest = ([0-9\\.]+)"
MultiClass Kreuzentropie mit mehreren Klassen Maximieren "bestTest = ([0-9\\.]+)"
Accuracy Richtigkeit Maximieren "bestTest = ([0-9\\.]+)"
BalancedAccuracy ausgewogene Genauigkeit Maximieren "bestTest = ([0-9\\.]+)"

Einstellbare Hyperparameter CatBoost

Optimieren Sie das CatBoost Modell mit den folgenden Hyperparametern. Die Hyperparameter, die den größten Einfluss auf die Optimierung der CatBoost Bewertungsmetriken haben, sind:learning_rate, depthl2_leaf_reg, und. random_strength Eine Liste aller CatBoost Hyperparameter finden Sie unter. CatBoost Hyperparameter

Name des Parameters Parametertyp Empfohlene Bereiche
learning_rate ContinuousParameterRanges MinValue: 0,001, MaxValue: 0,01
depth IntegerParameterRanges MinValue: 4, MaxValue: 10
l2_leaf_reg IntegerParameterRanges MinValue: 2, MaxValue: 10
random_strength ContinuousParameterRanges MinValue: 0, MaxValue: 10