Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
GBMHyperparameter für Licht
Die folgende Tabelle enthält die Teilmenge der Hyperparameter, die für den Amazon SageMaker GBM Light-Algorithmus erforderlich sind oder am häufigsten verwendet werden. Dies sind Parameter, die von Benutzern festgelegt werden, um die Schätzung der Modellparameter aus Daten zu erleichtern. Der SageMaker GBM Light-Algorithmus ist eine Implementierung des Open-Source-Light-Pakets. GBM
Anmerkung
Die Standard-Hyperparameter basieren auf Beispieldatensätzen in der Leichte GBM Musternotizbücher.
Standardmäßig wählt der SageMaker GBM Light-Algorithmus automatisch eine Bewertungsmetrik und eine Zielfunktion aus, die auf der Art des Klassifizierungsproblems basieren. Der GBM Light-Algorithmus erkennt die Art des Klassifizierungsproblems anhand der Anzahl der Labels in Ihren Daten. Bei Regressionsproblemen ist die Bewertungsmetrik der quadratische Mittelwert des Fehlers und die Zielfunktion der L2-Verlust. Bei binären Klassifikationsproblemen entsprechen die Bewertungsmetrik und die Zielfunktion beide der binären Kreuzentropie. Bei Klassifikationsproblemen mit mehreren Klassen ist die Bewertungsmetrik die Mehrklassen-Kreuzentropie und die Zielfunktion Softmax. Sie können den metric
Hyperparameter verwenden, um die Standard-Bewertungsmetrik zu ändern. In der folgenden Tabelle finden Sie weitere Informationen zu GBM Light-Hyperparametern, einschließlich Beschreibungen, gültiger Werte und Standardwerte.
Name des Parameters | Beschreibung |
---|---|
num_boost_round |
Die maximale Anzahl von Booster-Iterationen. Hinweis: Intern GBM erstellt Light Gültige Werte: Ganzzahl, Bereich: Positive Ganzzahl. Standardwert: |
early_stopping_rounds |
Das Training wird beendet, wenn sich eine Metrik eines Validierungsdatenpunkts in der letzten Gültige Werte: Ganzzahl. Standardwert: |
metric |
Evaluationsmetriken für die Datenvalidierung. Wenn
Gültige Werte: String, einer der folgenden Werte: ( Standardwert: |
learning_rate |
Die Geschwindigkeit, mit der die Modellgewichte aktualisiert werden, nachdem die einzelnen Trainingssbeispiele durchgearbeitet wurden. Gültige Werte: Float, Bereich: ( Standardwert: |
num_leaves |
Die maximale Anzahl von Blättern in einem Baum. Gültige Werte: Ganzzahl, Bereich: ( Standardwert: |
feature_fraction |
Eine Teilmenge von Features, die bei jeder Iteration ausgewählt werden müssen (Baum). Muss kleiner als 1.0 sein. Gültige Werte: Float, Bereich: ( Standardwert: |
bagging_fraction |
Eine Teilmenge von Features, die einem Teil der Daten ähnlich sind zu Gültige Werte: Float, Bereich: ( Standardwert: |
bagging_freq |
Die Häufigkeit, mit der das Einpacken durchgeführt wird. Bei jeder Gültige Werte: Ganzzahl, Bereich: Nicht-negative ganze Zahl. Standardwert: |
max_depth |
Die maximale Tiefe eines Baummodells. Dies wird verwendet, um Überanpassungen zu vermeiden, wenn die Datenmenge klein ist. Wenn Gültige Werte: Ganzzahl. Standardwert: |
min_data_in_leaf |
Die minimale Datenmenge in einem Blatt. Kann für Überanpassungen verwendet werden. Gültige Werte: Ganzzahl, Bereich: Nicht-negative ganze Zahl. Standardwert: |
max_delta_step |
Wird verwendet, um die maximale Leistung von Baumblättern zu begrenzen. Wenn Gültige Werte: Gleitkommazahl. Standardwert: |
lambda_l1 |
L1-Regularisation. Gültige Werte: Float, Bereich: Nicht-negativer Float. Standardwert: |
lambda_l2 |
L2-Regularisation. Gültige Werte: Float, Bereich: Nicht-negativer Float. Standardwert: |
boosting |
Boosting-Typ Gültige Werte: String, einer der folgenden Werte: ( Standardwert: |
min_gain_to_split |
Die Mindestverstärkung für die Durchführung einer Teilung. Kann verwendet werden, um das Training zu beschleunigen. Gültige Werte: Ganzzahl, Float: Nicht-negativer Float. Standardwert: |
scale_pos_weight |
Das Gewicht der Etiketten mit positiver Klasse. Wird nur für binäre Klassifikationsaufgaben verwendet. Gültige Werte: Float, Bereich: Positiver Float. Standardwert: |
tree_learner |
Baumschüler-Typ. Gültige Werte: String, einer der folgenden Werte: ( Standardwert: |
feature_fraction_bynode |
Wählt eine Teilmenge zufälliger Features auf jedem Baumknoten aus. Ist beispielsweise Gültige Werte: Ganzzahl, Bereich: ( Standardwert: |
is_unbalance |
Wird auf Gültige Werte: String, entweder: ( Standardwert: |
max_bin |
Die maximale Anzahl von Bins, die verwendet werden, um Feature-Werte zusammenzufassen. Eine geringe Anzahl von Bins kann die Trainingsgenauigkeit verringern, aber die allgemeine Leistung erhöhen. Kann für Überanpassungen verwendet werden. Gültige Werte: Ganzzahl, Bereich: (1, ∞). Standardwert: |
tweedie_variance_power |
Steuert die Varianz der Tweedie-Verteilung. Stellen Sie dies näher an Gültige Werte: Float, Bereich: [ Standardwert: |
num_threads |
Anzahl der parallel Threads, die zum Ausführen von Light verwendet wurdenGBM. Der Wert 0 bedeutet die Standardanzahl von Threads in OpenMP. Gültige Werte: Ganzzahl, Bereich: Nicht-negative ganze Zahl. Standardwert: |
verbosity |
Die Ausführlichkeit von Drucknachrichten. Ist Gültige Werte: Ganzzahl Standardwert: |