Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
GBMHyperparamètres de la lumière
Le tableau suivant contient le sous-ensemble des hyperparamètres requis ou les plus couramment utilisés pour l'algorithme Amazon SageMaker LightGBM. Les utilisateurs définissent ces paramètres pour faciliter l'estimation des paramètres du modèle à partir des données. L'GBMalgorithme SageMaker Light est une implémentation du GBM package open source Light
Note
Les hyperparamètres par défaut sont basés sur des exemples de jeux de données dans le Carnets GBM d'échantillons légers.
Par défaut, l'GBMalgorithme SageMaker Light choisit automatiquement une métrique d'évaluation et une fonction objective en fonction du type de problème de classification. L'GBMalgorithme Light détecte le type de problème de classification en fonction du nombre d'étiquettes présentes dans vos données. Pour les problèmes de régression, la métrique d'évaluation correspond à la racine carrée de l'erreur quadratique moyenne et la fonction objective correspond à la perte L2. Pour les problèmes de classification binaire, la métrique d'évaluation et la fonction objective correspondent toutes deux à l'entropie croisée binaire. Pour les problèmes de classification multi-classes, la métrique d'évaluation correspond à l'entropie croisée multi-classes et la fonction objective à softmax. Vous pouvez utiliser l'hyperparamètre metric
pour modifier la métrique d'évaluation par défaut. Reportez-vous au tableau suivant pour plus d'informations sur les GBM hyperparamètres Light, notamment les descriptions, les valeurs valides et les valeurs par défaut.
Nom du paramètre | Description |
---|---|
num_boost_round |
Nombre maximal d'itérations de renforcement. Remarque : En interne, Light GBM construit des Valeurs valides : nombre entier, plage : nombre entier positif. Valeur par défaut : |
early_stopping_rounds |
L'entraînement s'arrête si une métrique d'un point de données de validation ne s'améliore pas au cours du dernier cycle Valeurs valides : entier Valeur par défaut : |
metric |
Métrique d'évaluation des données de validation. Si
Valeurs valides : chaîne, l'une des valeurs suivantes : ( Valeur par défaut : |
learning_rate |
Taux auquel les pondérations du modèle sont mises à jour après que chaque lot d'exemples d'entraînement a été parcouru. Valeurs valides : float, plage : ( Valeur par défaut : |
num_leaves |
Nombre maximal de feuilles dans un arbre. Valeurs valides : entier, plage : ( Valeur par défaut : |
feature_fraction |
Sous-ensemble de caractéristiques à sélectionner à chaque itération (arbre). Il doit être inférieur à 1,0. Valeurs valides : float, plage : ( Valeur par défaut : |
bagging_fraction |
Sous-ensemble de caractéristiques similaires à Valeurs valides : valeur à virgule flottante, plage : ( Valeur par défaut : |
bagging_freq |
Fréquence de bagging. À chaque Valeurs valides : nombre, plage : nombre entier non négatif. Valeur par défaut : |
max_depth |
Profondeur maximale pour un modèle d'arbre. Elle est utilisée pour traiter le surajustement lorsque la quantité de données est faible. Si Valeurs valides : entier Valeur par défaut : |
min_data_in_leaf |
Quantité minimale de données dans une feuille. Peut être utilisée pour traiter le surajustement. Valeurs valides : nombre, plage : nombre entier non négatif. Valeur par défaut : |
max_delta_step |
Utilisé pour limiter le nombre maximal de feuilles d'arborescence obtenues en sortie. Si Valeurs valides : valeur flottante. Valeur par défaut : |
lambda_l1 |
Régularisation L1. Valeurs valides : valeur à virgule flottante, plage : valeur à virgule flottante non négative. Valeur par défaut : |
lambda_l2 |
Régularisation L2. Valeurs valides : valeur à virgule flottante, plage : valeur à virgule flottante non négative. Valeur par défaut : |
boosting |
Type de renforcement Valeurs valides : chaîne, l'une des valeurs suivantes : ( Valeur par défaut : |
min_gain_to_split |
Gain minimal pour effectuer une division. Peut être utilisé pour accélérer l'entraînement. Valeurs valides : entier, valeur à virgule flottante : valeur à virgule flottante non négative. Valeur par défaut : |
scale_pos_weight |
Pondération des étiquettes avec une classe positive. Utilisé uniquement pour les tâches de classification binaire. Valeurs valides : valeur à virgule flottante, plage : valeur à virgule flottante positive. Valeur par défaut : |
tree_learner |
Type d'apprenant d'arborescence. Valeurs valides : chaîne, l'une des valeurs suivantes : ( Valeur par défaut : |
feature_fraction_bynode |
Sélectionne un sous-ensemble de caractéristiques aléatoires sur chaque nœud de l'arborescence. Par exemple, si Valeurs valides : entier, plage : ( Valeur par défaut : |
is_unbalance |
Définissez sur Valeurs valides : chaîne, valeur : ( Valeur par défaut : |
max_bin |
Nombre maximal de casiers utilisés pour regrouper les valeurs des caractéristiques. Un petit nombre de casiers peut réduire la précision de l'entraînement, mais peut améliorer les performances générales. Peut être utilisée pour traiter le surajustement. Valeurs valides : entier, plage : (1, ∞). Valeur par défaut : |
tweedie_variance_power |
Contrôle la variance de la distribution Tweedie. Définissez-le plus près de Valeurs valides : valeur à virgule flottante, plage : [ Valeur par défaut : |
num_threads |
Nombre de threads parallèles utilisés pour exécuter LightGBM. La valeur 0 signifie le nombre de threads par défaut dans OpenMP. Valeurs valides : nombre, plage : nombre entier non négatif. Valeur par défaut : |
verbosity |
Niveau de détail des messages d'impression. Si Valeurs valides : entier Valeur par défaut : |