As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Hiperparâmetros LightGBM
A tabela a seguir contém o subconjunto de hiperparâmetros que são necessários ou mais comumente usados para o algoritmo Amazon SageMaker AI LightGBM. Os usuários definem esses parâmetros para facilitar a estimativa dos parâmetros do modelo a partir dos dados. O algoritmo SageMaker AI LightGBM é uma implementação do pacote LightGBM de código aberto.
nota
Os hiperparâmetros padrão são baseados em conjuntos de dados de exemplo no Exemplos de cadernos LightGBM.
Por padrão, o algoritmo SageMaker AI LightGBM escolhe automaticamente uma métrica de avaliação e uma função objetiva com base no tipo de problema de classificação. O algoritmo LightGBM detecta o tipo de problema de classificação com base no número de rótulos em seus dados. Para problemas de regressão, a métrica de avaliação é a raiz do erro quadrático médio e a função objetivo é a perda de L2. Para problemas de classificação binária, a métrica de avaliação e a função objetiva são ambas entropia cruzada binária. Para problemas de classificação multiclasse, a métrica de avaliação é entropia cruzada multiclasse e a função objetivo é softmax. Você pode usar o hiperparâmetro metric
para alterar a métrica de avaliação padrão. Consulte a tabela a seguir para obter mais informações sobre os hiperparâmetros do LightGBM, incluindo descrições, valores válidos e valores padrão.
Nome do parâmetro | Descrição |
---|---|
num_boost_round |
O número máximo de iterações de reforço. Nota: Internamente, o LightGBM constrói árvores Valores válidos: inteiro, intervalo: inteiro positivo. Valor padrão: |
early_stopping_rounds |
O treinamento será interrompido se uma métrica de um ponto de dados de validação não melhorar na última rodada Valores válidos: inteiro. Valor padrão: |
metric |
A métrica de avaliação para os dados de validação. Se
Valores válidos: string, qualquer um dos seguintes: ( Valor padrão: |
learning_rate |
A taxa na qual os pesos do modelo são atualizados depois de analisar cada lote de exemplos de treinamento. Valores válidos: flutuante. Intervalo: ( Valor padrão: |
num_leaves |
O número máximo de folhas em uma árvore. Valores válidos: flutuante. Intervalo: ( Valor padrão: |
feature_fraction |
Um subconjunto de atributos a serem selecionados em cada iteração (árvore). Deve ser menor que 1.0. Valores válidos: flutuante. Intervalo: ( Valor padrão: |
bagging_fraction |
Um subconjunto de atributos semelhantes a Valores válidos: flutuante. Intervalo: ( Valor padrão: |
bagging_freq |
A frequência para realizar o ensacamento. Em cada iteração Valores válidos: inteiro, intervalo: inteiro não negativo. Valor padrão: |
max_depth |
A profundidade máxima de um modelo de árvore. Isso é usado para lidar com o sobreajuste quando a quantidade de dados é pequena. Se Valores válidos: inteiro. Valor padrão: |
min_data_in_leaf |
A quantidade mínima de dados em uma folha. Pode ser usado para lidar com o sobreajuste. Valores válidos: inteiro, intervalo: inteiro não negativo. Valor padrão: |
max_delta_step |
Usado para limitar a produção máxima de folhas de árvores. Se Valores válidos: flutuante. Valor padrão: |
lambda_l1 |
regularização L1. Valores válidos: flutuante, intervalo: flutuante não negativo. Valor padrão: |
lambda_l2 |
regularização L2. Valores válidos: flutuante, intervalo: flutuante não negativo. Valor padrão: |
boosting |
Tipo de reforço Valores válidos: string, qualquer um dos seguintes: ( Valor padrão: |
min_gain_to_split |
O ganho mínimo para realizar uma divisão. Pode ser usado para acelerar o treinamento. Valores válidos: inteiro, flutuante: flutuante não negativo. Valor padrão: |
scale_pos_weight |
O peso dos rótulos com classe positiva. Usado somente para tarefas de classificação binária. Valores válidos: flutuante, intervalo: flutuante positivo Valor padrão: |
tree_learner |
Tipo de aprendiz em árvore. Valores válidos: string, qualquer um dos seguintes: ( Valor padrão: |
feature_fraction_bynode |
Seleciona um subconjunto de atributos aleatórios em cada nó da árvore. Por exemplo, se Valores válidos: inteiro, Intervalo: ( Valor padrão: |
is_unbalance |
Defina como Valores válidos: string, ou: ( Valor padrão: |
max_bin |
O número máximo de buckets usados para armazenar valores de atributos no bucket. Um pequeno número de compartimentos pode reduzir a precisão do treinamento, mas pode aumentar o desempenho geral. Pode ser usado para lidar com o sobreajuste. Valores válidos: inteiro, Intervalo: (1, ∞). Valor padrão: |
tweedie_variance_power |
Controla a variação da distribuição Tweedie. Defina este valor mais próximo a Valores válidos: flutuante. Intervalo: ( Valor padrão: |
num_threads |
Número de threads paralelos usado para executar LightGBM. O valor 0 significa o número padrão de threads no OpenMP. Valores válidos: inteiro, intervalo: inteiro não negativo. Valor padrão: |
verbosity |
A verbosidade das mensagens impressas. Se Valores válidos: inteiro. Valor padrão: |