Ajuste um XGBoost modelo - Amazon SageMaker

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Ajuste um XGBoost modelo

O ajuste automático de modelos, também conhecido como ajuste de hiperparâmetros, localiza a melhor versão de um modelo executando vários trabalhos que testam uma série de hiperparâmetros no seu conjunto de dados de treinamento e validação. Você escolhe três tipos de hiperparâmetros:

  • uma função de objective de aprendizado para otimizar durante o treinamento de modelo

  • uma eval_metric para usar para avaliar a performance do modelo durante a validação

  • um conjunto de hiperparâmetros e um intervalo de valores para cada para usar ao ajustar o modelo automaticamente

Você escolhe a métrica de avaliação do conjunto de métricas de avaliação que o algoritmo calcula. O ajuste de modelo automático pesquisa os hiperparâmetros escolhidos para encontrar a combinação de valores que resultam no modelo que otimiza a métrica de avaliação.

nota

O ajuste automático do modelo para XGBoost 0,90 só está disponível na Amazon SageMaker SDKs, não no SageMaker console.

Para mais informações sobre o ajuste de modelos, consulte Ajuste automático do modelo com SageMaker.

Métricas de avaliação calculadas pelo algoritmo XGBoost

O XGBoost algoritmo calcula as seguintes métricas para usar na validação do modelo. Ao ajustar o modelo, escolha uma destas métricas para avaliar o modelo. Para obter uma lista completa de eval_metric valores válidos, consulte Parâmetros da tarefa de XGBoost aprendizagem

Nome da métrica Descrição Direção de otimização
validation:accuracy

Taxa de classificação, calculada como #(right)/#(all cases).

Maximizar

validation:auc

Área sob a curva.

Maximizar

validation:error

Taxa de erro de classificação binária, calculada como #(casos errados)/#(todos os casos).

Minimizar

validation:f1

Indicador de precisão de classificação, calculado como a média harmônica de precisão e recall.

Maximizar

validation:logloss

Verossimilhança de log negativa.

Minimizar

validation:mae

Erro absoluto médio.

Minimizar

validation:map

Precisão média da média.

Maximizar

validation:merror

Taxa de erro de classificação multiclasse, calculada como #(casos errados)/#(todos os casos).

Minimizar

validation:mlogloss

Verossimilhança de log negativa para classificação multiclasse.

Minimizar

validation:mse

Erro quadrático médio.

Minimizar

validation:ndcg

Ganho cumulativo descontado normalizado.

Maximizar

validation:rmse

Erro quadrático médio da raiz

Minimizar

Hiperparâmetros ajustáveis XGBoost

Ajuste o XGBoost modelo com os seguintes hiperparâmetros. Os hiperparâmetros que têm o maior efeito na otimização das métricas de XGBoost avaliação são:alpha,min_child_weight, subsampleeta, e. num_round

Nome do parâmetro Tipo de parâmetro Intervalos recomendados
alpha

ContinuousParameterRanges

MinValue: 0, MaxValue 100

colsample_bylevel

ContinuousParameterRanges

MinValue: 0,1, MaxValue: 1

colsample_bynode

ContinuousParameterRanges

MinValue: 0,1, MaxValue: 1

colsample_bytree

ContinuousParameterRanges

MinValue: 0,5, MaxValue: 1

eta

ContinuousParameterRanges

MinValue: 0,1, MaxValue 0,5

gamma

ContinuousParameterRanges

MinValue: 0, MaxValue 5

lambda

ContinuousParameterRanges

MinValue: 0, MaxValue 100

max_delta_step

IntegerParameterRanges

[0, 10]

max_depth

IntegerParameterRanges

[0, 10]

min_child_weight

ContinuousParameterRanges

MinValue: 0, MaxValue 120

num_round

IntegerParameterRanges

[1, 4000]

subsample

ContinuousParameterRanges

MinValue: 0,5, MaxValue: 1