As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Ajuste um XGBoost modelo
O ajuste automático de modelos, também conhecido como ajuste de hiperparâmetros, localiza a melhor versão de um modelo executando vários trabalhos que testam uma série de hiperparâmetros no seu conjunto de dados de treinamento e validação. Você escolhe três tipos de hiperparâmetros:
-
uma função de
objective
de aprendizado para otimizar durante o treinamento de modelo -
uma
eval_metric
para usar para avaliar a performance do modelo durante a validação -
um conjunto de hiperparâmetros e um intervalo de valores para cada para usar ao ajustar o modelo automaticamente
Você escolhe a métrica de avaliação do conjunto de métricas de avaliação que o algoritmo calcula. O ajuste de modelo automático pesquisa os hiperparâmetros escolhidos para encontrar a combinação de valores que resultam no modelo que otimiza a métrica de avaliação.
nota
O ajuste automático do modelo para XGBoost 0,90 só está disponível na Amazon SageMaker SDKs, não no SageMaker console.
Para mais informações sobre o ajuste de modelos, consulte Ajuste automático do modelo com SageMaker.
Métricas de avaliação calculadas pelo algoritmo XGBoost
O XGBoost algoritmo calcula as seguintes métricas para usar na validação do modelo. Ao ajustar o modelo, escolha uma destas métricas para avaliar o modelo. Para obter uma lista completa de eval_metric
valores válidos, consulte Parâmetros da tarefa de XGBoost aprendizagem
Nome da métrica | Descrição | Direção de otimização |
---|---|---|
validation:accuracy |
Taxa de classificação, calculada como #(right)/#(all cases). |
Maximizar |
validation:auc |
Área sob a curva. |
Maximizar |
validation:error |
Taxa de erro de classificação binária, calculada como #(casos errados)/#(todos os casos). |
Minimizar |
validation:f1 |
Indicador de precisão de classificação, calculado como a média harmônica de precisão e recall. |
Maximizar |
validation:logloss |
Verossimilhança de log negativa. |
Minimizar |
validation:mae |
Erro absoluto médio. |
Minimizar |
validation:map |
Precisão média da média. |
Maximizar |
validation:merror |
Taxa de erro de classificação multiclasse, calculada como #(casos errados)/#(todos os casos). |
Minimizar |
validation:mlogloss |
Verossimilhança de log negativa para classificação multiclasse. |
Minimizar |
validation:mse |
Erro quadrático médio. |
Minimizar |
validation:ndcg |
Ganho cumulativo descontado normalizado. |
Maximizar |
validation:rmse |
Erro quadrático médio da raiz |
Minimizar |
Hiperparâmetros ajustáveis XGBoost
Ajuste o XGBoost modelo com os seguintes hiperparâmetros. Os hiperparâmetros que têm o maior efeito na otimização das métricas de XGBoost avaliação são:alpha
,min_child_weight
, subsample
eta
, e. num_round
Nome do parâmetro | Tipo de parâmetro | Intervalos recomendados |
---|---|---|
alpha |
ContinuousParameterRanges |
MinValue: 0, MaxValue 100 |
colsample_bylevel |
ContinuousParameterRanges |
MinValue: 0,1, MaxValue: 1 |
colsample_bynode |
ContinuousParameterRanges |
MinValue: 0,1, MaxValue: 1 |
colsample_bytree |
ContinuousParameterRanges |
MinValue: 0,5, MaxValue: 1 |
eta |
ContinuousParameterRanges |
MinValue: 0,1, MaxValue 0,5 |
gamma |
ContinuousParameterRanges |
MinValue: 0, MaxValue 5 |
lambda |
ContinuousParameterRanges |
MinValue: 0, MaxValue 100 |
max_delta_step |
IntegerParameterRanges |
[0, 10] |
max_depth |
IntegerParameterRanges |
[0, 10] |
min_child_weight |
ContinuousParameterRanges |
MinValue: 0, MaxValue 120 |
num_round |
IntegerParameterRanges |
[1, 4000] |
subsample |
ContinuousParameterRanges |
MinValue: 0,5, MaxValue: 1 |