Ajustar um CatBoost modelo - Amazon SageMaker

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Ajustar um CatBoost modelo

O ajuste de modelo automático, também conhecido como ajuste de hiperparâmetros, localiza a melhor versão de um modelo executando vários trabalhos que testam uma série de hiperparâmetros no seu conjunto de dados de treinamento e validação. O ajuste do modelo se concentra nos seguintes hiperparâmetros:

nota

A função de perda de aprendizagem é atribuída automaticamente com base no tipo de tarefa de classificação, que é determinado pelo número de números inteiros exclusivos na coluna do rótulo. Para obter mais informações, consulte CatBoost hiperparâmetros.

  • uma função de aprendizado para otimizar durante o treinamento do modelo

  • Uma métrica de avaliação usada para avaliar o desempenho do modelo durante a validação

  • Um conjunto de hiperparâmetros e uma faixa de valores para cada um usar ao ajustar o modelo automaticamente

O ajuste de modelo automático pesquisa os seus hiperparâmetros escolhidos para encontrar a combinação de valores que resultam no modelo que otimiza a métrica escolhida.

nota

O ajuste automático do modelo CatBoost está disponível somente na Amazon SageMaker SDKs, não no SageMaker console.

Para mais informações sobre o ajuste de modelos, consulte Ajuste automático do modelo com SageMaker.

Métricas de avaliação calculadas pelo algoritmo CatBoost

O SageMaker CatBoost algoritmo calcula as seguintes métricas para usar na validação do modelo. A métrica de avaliação é atribuída automaticamente com base no tipo de tarefa de classificação, que é determinado pelo número de números inteiros exclusivos na coluna do rótulo.

Nome da métrica Descrição Direção de otimização Padrão Regex
RMSE erro quadrático médio da raiz minimizar "bestTest = ([0-9\\.]+)"
MAE erro absoluto médio minimizar "bestTest = ([0-9\\.]+)"
MedianAbsoluteError erro absoluto mediano minimizar "bestTest = ([0-9\\.]+)"
R2 pontuação r2 maximizar "bestTest = ([0-9\\.]+)"
Logloss entropia cruzada binária maximizar "bestTest = ([0-9\\.]+)"
Precision precisão maximizar "bestTest = ([0-9\\.]+)"
Recall recall maximizar "bestTest = ([0-9\\.]+)"
F1 pontuação de f1 maximizar "bestTest = ([0-9\\.]+)"
AUC pontuação de auc maximizar "bestTest = ([0-9\\.]+)"
MultiClass entropia cruzada multiclasse maximizar "bestTest = ([0-9\\.]+)"
Accuracy precisão maximizar "bestTest = ([0-9\\.]+)"
BalancedAccuracy precisão balanceada maximizar "bestTest = ([0-9\\.]+)"

Hiperparâmetros ajustáveis CatBoost

Ajuste o CatBoost modelo com os seguintes hiperparâmetros. Os hiperparâmetros que têm o maior efeito na otimização das métricas de CatBoost avaliação são:learning_rate, depthl2_leaf_reg, e. random_strength Para obter uma lista de todos os CatBoost hiperparâmetros, consulteCatBoost hiperparâmetros.

Nome do parâmetro Tipo de parâmetro Intervalos recomendados
learning_rate ContinuousParameterRanges MinValue: 0,001, MaxValue: 0,01
depth IntegerParameterRanges MinValue: 4, MaxValue 10
l2_leaf_reg IntegerParameterRanges MinValue: 2, MaxValue 10
random_strength ContinuousParameterRanges MinValue: 0, MaxValue 10