Ajustar um modelo RCF - Amazon SageMaker

Ajustar um modelo RCF

O ajuste de modelo automático, também conhecido como ajuste de hiperparâmetros ou otimização de hiperparâmetros, localiza a melhor versão de um modelo executando vários trabalhos que testam uma série de hiperparâmetros no seu conjunto de dados. Você escolhe os hiperparâmetros ajustáveis, um intervalo de valores para cada um e uma métrica objetiva. Você escolhe a métrica objetiva entre as métricas que o algoritmo calcula. O ajuste de modelo automático pesquisa os hiperparâmetros escolhidos para encontrar a combinação de valores que resultam no modelo que otimiza a métrica objetiva.

O algoritmo RCF do Amazon SageMaker é um algoritmo de detecção de anomalias não supervisionado que requer um conjunto de dados de teste rotulado para otimização de hiperparâmetros. O RCF calcula as pontuações de anomalias para os pontos de dados de teste e rotula os pontos de dados como anômalos se suas pontuações estiverem além dos três desvios padrão da pontuação média. Isso é conhecido como heurística de limites de três sigma. A pontuação F1 é baseada na diferença entre rótulos calculados e rótulos reais. O trabalho de ajuste de hiperparâmetros encontra o modelo que maximiza essa pontuação. O sucesso da otimização de hiperparâmetros depende da aplicabilidade da heurística de limites de três sigma ao conjunto de dados de teste.

Para mais informações sobre o ajuste de modelos, consulte Ajuste automático de modelos com o SageMaker.

Métricas calculadas pelo algoritmo RCF

O algoritmo RCF calcula a métrica a seguir durante o treinamento. Ao ajustar o modelo, escolha essa métrica como a métrica objetiva.

Nome da métrica Descrição Direção de otimização
test:f1

Pontuação F1 no conjunto de dados de teste, com base na diferença entre rótulos calculados e rótulos reais.

Maximizar

Hiperparâmetros ajustáveis do RCF

Você pode ajustar um modelo de RCF com os seguintes hiperparâmetros:

Nome do parâmetro Tipo de parâmetro Intervalos recomendados
num_samples_per_tree

IntegerParameterRanges

MinValue: 1, MaxValue:2048

num_trees

IntegerParameterRanges

MinValue: 50, MaxValue:1000