Ajuste um NTM modelo - Amazon SageMaker

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Ajuste um NTM modelo

O ajuste automático de modelos, também conhecido como ajuste de hiperparâmetros, localiza a melhor versão de um modelo executando vários trabalhos que testam uma série de hiperparâmetros no seu conjunto de dados. Você escolhe os hiperparâmetros ajustáveis, um intervalo de valores para cada um e uma métrica objetiva. Você escolhe a métrica objetiva entre as métricas que o algoritmo calcula. O ajuste de modelo automático pesquisa os hiperparâmetros escolhidos para encontrar a combinação de valores que resultam no modelo que otimiza a métrica objetiva.

SageMaker NTMA Amazon é um algoritmo de aprendizado não supervisionado que aprende representações latentes de grandes coleções de dados discretos, como um corpus de documentos. Representações latentes usam variáveis inferidas que não são medidas diretamente para modelar as observações em um conjunto de dados. O ajuste automático do modelo NTM ajuda você a encontrar o modelo que minimiza a perda dos dados de treinamento ou validação. A perda de treinamento mede o quão bem o modelo se encaixa nos dados de treinamento. A perda de validação mede o quão bem o modelo pode generalizar para os dados nos quais ele não é treinado. Uma baixa perda de treinamento indica que um modelo é uma boa opção para os dados de treinamento. Uma baixa perda de validação indica que um modelo não causou sobreajuste nos dados de treinamento e, portanto, deve ser capaz de modelar com sucesso os documentos nos quais não foi treinado. Normalmente, é preferível que ambas as perdas sejam pequenas. No entanto, minimizar a perda de treinamento em excesso pode resultar em um superajuste e aumentar a perda de validação, o que reduziria a generalidade do modelo.

Para mais informações sobre o ajuste de modelos, consulte Ajuste automático do modelo com SageMaker.

Métricas calculadas pelo algoritmo NTM

O NTM algoritmo relata uma única métrica que é calculada durante o treinamento:validation:total_loss. A perda total é a soma da perda de reconstrução e da divergência de Kullback-Leibler. Ao ajustar os valores de hiperparâmetros, escolha essa métrica como o objetivo.

Nome da métrica Descrição Direção de otimização
validation:total_loss

Perda total no conjunto de validação

Minimizar

Hiperparâmetros ajustáveis NTM

Você pode ajustar os seguintes hiperparâmetros para o NTM algoritmo. Normalmente, configurar valores mini_batch_size baixos e learning_rate pequenos resulta em perdas de validação mais baixas, embora possa exigir maior tempo de treinamento. Baixas perdas de validação não necessariamente produzem mais tópicos coerentes conforme interpretados pelos seres humanos. O efeito de outros hiperparâmetros na perda de treinamento e validação pode variar dependendo do conjunto de dados. Para ver quais valores são compatíveis, consulte NTMHiperparâmetros.

Nome do parâmetro Tipo de parâmetro Intervalos recomendados
encoder_layers_activation

CategoricalParameterRanges

['sigmoid', 'tanh', 'relu']

learning_rate

ContinuousParameterRange

MinValue: 1e-4, MaxValue: 0,1

mini_batch_size

IntegerParameterRanges

MinValue: 16, :2048 MaxValue

optimizer

CategoricalParameterRanges

['sgd', 'adam', 'adadelta']

rescale_gradient

ContinuousParameterRange

MinValue: 0,1, MaxValue 1,0

weight_decay

ContinuousParameterRange

MinValue: 0,0, MaxValue 1,0