Hiperparâmetros do LDA - Amazon SageMaker

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Hiperparâmetros do LDA

Na solicitação CreateTrainingJob, é especificado o algoritmo de treinamento. Você também pode especificar hiperparâmetros específicos do algoritmo como mapas. string-to-string A tabela a seguir lista os hiperparâmetros do algoritmo de treinamento LDA fornecido pela Amazon. SageMaker Para ter mais informações, consulte Como o LDA funciona.

Nome do parâmetro Descrição
num_topics

O número de tópicos que o LDA deve encontrar dentro dos dados.

Obrigatório

Valores válidos: inteiro positivo

feature_dim

O tamanho do vocabulário do corpus de documentos de entrada.

Obrigatório

Valores válidos: inteiro positivo

mini_batch_size

O número total de documentos no corpus de entrada.

Obrigatório

Valores válidos: inteiro positivo

alpha0

Suposição inicial para o parâmetro de concentração: a soma dos elementos da estimativa a priori Dirichlet. Valores menores têm mais probabilidade de gerar combinações esparsas de tópicos, e os valores maiores que 1,0 produzem mais combinações uniformes.

Opcional

Valores válidos: flutuante positivo

Valor padrão: 1.0

max_restarts

O número de reinicializações a ser executadas durante a fase de decomposição espectral de mínimos quadrados alternantes (ALS) do algoritmo. Pode ser usado para encontrar pontos de mínimos locais de melhor qualidade, mas normalmente não deve ser ajustado.

Opcional

Valores válidos: inteiro positivo

Valor padrão: 10

max_iterations

O número máximo de iterações a ser executadas durante a fase ALS do algoritmo. Pode ser usado para encontrar pontos de mínimos de melhor qualidade, mas normalmente não deve ser ajustado.

Opcional

Valores válidos: inteiro positivo

Valor padrão: 1000

tol

Tolerância fixada de erro para a fase ALS do algoritmo. Pode ser usado para encontrar pontos de mínimos de melhor qualidade, mas normalmente não deve ser ajustado.

Opcional

Valores válidos: flutuante positivo

Valor padrão: 1e-8