Hiperparámetros de LDA
En la solicitud CreateTrainingJob
, especifique el algoritmo de capacitación. También puede especificar hiperparámetros específicos de algoritmos como mapeos de cadena a cadena. En la siguiente tabla, aparecen los hiperparámetros para el algoritmo de entrenamiento LDA proporcionado por Amazon SageMaker. Para obtener más información, consulte Funcionamiento de LDA.
Nombre del parámetro | Descripción |
---|---|
num_topics |
El número de temas de LDA para buscar en los datos. Obligatorio Valores válidos: número entero positivo |
feature_dim |
El tamaño del vocabulario del cuerpo de documentos de entrada. Obligatorio Valores válidos: número entero positivo |
mini_batch_size |
El número total de documentos en el cuerpo de documentos de entrada. Obligatorio Valores válidos: número entero positivo |
alpha0 |
Suposición inicial del parámetro de concentración: la suma de los elementos de Dirichlet anterior. Es más probable que los valores pequeños generen combinaciones de temas dispersos y los valores grandes (superiores a 1,0) generen combinaciones más uniformes. Opcional Valores válidos: número flotante positivo Valor predeterminado: 1.0 |
max_restarts |
El número de reinicios que realizar durante la fase de descomposición espectral de mínimos cuadrados alternantes (ALS) del algoritmo. Se puede utilizar para buscar mejor el mínimo local de calidad a costa de una computación adicional, pero normalmente no debe ajustarse. Opcional Valores válidos: número entero positivo Valor predeterminado: 10 |
max_iterations |
El número máximo de iteraciones que realizar durante la fase ALS del algoritmo. Se puede utilizar para buscar mejor el mínimo de calidad a costa de una computación adicional, pero normalmente no debe ajustarse. Opcional Valores válidos: número entero positivo Valor predeterminado: 1000 |
tol |
Tolerancia a errores del destino para la fase ALS del algoritmo. Se puede utilizar para buscar mejor el mínimo de calidad a costa de una computación adicional, pero normalmente no debe ajustarse. Opcional Valores válidos: número flotante positivo Valor predeterminado: 1e-8 |