Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Hiperparámetros de LDA
En la solicitud CreateTrainingJob
, especifique el algoritmo de capacitación. También puede especificar hiperparámetros específicos del algoritmo como mapas. string-to-string En la siguiente tabla se enumeran los hiperparámetros del algoritmo de entrenamiento LDA proporcionado por Amazon SageMaker AI. Para obtener más información, consulte Funcionamiento de LDA.
Nombre del parámetro | Descripción |
---|---|
num_topics |
El número de temas de LDA para buscar en los datos. Obligatorio Valores válidos: número entero positivo |
feature_dim |
El tamaño del vocabulario del cuerpo de documentos de entrada. Obligatorio Valores válidos: número entero positivo |
mini_batch_size |
El número total de documentos en el cuerpo de documentos de entrada. Obligatorio Valores válidos: número entero positivo |
alpha0 |
Suposición inicial del parámetro de concentración: la suma de los elementos de Dirichlet anterior. Es más probable que los valores pequeños generen combinaciones de temas dispersos y los valores grandes (superiores a 1,0) generen combinaciones más uniformes. Opcional Valores válidos: número flotante positivo Valor predeterminado: 1.0 |
max_restarts |
El número de reinicios que realizar durante la fase de descomposición espectral de mínimos cuadrados alternantes (ALS) del algoritmo. Se puede utilizar para buscar mejor el mínimo local de calidad a costa de una computación adicional, pero normalmente no debe ajustarse. Opcional Valores válidos: número entero positivo Valor predeterminado: 10 |
max_iterations |
El número máximo de iteraciones que realizar durante la fase ALS del algoritmo. Se puede utilizar para buscar mejor el mínimo de calidad a costa de una computación adicional, pero normalmente no debe ajustarse. Opcional Valores válidos: número entero positivo Valor predeterminado: 1000 |
tol |
Tolerancia a errores del destino para la fase ALS del algoritmo. Se puede utilizar para buscar mejor el mínimo de calidad a costa de una computación adicional, pero normalmente no debe ajustarse. Opcional Valores válidos: número flotante positivo Valor predeterminado: 1e-8 |