Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
El ajuste de modelo automático, también conocido como ajuste de hiperparámetros, encuentra la mejor versión de un modelo ejecutando muchas tareas que probar una serie de hiperparámetros en su conjunto de datos. Usted elige los hiperparámetros que pueden ajustarse, un rango de valores para cada uno de ellos y una métrica objetiva. Puede elegir la métrica objetiva de las métricas que el algoritmo computa. El ajuste de modelo automático busca los hiperparámetros elegidos para encontrar la combinación de valores que obtienen el modelo que optimiza la métrica objetiva.
LDA es un algoritmo de modelado de temas no supervisado que intenta describir un conjunto de observaciones (documentos) como una combinación de categorías (temas) distintas. La métrica "probabilidad de registro por palabra" (PWLL) mide la probabilidad de que un conjunto de temas aprendidos (un modelo LDA) describe de forma precisa un conjunto de datos de documento de prueba. Valores más altos de PWLL indican que es más probable que los datos de prueba se describan en el modelo LDA.
Para obtener más información acerca del ajuste de modelos, consulte Ajuste automático de modelos con IA SageMaker .
Métricas calculadas por el algoritmo LDA
El algoritmo LDA informa sobre en una única métrica durante la capacitación: test:pwll
. Al ajustar un modelo, elija esta métrica como la métrica objetivo.
Nombre de métrica | Descripción | Dirección de optimización |
---|---|---|
test:pwll |
Probabilidad de registro por palabra en el conjunto de datos de prueba. La probabilidad de que el conjunto de datos de prueba sea descrito con exactitud por el modelo aprendido LDA. |
Maximizar |
Hiperparámetros de LDA ajustables
Puede ajustar los siguientes hiperparámetros para el algoritmo de LDA. Los hiperparámetros alpha0
y num_topics
pueden afectar a la métrica objetivo LDA (test:pwll
). Si aún no conoce los valores óptimos para estos hiperparámetros, que maximizan la probabilidad de registro por palabra y producen un modelo LDA preciso, un ajuste de modelo LDA automático puede ayudar a encontrarlos.
Nombre del parámetro | Tipo de parámetro | Intervalos recomendados |
---|---|---|
alpha0 |
ContinuousParameterRanges |
MinValue: 0.1,: 10 MaxValue |
num_topics |
IntegerParameterRanges |
MinValue: 1, MaxValue 150 |