Funcionamiento de la clasificación de imágenes - Amazon SageMaker

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Funcionamiento de la clasificación de imágenes

El algoritmo de clasificación de imágenes toma una imagen como entrada y la clasifica en una de las categorías de salida. El aprendizaje profundo ha revolucionado el dominio de clasificación de imágenes y ha conseguid un desempeño fantástico. Se han desarrollado varias redes de aprendizaje profundo ResNetDenseNet, como Inception, etc., para que sean muy precisas en la clasificación de imágenes. Al mismo tiempo, se han adoptado medidas para recopilar los datos de imágenes etiquetados que son esenciales para la capacitación de estas redes. ImageNetes uno de esos grandes conjuntos de datos que tiene más de 11 millones de imágenes distribuidas en unas 11 000 categorías. Una vez que se entrena una red con ImageNet datos, también se puede utilizar para generalizarla con otros conjuntos de datos, simplemente reajustándola o ajustándola con precisión. En este enfoque de aprendizaje por transferencia, una red se inicializa con pesos (en este ejemplo, se aprende sobre ellos ImageNet), que luego se pueden ajustar para una tarea de clasificación de imágenes en un conjunto de datos diferente.

La clasificación de imágenes en Amazon se SageMaker puede ejecutar en dos modos: formación completa y aprendizaje por transferencia. En el modo de capacitación completo, la red se inicializa con ponderaciones aleatorias y se capacita en los datos de usuario desde cero. En el modo de aprendizaje de transferencia, la red se inicializa con ponderaciones con capacitación previa y solo la capa superior conectada totalmente se inicializa con ponderaciones aleatorias. Después, toda la red se reajusta con los nuevos datos. En este modo, la capacitación puede lograrse incluso con conjuntos de datos más pequeños. Esto se debe a que ya se ha realizado la capacitación de la red y, por lo tanto, puede utilizarse en casos sin datos de capacitación suficientes.