Fonctionnement de la classification d'images - Amazon SageMaker

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Fonctionnement de la classification d'images

L'algorithme de classification d'images prend une image en entrée et la classe dans une des catégories de sortie. Le deep learning a révolutionné le domaine de la classification d'images et a obtenu des performances élevées. Divers réseaux d'apprentissage profond ResNetDenseNet, tels que Inception, etc., ont été développés pour être très précis pour la classification des images. Dans le même temps, des efforts ont été faits pour collecter des données d'image étiquetées, essentielles à l'entraînement de ces réseaux. ImageNetest l'un de ces grands ensembles de données qui contient plus de 11 millions d'images avec environ 11 000 catégories. Une fois qu'un réseau est entraîné avec ImageNet des données, il peut également être utilisé pour généraliser avec d'autres ensembles de données, par un simple réajustement ou un ajustement précis. Dans cette approche d'apprentissage par transfert, un réseau est initialisé avec des poids (dans cet exemple, entraînés ImageNet), qui peuvent ensuite être affinés pour une tâche de classification d'images dans un autre ensemble de données.

La classification des images dans Amazon SageMaker peut être exécutée selon deux modes : formation complète et apprentissage par transfert. En mode d'entraînement complet, le réseau est initialisé avec des pondérations aléatoires et entraîné intégralement sur des données utilisateur. En mode de formation de transfert, le réseau est initialisé avec des pondérations préentraînées, seule la couche supérieure entièrement gérée étant initialisée avec des pondérations aléatoires. Ensuite, l'ensemble du réseau est affiné avec de nouvelles données. Dans ce mode, l'entraînement peut être réalisé même avec un jeu de données plus petit. Cela est dû au fait que le réseau est déjà entraîné et, par conséquent, peut être utilisé dans des cas où les données d'entraînement ne sont pas suffisantes.