Comment TensorFlow fonctionne la classification du texte - Amazon SageMaker

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Comment TensorFlow fonctionne la classification du texte

L' TensorFlow algorithme Classification du texte prend le texte tel qu'il le classe dans l'une des étiquettes de classe de sortie. Les réseaux d'apprentissage en profondeur tels que BERTceux-ci sont très précis pour la classification de texte. Il existe également des réseaux d'apprentissage en profondeur formés sur de grands ensembles de données textuels TextNet, tels que ceux qui contiennent plus de 11 millions de textes avec environ 11 000 catégories. Une fois qu'un réseau a été entraîné avec TextNet des données, vous pouvez affiner le réseau sur un jeu de données en mettant un accent particulier sur l'exécution de tâches de classification de texte plus spécifiques. L' TensorFlow algorithme Amazon SageMaker Text Classification prend en charge l'apprentissage par transfert sur de nombreux modèles préentraînés disponibles dans le TensorFlow Hub.

En fonction du nombre d'étiquettes de cours figurant dans vos données d'entraînement, une couche de classification de texte est attachée au TensorFlow modèle préentraîné de votre choix. La couche de classification se compose d'une couche d'abandon, d'une couche dense et d'une couche entièrement connectée avec une régularisation à 2 normes, et est initialisé avec des pondérations aléatoires. Vous pouvez modifier les valeurs d'hyperparamètre pour le taux d'abandon de la couche d'abandon et le facteur de régularisation L2 pour la couche dense.

Vous pouvez affiner le réseau entier (y compris le modèle pré-entraîné) ou uniquement la couche de classification supérieure sur les nouvelles données d'entraînement. Avec cette méthode d'apprentissage par transfert, un entraînement avec des jeux de données plus petits est possible.