Como TensorFlow funciona a classificação de texto - Amazon SageMaker

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Como TensorFlow funciona a classificação de texto

O TensorFlow algoritmo Classificação de Texto - considera o texto conforme o classifica em um dos rótulos da classe de saída. Redes de aprendizado profundo, como as BERTque, são altamente precisas para classificação de texto. Também existem redes de aprendizado profundo treinadas em grandes conjuntos de dados de texto, como, por exemplo TextNet, que tem mais de 11 milhões de textos com cerca de 11.000 categorias. Depois que uma rede é treinada com TextNet dados, você pode então ajustar a rede em um conjunto de dados com um foco específico para realizar tarefas de classificação de texto mais específicas. O TensorFlow algoritmo Amazon SageMaker Text Classification suporta o aprendizado por transferência em muitos modelos pré-treinados que estão disponíveis no TensorFlow Hub.

De acordo com o número de rótulos de classe em seus dados de treinamento, uma camada de classificação de texto é anexada ao TensorFlow modelo pré-treinado de sua escolha. A camada de classificação consiste em uma camada suspensa, uma camada densa e uma camada totalmente conectada com regularização de duas normas e é inicializada com pesos aleatórios. Você pode alterar os valores dos hiperparâmetros para a taxa de eliminação da camada de eliminação e o fator de regularização L2 para a camada densa.

Você pode ajustar toda a rede (incluindo o modelo pré-treinado) ou somente a camada de classificação superior nos novos dados de treinamento. Com esse método de transferência de aprendizado, é possível treinar com conjuntos de dados menores.