文本分类- TensorFlow 工作原理 - 亚马逊 SageMaker AI

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

文本分类- TensorFlow 工作原理

文本分类- TensorFlow 算法将文本归类为输出类标签之一。诸如BERT之类的深度学习网络对于文本分类非常准确。还有一些在大型文本数据集上训练的深度学习网络,例如 TextNet,它有超过1100万个文本,大约有11,000个类别。使用 TextNet 数据对网络进行训练后,您可以针对具有特定重点的数据集对网络进行微调,以执行更具体的文本分类任务。Amazon SageMaker AI 文本分类 TensorFlow 算法支持在 TensorFlow Hub 中提供的许多预训练模型上进行迁移学习。

根据训练数据中类别标签的数量,文本分类层将附加到您选择的预训练 TensorFlow 模型上。分类层由丢弃层、密集层和具有 2 范数正则化的完全连接层组成,并使用随机权重进行初始化。您可以更改丢弃层的丢弃比率以及密集层的 L2 正则化系数的超参数值。

您可以在新训练数据上,对整个网络(包括预训练模型)进行微调,也可以仅对顶层分类层进行微调。使用这种迁移学习方法就可以通过较小的数据集进行训练。