文字分類的運作方式 TensorFlow - Amazon SageMaker AI

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

文字分類的運作方式 TensorFlow

文字分類 - TensorFlow 演算法會將文字分類為其中一個輸出類別標籤。例如 等深度學習網路對於文字分類BERT非常準確。也有深度學習網路,這些網路在大型文字資料集上進行訓練 TextNet,例如,其中有超過 1,100 萬個文字,其中包含約 11,000 個類別。使用 TextNet 資料訓練網路之後,您就可以在具有特定焦點的資料集上微調網路,以執行更具體的文字分類任務。Amazon SageMaker AI Text Classification - TensorFlow algorithm 支援在 TensorFlow Hub 中提供許多預先訓練模型的遷移學習。

根據您訓練資料中的類別標籤數量,文字分類層會連接至您選擇的預先訓練 TensorFlow 模型。分類層由一個退出層、一密集層以及具有 2 規範正規化的完全已連線的層組成,並以隨機權重初始化。您可以變更退出層的退出率超參數值,以及密集層的 L2 正規化因素。

您可以微調整個網路 (包含預先訓練的模型),或僅微調新訓練資料的頂部分類層。使用這種轉移學習方法,可以使用較小的資料集進行訓練。