影像分類的運作方式 - Amazon SageMaker

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

影像分類的運作方式

影像分類演算法會將影像擷取為輸入,並分類至其中一個輸出類別。深度學習在影像分類領域中掀起革命浪潮,而效能表現更是卓越出色。已開發各種深度學習網路 ResNetDenseNet,例如、、Inception 等,以達到高度精確的影像分類。同時,為了訓練這些網路,必要的標籤影像資料收集程序亦成果卓著。ImageNet是一個如此龐大的數據集,其中包含超過 11 萬張圖像,其中包含約 11,000 個類別。一旦使用 ImageNet 數據進行了培訓,它也可以通過簡單的重新調整或微調來與其他數據集一起使用。在這種轉移學習方法中,網路會以加權進行初始化 (在此範例中進行訓練 ImageNet),稍後可針對不同資料集中的影像分類工作進行微調。

Amazon 中的影像分類 SageMaker 可以使用兩種模式執行:完整訓練和轉移學習。在完整訓練模式中,網路會以隨機權重進行初始化,並在使用者資料上從頭開始訓練。在遷移學習模式中,網路則會以預先訓練的權重進行初始化,唯有頂端完全連線的層級會以隨機權重執行初始化作業。接著,該模式會採用新資料來微調整個網路。在此模式下,您亦可使用較小型的資料集來進行訓練。這是因為網路已經訓練完成,能適用於訓練資料不足的情況。