物件偵測的運作方式 - Amazon SageMaker

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

物件偵測的運作方式

物件偵測演算法可從已知的物件類別集合中,識別並找出影像中物件的所有執行個體。演算法會將影像做為輸入,並輸出物件所屬的類別以及屬於該類別的可信度分數。演算法也會使用矩形邊界框來預測物件的位置和比例尺。Amazon SageMaker Object Detection 使用 Single Shot 多盒偵測器 (SSD) 演算法,該演算法採用預先訓練的卷積神經網路 (CNN) 作為基礎網路進行分類任務。SSD 使用中繼層的輸出做為偵測的功能。

VGG 和 CNNs 等各種功能ResNet在映像分類任務上都取得了優異的效能。Amazon 中的物件偵測 SageMaker 支援 VGG-16 和 ResNet-50 作為 的基礎網路SSD。您可以在完整訓練模式或傳輸學習模式中訓練演算法。在完整訓練模式中,基礎網路會以隨機權重進行初始化,然後以使用者資料來訓練。在傳輸學習模式中,系統會從預先訓練的模型載入基礎網路權重。

物件偵測演算法在內部快速使用標準資料擴增操作,例如翻轉、縮放和抖動,有助於避免過度擬合。