

本文為英文版的機器翻譯版本，如內容有任何歧義或不一致之處，概以英文版為準。

# 物件偵測的運作方式
<a name="algo-object-detection-tech-notes"></a>

物件偵測演算法可從已知的物件類別集合中，識別並找出影像中物件的所有執行個體。演算法會將影像做為輸入，並輸出物件所屬的類別以及屬於該類別的可信度分數。演算法也會使用矩形邊界框來預測物件的位置和比例尺。Amazon SageMaker AI 物件偵測使用[單次多框偵測器 (SSD)](https://arxiv.org/pdf/1512.02325.pdf) 演算法，其會將經過分類任務預先訓練的卷積神經網絡 (CNN) 做為基礎網路。SSD 會使用中繼層的輸出做為偵測功能。

[VGG](https://arxiv.org/pdf/1409.1556.pdf) 和 [ResNet](https://arxiv.org/pdf/1603.05027.pdf) 等各種 CNN 均可在影像分類任務方面獲得絕佳的效能。Amazon SageMaker AI 物件偵測支援以 VGG-16 和 ResNet-50 做為 SSD 的基礎網路。您可以在完整訓練模式或傳輸學習模式中訓練演算法。在完整訓練模式中，基礎網路會以隨機權重進行初始化，然後以使用者資料來訓練。在傳輸學習模式中，系統會從預先訓練的模型載入基礎網路權重。

物件偵測演算法在內部快速使用標準資料擴增操作，例如翻轉、縮放和抖動，有助於避免過度擬合。