無監督內建演算 SageMaker 法 - Amazon SageMaker

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

無監督內建演算 SageMaker 法

Amazon SageMaker 提供數種內建演算法,可用於各種無監督式學習任務,例如叢集、維度縮減、模式辨識和異常偵測。

  • IP Insights——學習 IPv4 位址的使用模式。它旨在擷取 IPv4 地址和各種實體之間的關聯,例如使用者 ID 或帳戶號碼。

  • K 平均數演算法——會找出資料內分散的群組,盡可能讓群組成員彼此相似,而進能可和其他群組內的成員有所差異。

  • 主成分分析 (PCA) 演算法——透過將資料點投影到前幾個主體元件上,減少資料集內的維數 (特徵數量)。目標是保留盡可能多的資訊或變化。對於數學家來說,主分量是資料協方差矩陣的特徵向量。

  • 隨機切割森林 (RCF) 演算法——檢測資料集中的異常資料點,這些資料點與其他結構良好或模式化的資料會出現差異。

演算法名稱 頻道名稱 訓練輸入模式 檔案類型 執行個體類別 可平行化
IP 深入分析 訓練和 (選擇性) 驗證 檔案 CSV CPU 或 GPU
K-Means 訓練和 (選擇性) 測試 檔案或管道 recordIO-protobuf 或 CSV CPU 或 GPUCommon (在一或多個執行個體上的單一 GPU 裝置)
PCA 訓練和 (選擇性) 測試 檔案或管道 recordIO-protobuf 或 CSV GPU 或 CPU
Random Cut Forest (隨機分割森林) 訓練和 (選擇性) 測試 檔案或管道 recordIO-protobuf 或 CSV CPU