本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
無監督內建演算 SageMaker 法
Amazon SageMaker 提供數種內建演算法,可用於各種無監督式學習任務,例如叢集、維度縮減、模式辨識和異常偵測。
-
IP Insights——學習 IPv4 位址的使用模式。它旨在擷取 IPv4 地址和各種實體之間的關聯,例如使用者 ID 或帳戶號碼。
-
K 平均數演算法——會找出資料內分散的群組,盡可能讓群組成員彼此相似,而進能可和其他群組內的成員有所差異。
-
主成分分析 (PCA) 演算法——透過將資料點投影到前幾個主體元件上,減少資料集內的維數 (特徵數量)。目標是保留盡可能多的資訊或變化。對於數學家來說,主分量是資料協方差矩陣的特徵向量。
-
隨機切割森林 (RCF) 演算法——檢測資料集中的異常資料點,這些資料點與其他結構良好或模式化的資料會出現差異。
演算法名稱 | 頻道名稱 | 訓練輸入模式 | 檔案類型 | 執行個體類別 | 可平行化 |
---|---|---|---|---|---|
IP 深入分析 | 訓練和 (選擇性) 驗證 | 檔案 | CSV | CPU 或 GPU | 是 |
K-Means | 訓練和 (選擇性) 測試 | 檔案或管道 | recordIO-protobuf 或 CSV | CPU 或 GPUCommon (在一或多個執行個體上的單一 GPU 裝置) | 否 |
PCA | 訓練和 (選擇性) 測試 | 檔案或管道 | recordIO-protobuf 或 CSV | GPU 或 CPU | 是 |
Random Cut Forest (隨機分割森林) | 訓練和 (選擇性) 測試 | 檔案或管道 | recordIO-protobuf 或 CSV | CPU | 是 |