本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
內建演算法的參數
下表列出 Amazon SageMaker AI 提供的每個演算法的參數。
演算法名稱 | 頻道名稱 | 訓練輸入模式 | 檔案類型 | 執行個體類別 | 可平行化 |
---|---|---|---|---|---|
AutoGluon - 自列表格 | 訓練和 (選擇性) 驗證 | 檔案 | CSV | GPU 或 CPU (限單一執行個體) | 否 |
BlazingText | 訓練 | 檔案或管道 | 文字檔 (一行一個句子,使用空格分隔權杖) | GPU 或 CPU (限單一執行個體) | 否 |
CatBoost | 訓練和 (選擇性) 驗證 | 檔案 | CSV | CPU (限單一執行個體) | 否 |
DeepAR 預測 | 訓練和 (選擇性) 測試 | 檔案 | JSON Lines 或 Parquet | CPU 或 GPU | 是 |
分解機 | 訓練和 (選擇性) 測試 | 檔案或管道 | recordIO-protobuf | CPU (密集資料則 GPU) | 是 |
影像分類 - MXNet | 訓練和驗證、(選擇性) train_lst、validation_lst 和模型 | 檔案或管道 | recordIO 或圖片檔 (.jpg 或 .png) | GPU | 是 |
影像分類 - TensorFlow | 訓練與驗證 | 檔案 | 影像檔案 (.jpg、.jpeg 或 .png) | CPU 或 GPU | 是 (僅適用於單一執行個體上的多個 GPU) |
IP 深入分析 | 訓練和 (選擇性) 驗證 | 檔案 | CSV | CPU 或 GPU | 是 |
K 平均數 | 訓練和 (選擇性) 測試 | 檔案或管道 | recordIO-protobuf 或 CSV | CPU 或 GPUCommon (在一或多個執行個體上的單一 GPU 裝置) | 否 |
K-Nearest-Neighbors (k-NN) | 訓練和 (選擇性) 測試 | 檔案或管道 | recordIO-protobuf 或 CSV | CPU 或 GPU (在一或多個執行個體上的單一 GPU 裝置) | 是 |
LDA | 訓練和 (選擇性) 測試 | 檔案或管道 | recordIO-protobuf 或 CSV | CPU (限單一執行個體) | 否 |
LightGBM | 訓練和 (選擇性) 驗證 | 檔案 | CSV | CPU | 是 |
線性學習程式 | 訓練和 (選擇性) 驗證、測試,或兩者兼具 | 檔案或管道 | recordIO-protobuf 或 CSV | CPU 或 GPU | 是 |
神經主題模型 | 訓練和 (選擇性) 驗證、測試,或兩者兼具 | 檔案或管道 | recordIO-protobuf 或 CSV | CPU 或 GPU | 是 |
Object2Vec | 訓練和 (選擇性) 驗證、測試,或兩者兼具 | 檔案 | JSON 行 | GPU 或 CPU (限單一執行個體) | 否 |
物件偵測 - MXNet | 訓練和驗證、(選擇性) train_annotation、validation_annotation 和模型 | 檔案或管道 | recordIO 或圖片檔 (.jpg 或 .png) | GPU | 是 |
物體偵測 - TensorFlow | 訓練與驗證 | 檔案 | 影像檔案 (.jpg、.jpeg 或 .png) | GPU | 是 (僅適用於單一執行個體上的多個 GPU) |
PCA | 訓練和 (選擇性) 測試 | 檔案或管道 | recordIO-protobuf 或 CSV | CPU 或 GPU | 是 |
Random Cut Forest (隨機分割森林) | 訓練和 (選擇性) 測試 | 檔案或管道 | recordIO-protobuf 或 CSV | CPU | 是 |
語義分段 | 訓練和驗證、train_annotation、validation_annotation 和 (選擇性) label_map 與模型 | 檔案或管道 | 影像檔 | GPU (限單一執行個體) | 否 |
Seq2Seq Modeling | 訓練、驗證、詞彙 | 檔案 | recordIO-protobuf | GPU (限單一執行個體) | 否 |
TabTransformer | 訓練和 (選擇性) 驗證 | 檔案 | CSV | GPU 或 CPU (限單一執行個體) | 否 |
文字分類 - TensorFlow | 訓練與驗證 | 檔案 | CSV | CPU 或 GPU | 是 (僅適用於單一執行個體上的多個 GPU) |
XGBoost (0.90-1, 0.90-2, 1.0-1, 1.2-1, 1.2-21) | 訓練和 (選擇性) 驗證 | 檔案或管道 | CSV、LibSVM 或 Parquet | CPU (或適用於 1.2-1 的 GPU) | 是 |
可以將可平行化的演算法部署在多個運算執行個體來進行分散式訓練。
下列主題提供 Amazon SageMaker AI 提供的所有內建演算法通用的資料格式、建議的 Amazon EC2 執行個體類型和 CloudWatch 日誌的相關資訊。 Amazon SageMaker
注意
若要查詢 SageMaker AI 管理之內建演算法的 Docker 映像 URIs,請參閱 Docker 登錄檔路徑和範例程式碼。