內建演算法的參數 - Amazon SageMaker AI

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

內建演算法的參數

下表列出 Amazon SageMaker AI 提供的每個演算法的參數。

演算法名稱 頻道名稱 訓練輸入模式 檔案類型 執行個體類別 可平行化
AutoGluon - 自列表格 訓練和 (選擇性) 驗證 檔案 CSV GPU 或 CPU (限單一執行個體)
BlazingText 訓練 檔案或管道 文字檔 (一行一個句子,使用空格分隔權杖) GPU 或 CPU (限單一執行個體)
CatBoost 訓練和 (選擇性) 驗證 檔案 CSV CPU (限單一執行個體)
DeepAR 預測 訓練和 (選擇性) 測試 檔案 JSON Lines 或 Parquet CPU 或 GPU
分解機 訓練和 (選擇性) 測試 檔案或管道 recordIO-protobuf CPU (密集資料則 GPU)
影像分類 - MXNet 訓練和驗證、(選擇性) train_lst、validation_lst 和模型 檔案或管道 recordIO 或圖片檔 (.jpg 或 .png) GPU
影像分類 - TensorFlow 訓練與驗證 檔案 影像檔案 (.jpg、.jpeg 或 .png) CPU 或 GPU 是 (僅適用於單一執行個體上的多個 GPU)
IP 深入分析 訓練和 (選擇性) 驗證 檔案 CSV CPU 或 GPU
K 平均數 訓練和 (選擇性) 測試 檔案或管道 recordIO-protobuf 或 CSV CPU 或 GPUCommon (在一或多個執行個體上的單一 GPU 裝置)
K-Nearest-Neighbors (k-NN) 訓練和 (選擇性) 測試 檔案或管道 recordIO-protobuf 或 CSV CPU 或 GPU (在一或多個執行個體上的單一 GPU 裝置)
LDA 訓練和 (選擇性) 測試 檔案或管道 recordIO-protobuf 或 CSV CPU (限單一執行個體)
LightGBM 訓練和 (選擇性) 驗證 檔案 CSV CPU
線性學習程式 訓練和 (選擇性) 驗證、測試,或兩者兼具 檔案或管道 recordIO-protobuf 或 CSV CPU 或 GPU
神經主題模型 訓練和 (選擇性) 驗證、測試,或兩者兼具 檔案或管道 recordIO-protobuf 或 CSV CPU 或 GPU
Object2Vec 訓練和 (選擇性) 驗證、測試,或兩者兼具 檔案 JSON 行 GPU 或 CPU (限單一執行個體)
物件偵測 - MXNet 訓練和驗證、(選擇性) train_annotation、validation_annotation 和模型 檔案或管道 recordIO 或圖片檔 (.jpg 或 .png) GPU
物體偵測 - TensorFlow 訓練與驗證 檔案 影像檔案 (.jpg、.jpeg 或 .png) GPU 是 (僅適用於單一執行個體上的多個 GPU)
PCA 訓練和 (選擇性) 測試 檔案或管道 recordIO-protobuf 或 CSV CPU 或 GPU
Random Cut Forest (隨機分割森林) 訓練和 (選擇性) 測試 檔案或管道 recordIO-protobuf 或 CSV CPU
語義分段 訓練和驗證、train_annotation、validation_annotation 和 (選擇性) label_map 與模型 檔案或管道 影像檔 GPU (限單一執行個體)
Seq2Seq Modeling 訓練、驗證、詞彙 檔案 recordIO-protobuf GPU (限單一執行個體)
TabTransformer 訓練和 (選擇性) 驗證 檔案 CSV GPU 或 CPU (限單一執行個體)
文字分類 - TensorFlow 訓練與驗證 檔案 CSV CPU 或 GPU 是 (僅適用於單一執行個體上的多個 GPU)
XGBoost (0.90-1, 0.90-2, 1.0-1, 1.2-1, 1.2-21) 訓練和 (選擇性) 驗證 檔案或管道 CSV、LibSVM 或 Parquet CPU (或適用於 1.2-1 的 GPU)

可以將可平行化的演算法部署在多個運算執行個體來進行分散式訓練。

下列主題提供 Amazon SageMaker AI 提供的所有內建演算法通用的資料格式、建議的 Amazon EC2 執行個體類型和 CloudWatch 日誌的相關資訊。 Amazon SageMaker

注意

若要查詢 SageMaker AI 管理之內建演算法的 Docker 映像 URIs,請參閱 Docker 登錄檔路徑和範例程式碼