內建文字資料 SageMaker 演算法 - Amazon SageMaker

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

內建文字資料 SageMaker 演算法

SageMaker 提供適用於自然語言處理、文件分類或摘要、主題建模或分類、語言轉錄或翻譯中使用的文字文件分析的演算法。

演算法名稱 頻道名稱 訓練輸入模式 檔案類型 執行個體類別 可平行化
BlazingText 訓練 檔案或管道 文字檔 (一行一個句子,使用空格分隔字符) GPU (限單執行個體) 或 CPU
LDA 訓練和 (選擇性) 測試 檔案或管道 recordIO-protobuf 或 CSV CPU (限單執行個體)
神經主題模型 訓練和 (選擇性) 驗證、測試,或兩者兼具 檔案或管道 recordIO-protobuf 或 CSV GPU 或 CPU
Object2Vec 訓練和 (選擇性) 驗證、測試,或兩者兼具 檔案 JSON 行 GPU 或 CPU (限單一執行個體)
Seq2Seq Modeling 訓練、驗證、詞彙 檔案 recordIO-protobuf GPU (限單執行個體)
文字分類- TensorFlow 訓練與驗證 檔案 CSV CPU 或 GPU 是 (僅適用於單一執行個體上的多個 GPU)