View a markdown version of this page

適用於文字資料的內建 SageMaker AI 演算法 - Amazon SageMaker AI

適用於文字資料的內建 SageMaker AI 演算法

SageMaker AI 提供專為自然語言處理、文件分類或摘要、主題建模或分類以及語言轉錄或翻譯中使用的文字文件分析量身打造的演算法。

BlazingText 演算法 - Word2vec 和文字分類演算法的高度最佳化實作，可輕鬆擴展到大型資料集。它適用於許多下游自然語言處理 (NLP) 任務。
隱含狄利克雷分布 (LDA) 演算法——適合用來判斷一組文件主題的演算法。屬於無監督演算法，即是在進行訓練時並未使用含有答案的範本資料。
神經主題模型 (NTM) 演算法——另一種無監督技術，可透過神經網路的做法來判斷一組文件的主題。
Object2Vec 演算法——可用於建議系統、文件分類和句子嵌入的一般用途神經嵌入演算法。
序列對序列演算法——為監督式演算法，常用於神經機器轉譯。
文字分類 - TensorFlow——監督式演算法，支援使用可用的預先訓練模型進行文字分類的傳輸學習。

演算法名稱	頻道名稱	訓練輸入模式	檔案類型	執行個體類別	可平行化
BlazingText	訓練	檔案或管道	文字檔 (一行一個句子，使用空格分隔權杖)	GPU (限單一執行個體) 或 CPU	否
LDA	訓練和 (選擇性) 測試	檔案或管道	recordIO-protobuf 或 CSV	CPU (限單一執行個體)	否
神經主題模型	訓練和 (選擇性) 驗證、測試，或兩者兼具	檔案或管道	recordIO-protobuf 或 CSV	GPU 或 CPU	是
Object2Vec	訓練和 (選擇性) 驗證、測試，或兩者兼具	檔案	JSON 行	GPU 或 CPU (限單一執行個體)	否
Seq2Seq Modeling	訓練、驗證、詞彙	檔案	recordIO-protobuf	GPU (限單一執行個體)	否
文字分類 - TensorFlow	訓練與驗證	檔案	CSV	CPU 或 GPU	是 (僅適用於單一執行個體上的多個 GPU)

您的瀏覽器已停用或無法使用 Javascript。

您必須啟用 Javascript，才能使用 AWS 文件。請參閱您的瀏覽器說明頁以取得說明。

文件慣用形式

XGBoost 0.72 版

BlazingText