本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
在 CreateTrainingJob
請求中,請指定訓練演算法。您也可以指定演算法特定的超參數做為字串對字串的對應。下表列出 Amazon SageMaker AI 提供的 LDA 訓練演算法超參數。如需詳細資訊,請參閱LDA 的運作方式。
參數名稱 | 描述 |
---|---|
num_topics |
LDA 要在資料中找出的主題數量。 必要 有效值:正整數 |
feature_dim |
輸入文件語料庫的詞彙數量。 必要 有效值:正整數 |
mini_batch_size |
輸入文件語料庫中文件的總數。 必要 有效值:正整數 |
alpha0 |
集中參數的初始猜測值:狄利克雷先驗元素的總和。小的值更可能產生稀疏主題混合,而大的值 (大於 1.0) 會產生更多均勻的混合。 選用 有效值:正浮點 預設值:1.0 |
max_restarts |
在演算法的交替最小二乘 (ALS) 譜分解階段期間,要重新開始的次數。可用來在耗費額外的運算之下,找出更高品質的局部最小值,但通常不應進行調整。 選用 有效值:正整數 預設值:10 |
max_iterations |
在演算法的 ALS 階段,所要進行迭代的最高次數。可用來在耗費額外的運算之下,找出更高品質的最小值,但通常不應進行調整。 選用 有效值:正整數 預設值:1000 |
tol |
演算法 ALS 階段的目標錯誤容差。可用來在耗費額外的運算之下,找出更高品質的最小值,但通常不應進行調整。 選用 有效值:正浮點 預設值:1e-8 |