選取您的 Cookie 偏好設定

我們使用提供自身網站和服務所需的基本 Cookie 和類似工具。我們使用效能 Cookie 收集匿名統計資料,以便了解客戶如何使用我們的網站並進行改進。基本 Cookie 無法停用,但可以按一下「自訂」或「拒絕」以拒絕效能 Cookie。

如果您同意,AWS 與經核准的第三方也會使用 Cookie 提供實用的網站功能、記住您的偏好設定,並顯示相關內容,包括相關廣告。若要接受或拒絕所有非必要 Cookie,請按一下「接受」或「拒絕」。若要進行更詳細的選擇,請按一下「自訂」。

訓練模式與演算法支援

焦點模式
訓練模式與演算法支援 - Amazon SageMaker AI

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

Autopilot 支援不同的訓練模式及演算法來解決機器學習問題、報告品質以及目標指標,並在需要時自動使用交叉驗證。

訓練模式

SageMaker Autopilot 可以根據資料集大小自動選取訓練方法,也可以手動選取訓練方法。選擇如下:

  • 整合–Autopilot 使用 AutoGluon 程式庫來訓練多個基本模型。為了找到適合您的資料集最佳組合,整合模式會以不同的模型與中繼參數設定來執行 10 次試驗。然後,Autopilot 會使用堆疊整合方法結合這些模型,以建立最佳的預測模型。如需 Autopilot 在表格式資料的整合模式下支援的演算法清單,請參閱下列演算法支援區段。

  • 超參數最佳化 (HPO)–Autopilot 在您的資料集執行訓練任務時,使用 Bayesian 最佳化或多逼真度最佳化調整超參數,找到模型的最佳版本。HPO 模式選擇與您的資料集最相關的演算法,並選擇最佳的超參數範圍來調整您的模型。若要調整模型,HPO 模式最多可執行 100 次試驗 (預設值),以尋找所選範圍內的最佳超參數設定。如果您的資料集大小小於 100 MB,Autopilot 將使用 Bayesian 最佳化。如果您的資料集大於 100 MB,Autopilot 會選擇多逼真度最佳化。

    在多逼真度最佳化中,指標會持續從訓練容器中發出。針對選取的目標指標,效能不佳的試驗會提早停止。執行良好的試驗會分配更多資源。

    如需 Autopilot 在 HPO 模式下支援的演算法清單,請參閱下列演算法支援區段。

  • 自動–Autopilot 會根據您的資料集大小自動選擇整合模式或 HPO 模式。如果您的資料集大於 100 MB,Autopilot 會選擇 HPO。否則,它會選擇整合模式。在下列情況下,Autopilot 可能無法讀取您的資料集大小。

    • 如果您為 AutoML 任務啟用 Virtual Private Cloud (VPC) 模式,但包含資料集的 S3 儲存貯體僅允許從 VPC 存取。

    • 您的資料集的輸入 S3DataTypeManifestFile

    • 輸入的 S3Uri 包含超過 1000 個項目。

    如果 Autopilot 無法讀取您的資料集大小,則預設會選擇 HPO 模式。

注意

若要取得最佳執行期與效能,請針對小於 100 MB 的資料集使用整合訓練模式。

演算法支援

HPO 模式,Autopilot 支援下列類型的機器學習演算法:

  • 線性學習器–可以解決分類或迴歸問題的監督式學習演算法。

  • XGBoost–藉由結合一組較簡單且較脆弱的模型之預估值集合來嘗試精確預測目標變數的監督式學習演算法。

  • 深度學習演算法–多層感知器 (MLP) 和前饋人工神經網路。此演算法可以處理不可線性分隔的資料。

注意

您不需要指定用於處理機器學習問題的演算法。Autopilot 會自動選擇合適的算法進行訓練。

整合模式下,Autopilot 支援以下類型的機器學習演算法:

  • LightGbM–使用具有梯度提升的樹型演算法的最佳化架構。該演算法使用在廣度而非深度上生長的樹,並且針對速度進行了高度最佳化。

  • CatBoost–使用樹型演算法與梯度提升的架構。針對處理分類變數進行最佳化。

  • XGBoost–使用樹型演算法與梯度提升的架構,深度增長,而不是廣度。

  • 隨機樹系–在資料的隨機子樣本使用多個決策樹並進行取代的樹型演算法。這些樹在每個層級被分成最佳節點。每棵樹的決策被平均在一起,以防止過度學習並改善預測。

  • Extra Tree–在整個資料集使用多個決策樹的樹型演算法。樹在每個層級隨機分割。對每棵樹的決定進行平均,以防止過度學習並改善預測。與隨機樹系演算法相比,額外的樹會增加一定程度的隨機化。

  • 線性模型–使用線性方程式對觀測資料中兩個變數之間關係進行建模的架構。

  • 神經網路火炬 – 使用 Pytorch 實作的神經網路模型。

  • 神經網路 fast.ai–使用 fast.ai 實作的神經網路模型。

隱私權網站條款Cookie 偏好設定
© 2025, Amazon Web Services, Inc.或其附屬公司。保留所有權利。