本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
適用於新手和專家的機器學習
透過 Amazon Redshift,無論您是新手還是機器學習專家,都可以利用Machine Learning (ML) 功能從資料中取得洞見。Machine Learning 是一種 Amazon Redshift 功能,可讓您使用 SQL 命令建立、訓練和部署 ML 模型,而不需要廣泛的 ML 專業知識或複雜的資料工程。
以下各節會引導您使用 Machine Learning,讓您透過 Amazon Redshift 釋放資料的完整潛力。
Amazon Redshift ML 可讓您使用單一 SQL CREATE MODEL 命令來訓練模型。CREATE MODEL 命令會建立一個模型,讓 Amazon Redshift 使用此模型來產生具有熟悉 SQL 建構模組的模型式預測。
當您沒有機器學習、工具、語言、演算法和 API 的專業知識時,Amazon Redshift ML 會特別有用。使用 Amazon Redshift ML 時,您不必執行與外部機器學習服務整合所需的無差別繁重工作。Amazon Redshift 可為您節省格式化和移動資料、管理許可控制或建置自訂整合、工作流程和指令碼的時間。您可以輕鬆使用熱門的機器學習演算法,並簡化從訓練到預測期間頻繁迭代的訓練需求。Amazon Redshift 會自動探索最佳演算法,並針對您的問題調整最佳模型。您可以從 Amazon Redshift 叢集中進行預測,而不需要將資料移出 Amazon Redshift,也不需要與其他服務互動並支付費用。
Amazon Redshift ML 可支援資料分析師和資料科學家使用機器學習。這也讓機器學習專家可以利用他們的知識來引導 CREATE MODEL 陳述式僅使用他們指定的層面。透過這樣做,您可以加快 CREATE MODEL 需要找到最佳候選項目的時間,提高模型的準確性,或兩者兼具。
CREATE MODEL 陳述式可在如何指定訓練工作的參數上提供彈性。使用此彈性,機器學習新手或專家就可以選擇自己喜歡的預處理器、演算法、問題類型和超參數。例如,對客戶流失感興趣的使用者可能會針對 CREATE MODEL 陳述式指定問題類型為二進制分類,而這非常適用於客戶流失。然後,CREATE MODEL 陳述式會將最佳模型的搜尋範圍縮小為二進制分類模型。即使使用者選擇了問題類型,CREATE MODEL 陳述式仍然可以使用許多選項。例如,CREATE MODEL 會探索並套用最佳的預處理轉換,並探索最佳的超參數設定。
Amazon Redshift ML 使用 Amazon SageMaker AI Autopilot 自動尋找最佳模型,讓訓練更輕鬆。在幕後,Amazon SageMaker AI Autopilot 會根據您提供的資料,自動訓練和調校最佳的機器學習模型。然後,Amazon SageMaker AI Neo 會編譯訓練模型,並在 Redshift 叢集中提供預測。當您使用訓練的模型執行機器學習推論查詢時,查詢可以使用 Amazon Redshift 的大量平行處理功能。同時,查詢可以使用以機器學習為基礎的預測。
-
身為機器學習初學者,您可能對於機器學習的不同層面有大致了解,例如預處理器、演算法和超參數,請只針對您指定的層面使用 CREATE MODEL 陳述式。然後您可以縮短 CREATE MODEL 需要找到最佳候選項目的時間,或是提高模型的準確性。此外,您可以透過引入其他領域知識 (例如問題類型或目標),來增加預測的商業價值。例如,在客戶流失案例中,如果「客戶不活躍」的結果很少見,則 F1 目標通常高於準確度目標。因為高準確度模型可能會一直預測到「客戶很活躍」,此結果雖然具有高準確度,但商業價值很小。如需 F1 目標的相關資訊,請參閱《Amazon SageMaker AI API 參考》中的 AutoMLJobObjective。
如需 CREATE MODEL 陳述式之基本選項的相關資訊,請參閱 簡易 CREATE MODEL。
-
若身為機器學習進階從業人員,您可以為某些 (但不是全部) 特徵指定問題類型和預處理器。然後,CREATE MODEL 會遵循您在指定層面上提供的建議。同時,CREATE MODEL 仍會發現用於其餘特徵的最佳的預處理器和最佳超參數。如需如何限制訓練管道的一或多個層面的相關資訊,請參閱 CREATE MODEL 和使用者指引。
-
若是身為機器學習專家,您可以完全掌控訓練和超參數調整。然後 CREATE MODEL 陳述式就不會嘗試探索最佳的預處理器、演算法和超參數,因為您做出了所有選擇。如需如何搭配 AUTO OFF 使用 CREATE MODEL 的相關資訊,請參閱 CREATE XGBoost 模型與 AUTO OFF。
-
身為資料工程師,您可以在 Amazon SageMaker AI 中引入預先訓練的 XGBoost 模型,並將其匯入 Amazon Redshift 以進行本機推論。透過自備模型 (BYOM),您可以使用在 Amazon Redshift 之外訓練的模型搭配 Amazon SageMaker AI,在 Amazon Redshift 本機進行資料庫內推論。Amazon Redshift ML 支援使用 BYOM 進行本機或遠端推論。
如需如何針對本機或遠端推論使用 CREATE MODEL 陳述式的相關資訊,請參閱 使用自有模型 (BYOM) - 本機推論。
身為 Amazon Redshift ML 使用者,您可以選擇下列任何選項來訓練和部署模型:
-
問題類型,請參閱 CREATE MODEL 和使用者指引。
-
模型類型,請參閱 CREATE XGBoost 模型與 AUTO OFF。
-
預處理器,請參閱 CREATE MODEL 和使用者指引。
-
超參數,請參閱 CREATE XGBoost 模型與 AUTO OFF。
-
使用自有模型 (BYOM),請參閱 使用自有模型 (BYOM) - 本機推論。