本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
適用於新手和專家的機器學習
使用 Amazon Redshift,無論您是新手還是 ML 專家,都可以利用Machine Learning (ML) 功能從資料中取得洞見。Machine Learning 是一種 Amazon Redshift 功能,可讓您使用 SQL 命令建立、訓練和部署 ML 模型,而不需要廣泛的 ML 專業知識或複雜的資料工程。
下列各節會引導您完成使用 Machine Learning 的程序,讓您透過 Amazon Redshift 釋放資料的完整潛力。
Amazon Redshift ML 可讓您使用單一SQLCREATEMODEL命令來訓練模型。此CREATEMODEL命令會建立模型,讓 Amazon Redshift SQL 使用熟悉的建構產生模型型預測。
當您在機器學習、工具、語言、演算法和 方面沒有專業知識時,Amazon Redshift ML 特別有用APIs。使用 Amazon Redshift ML 時,您不必執行與外部機器學習服務整合所需的無差別繁重工作。Amazon Redshift 可為您節省格式化和移動資料、管理許可控制或建置自訂整合、工作流程和指令碼的時間。您可以輕鬆使用熱門的機器學習演算法,並簡化從訓練到預測期間頻繁迭代的訓練需求。Amazon Redshift 會自動探索最佳演算法,並針對您的問題調整最佳模型。您可以從 Amazon Redshift 叢集中進行預測,而不需要將資料移出 Amazon Redshift,也不需要與其他服務互動並支付費用。
Amazon Redshift ML 可支援資料分析師和資料科學家使用機器學習。機器學習專家也可以使用其知識來引導CREATEMODEL陳述式只使用其指定的層面。透過這樣做,您可以加快尋找最佳候選者CREATEMODEL所需的時間、提高模型的準確性,或兩者兼有。
此CREATEMODEL陳述式可讓您靈活地指定訓練任務的參數。使用此彈性,機器學習新手或專家就可以選擇自己喜歡的預處理器、演算法、問題類型和超參數。例如,對客戶流失感興趣的使用者可能會針對問題類型為二進位分類的CREATEMODEL陳述式指定 ,該分類非常適合客戶流失。然後,CREATEMODEL陳述式會縮小其對最佳模型的搜尋範圍,使其成為二進位分類模型。即使使用者選擇問題類型,仍可使用CREATEMODEL陳述式的許多選項。例如, 會CREATEMODEL探索並套用最佳的預先處理轉換,並探索最佳的超參數設定。
Amazon Redshift ML 使用 Amazon SageMaker Autopilot 自動尋找最佳模型,讓訓練更輕鬆。在幕後,Amazon SageMaker Autopilot 會根據您提供的資料,自動訓練和調整最佳的機器學習模型。然後,Amazon SageMaker Neo 會編譯訓練模型,並在 Redshift 叢集中提供預測。當您使用訓練的模型執行機器學習推論查詢時,查詢可以使用 Amazon Redshift 的大量平行處理功能。同時,查詢可以使用以機器學習為基礎的預測。
-
作為機器學習入門者,具有機器學習不同層面的一般知識,例如前置處理器、演算法和超參數,請僅針對您指定的層面使用 CREATEMODEL陳述式。然後,您可以縮短尋找最佳候選者或提高模型準確性CREATEMODEL所需的時間。此外,您可以透過引入其他領域知識 (例如問題類型或目標),來增加預測的商業價值。例如,在客戶流失案例中,如果「客戶不活躍」的結果很少見,則 F1 目標通常高於準確度目標。因為高準確度模型可能會一直預測到「客戶很活躍」,此結果雖然具有高準確度,但商業價值很小。如需 F1 目標的相關資訊,請參閱 Amazon SageMaker API 參考 中的utoMLJob目標。
如需CREATEMODEL陳述式基本選項的詳細資訊,請參閱 簡單 CREATE MODEL。
-
若身為機器學習進階從業人員,您可以為某些 (但不是全部) 特徵指定問題類型和預處理器。然後CREATEMODEL遵循您在指定方面的建議。同時, CREATEMODEL仍會探索其他功能的最佳前置處理器和最佳超參數。如需如何限制訓練管道的一或多個層面的相關資訊,請參閱 CREATE MODEL 使用使用者指南。
-
若是身為機器學習專家,您可以完全掌控訓練和超參數調整。然後,CREATEMODEL陳述式不會嘗試探索最佳的前置處理器、演算法和超參數,因為您做出了所有選擇。如需如何CREATEMODEL搭配 AUTO 使用的詳細資訊OFF,請參閱 CREATE XGBoost 具有 的模型 AUTO OFF。
-
身為資料工程師,您可以在 Amazon 中引進預先訓練的XGBoost模型, SageMaker 並將其匯入 Amazon Redshift 以進行本機推論。透過自備模型 (BYOM),您可以使用在 Amazon Redshift 之外與 Amazon SageMaker 一起訓練的模型,在 Amazon Redshift 本機進行資料庫內推論。Amazon Redshift ML 支援在本機或遠端推論BYOM中使用 。
如需如何使用CREATEMODEL陳述式進行本機或遠端推論的詳細資訊,請參閱 自備模型 (BYOM) - 本機推論。
身為 Amazon Redshift ML 使用者,您可以選擇下列任何選項來訓練和部署模型:
-
問題類型,請參閱 CREATE MODEL 使用使用者指南。
-
目標,請參閱 CREATE MODEL 使用使用者指南 或 CREATE XGBoost 具有 的模型 AUTO OFF。
-
模型類型,請參閱 CREATE XGBoost 具有 的模型 AUTO OFF。
-
預處理器,請參閱 CREATE MODEL 使用使用者指南。
-
超參數,請參閱 CREATE XGBoost 具有 的模型 AUTO OFF。
-
攜帶您自己的模型 (BYOM),請參閱 自備模型 (BYOM) - 本機推論。