本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
使用 AWS 探DeepRacer索強化學習
強化學習,特別是深度強化學習,已證明在解決廣範圍的自動決策問題中相當有效。它的應用範圍涉及金融交易、資料中心冷卻、機群邏輯和自動競賽等。
強化學習具有解決現實世界問題的潛力。但是,由於其廣泛的技術範圍和深度,它具有陡峭的學習曲線。現實世界的實驗需要您構建物理代理,例如自動駕駛賽車。它還要求您確保實際環境的安全,例如行車軌道或公共道路。這使得環境可能相當昂貴、危險和耗時。這些需求遠超過僅只是為了了解強化學習的範圍。
為了協助減少學習曲線,AWS 以三種方式DeepRacer簡化程序:
-
在訓練和評估強化學習模型時提供step-by-step指導。該指南包括預先定義的環境、狀態和行動,以及可自訂的獎勵功能。
-
提供模擬器以模擬虛擬代理程式與虛擬環境之間的互動。
-
使用 AWS DeepRacer 車輛作為實體代理程式。使用車輛,來在實體環境中評估訓練模型。這非常類似於現實世界的使用案例。
如果您是經驗豐富的機器學習從業人員,AWS 將是DeepRacer一個值得歡迎的機會,在虛擬和實體環境中為自主競賽建立強化學習模型。總而言之,使用 AWS 建DeepRacer立自動競賽的強化學習模型,請遵循下列步驟:
針對自動競賽訓練自訂強化學習模型。使用整合的 AWS 主DeepRacer控台執行此操作SageMaker。
使用 AWS 模擬DeepRacer器評估模型,並在虛擬環境中測試自主競賽。
將訓練有素的模型部署到 AWS DeepRacer 模型車輛,以在實體環境中測試自動駕駛賽車。