

本文為英文版的機器翻譯版本，如內容有任何歧義或不一致之處，概以英文版為準。

# SageMaker AI 中的模型部署
<a name="model-deploy-mlops"></a>

一旦您訓練並核准用於生產的模型，請使用 SageMaker AI 將模型部署到端點以進行即時推論。SageMaker AI 提供多個推論選項，以便您可以挑選最適合自己工作負載的選項。您也可以透過選擇執行個體類型和執行個體數量來設定端點，以獲得最佳效能。如需與模型部署相關的詳細資訊，請參閱[部署用於推論的模型](deploy-model.md)。



將模型部署到生產環境之後，您可能想要探索進一步最佳化模型效能的方法，同時維持目前模型的可用性。例如，您可以設定陰影測試，在提交變更之前嘗試不同的模型或模型服務基礎設施。SageMaker AI 會以陰影模式部署新模型、容器或執行個體，並在相同端點內為其即時路由傳送一份推論請求副本。您可以記錄陰影變體的回應，以便進行比較。如需與陰影測試相關的詳細資訊，請參閱[陰影測試](shadow-tests.md)。如果您決定繼續變更模型，可以透過部署防護機制控制從目前模型到新模型的切換。您能為流量轉移程序選取藍/綠或 Canary 測試等方法，以便在更新期間維持精細控制。如需與部署防護機制相關的詳細資訊，請參閱[部署防護機制以更新生產環境中的模型](deployment-guardrails.md)。