

本文為英文版的機器翻譯版本，如內容有任何歧義或不一致之處，概以英文版為準。

# 使用 Amazon SageMaker AI 自訂模型
<a name="customize-model"></a>

Amazon SageMaker AI 模型自訂是一項功能，可將傳統上複雜且耗時的 AI 模型自訂程序，從長達數月的工作轉換為可在數天內完成的簡化工作流程。此功能可解決 AI 開發人員面臨的關鍵挑戰，這些開發人員需要使用專屬資料自訂基礎模型，以建立高度差異化的客戶體驗。本 SageMaker AI 指南提供詳細的自訂文件，包括step-by-step指南和進階組態選項。如需 Nova 模型自訂的簡短概觀，請參閱《Amazon Nova 使用者指南》中的[使用 SageMaker 自訂和微調](https://docs.aws.amazon.com/nova/latest/userguide/customize-fine-tune-sagemaker.html)。

該功能包括新的引導式使用者介面，可了解自然語言需求，並具有一套完整的進階模型自訂技術，所有技術均採用無伺服器基礎設施，可消除管理運算資源的操作開銷。無論您是要建置法律研究應用程式、增強客戶服務聊天機器人，還是開發特定領域的 AI 代理器，此功能都能加速從proof-of-concept到生產部署的路徑。

採用 Amazon Bedrock Evaluations 技術的模型自訂功能可能會安全地跨 AWS 區域 地理位置傳輸資料以進行處理。如需詳細資訊，請存取 [Amazon Bedrock 評估文件](https://docs.aws.amazon.com/bedrock/latest/userguide/evaluation-judge.html)。

## 重要概念
<a name="model-customize-concepts"></a>

**無伺服器訓練**

全受管的運算基礎設施，可消除所有基礎設施的複雜性，讓您僅專注於模型開發。這包括根據模型大小和訓練需求自動佈建 GPU 執行個體 (P5、P4de, P4d, G5)、納入每種自訂技術最佳實務的預先最佳化訓練配方、使用可透過 UI 存取的即時指標和日誌進行即時監控，以及在訓練完成後自動清理資源以最佳化成本。

**模型自訂技術**

完整的進階方法集，包括監督式微調 (SFT)、直接偏好最佳化 (DPO)、具有可驗證獎勵的強化學習 (RLVR)，以及具有 AI 意見回饋的強化學習 (RLAIF)。

**自訂模型**

基礎模型的特殊版本，已根據自己的資料進行訓練，以適應特定使用案例，進而產生 AI 模型，保留原始基礎模型的一般功能，同時新增專為您的需求量身打造的領域特定知識、術語、風格或行為。

**AI 模型自訂資產**

用於在模型自訂過程中訓練、精簡和評估自訂模型的資源和成品。這些資產包括**資料集**、 是訓練範例的集合 (prompt-response 配對、 網域特定文字、 或標記的資料） 用於微調基礎模型，以學習特定行為， 知識、 或 樣式、 和**評估者** 這是透過任一***獎勵函數***評估和改善模型效能的機制 （以程式碼為基礎的邏輯，可根據特定條件對模型輸出進行評分， 用於 RLVR 訓練和自訂評分器評估） 或***獎勵提示 ***（引導 LLM 判斷模型回應品質的自然語言指示， 用於 RLAIF 訓練和 LLM-as-a-judge 評估）。

**模型套件群組**

一種集合容器，可追蹤來自訓練任務的所有記錄模型，為模型版本及其歷程提供集中位置。

**已記錄的模型**

執行無伺服器訓練任務時SageMaker AI 建立的輸出。這可以是微調的模型 （成功任務）、檢查點 （使用檢查點的失敗任務） 或相關聯的中繼資料 （沒有檢查點的失敗任務）。

**已註冊的模型**

已標記為正式追蹤和管理目的的記錄模型，可實現完整的歷程和生命週期管理。

**譜系**

會自動擷取訓練任務、輸入資料集、輸出模型、評估任務和跨 SageMaker AI 和 Amazon Bedrock 部署之間的關係。

**跨帳戶共用**

能夠使用 AWS Resource Access Manager (RAM) 跨 AWS 帳戶共用模型、資料集和評估器，同時保持完整的歷程可見性。