本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
在 Studio 中微調模型
微調會在新資料集上訓練預先訓練的模型,而不需從頭開始訓練。這個程序也稱為移轉學習,可以利用較小的資料集和較短的訓練時間來產生精確的模型。若要微調 JumpStart 基礎模型,請在 Studio UI 中導覽至模型詳細資訊卡。如需如何在 Studio 中開啟 JumpStart 的詳細資訊,請參閱在 Studio 中開啟和使用 JumpStart 。導覽至您選擇的模型詳細資訊卡後,選擇右上角的訓練。請注意,並非所有模型都有可用的微調。
重要
某些基礎模型需要明確接受最終使用者授權合約 (EULA),才能進行微調。如需詳細資訊,請參閱在 Amazon SageMaker Studio 接受 EULA。
模型設定
在 Amazon SageMaker Studio 中使用預先訓練的 JumpStart 基礎模型時,預設會填入模型成品位置 (Amazon S3 URI)。若要編輯預設的 Amazon S3 URI,請選擇輸入模型成品位置。並非所有模型都支援變更模型成品位置。
資料設定
在資料欄位中,提供訓練資料集位置的 Amazon S3 URI 點。預設 Amazon S3 URI 指向範例訓練資料集。若要編輯預設的 Amazon S3 URI,請選擇輸入訓練資料集並變更 URI。請務必檢閱 Amazon SageMaker Studio 中的模型詳細資訊卡,以取得格式化訓練資料的相關資訊。
超參數
您可以自訂用於微調模型的訓練工作的超參數。每個可微調模型的可用超參數視模型而有所不同。
以下超參數在模型中很常見:
-
時期 - 一個時期是整個資料集的一個循環。一個批次包括多個間隔,多個批次最終組成一個時期。執行多個週期,直到模型的精準度達到可接受的程度,或者當誤差率降至可接受的程度以下為止。
-
學習速率 - 值應該在時期之間改變的量。在改良模型時,會推動其內部權重,並檢查錯誤率以查看模型是否有所改善。典型的學習速率是 0.1 或 0.01,其中 0.01 是較小的調整,可能會導致訓練需要很長時間才能收斂,而 0.1 則大得多,可能導致訓練過衝。它是您可以調整以訓練模型的主要超參數之一。請注意,針對文字模型,較小的學習速率要 (BERT 為 5e-5) 可能會帶來更準確的模型。
-
Batch 大小 - 每個間隔從資料集中選擇要傳送到 GPU 進行訓練的記錄數。
檢閱 Studio UI 中模型詳細資訊卡中的工具提示提示和其他資訊,以進一步了解您選擇的模型特有的超參數。
如需可用超參數的詳細資訊,請參閱通常支援的微調超參數。
部署
為您的訓練任務指定訓練執行個體類型和輸出成品位置。您只能在微調 Studio UI 時,從與您所選模型相容的執行個體中進行選擇。預設輸出成品位置是 SageMaker AI 預設儲存貯體。若要變更輸出成品位置,請選擇輸入輸出成品位置並變更 Amazon S3 URI。
安全
指定用於訓練任務的安全設定,包括 SageMaker AI 用於訓練模型的 IAM 角色、訓練任務是否應連線至虛擬私有雲端 (VPC),以及任何加密金鑰來保護您的資料。
其他資訊
在其他資訊欄位中,您可以編輯訓練任務名稱。您也可以新增和移除鍵值對形式的標籤,以協助組織和分類微調訓練任務。
提供微調組態的資訊之後,請選擇提交。如果您選擇進行微調的預先訓練基礎模型需要在訓練之前明確同意最終使用者授權合約 (EULA),則 EULA 會在快顯視窗中提供。若要接受 EULA 的條款,請選擇接受。在下載或使用模型之前,您有責任審查並遵守任何適用的授權條款,並確保這些條款適用於您的使用案例。