本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
在 Studio 中微調模型
微調會在新資料集上訓練預先訓練的模型,而不需要從頭開始訓練。這個程序也稱為移轉學習,可以利用較小的資料集和較短的訓練時間來產生精確的模型。若要微調基礎模型,請在 Studio JumpStartUI 中導覽至模型詳細資訊卡。如需如何在 Studio JumpStart 中開啟的詳細資訊,請參閱 在 Studio JumpStart 中開啟和使用。導覽至您選擇的模型詳細資訊卡後,請在右上角選擇訓練。請注意,並非所有模型都有可用的微調。
重要
某些基礎模型需要明確接受最終使用者授權合約 (EULA),才能進行微調。如需詳細資訊,請參閱EULA 在 Amazon SageMaker Studio 中接受。
模型設定
在 Amazon SageMaker Studio 中使用預先訓練 JumpStart 的基礎模型時,預設會填入模型成品位置 (Amazon S3URI)。若要編輯預設 Amazon S3URI,請選擇輸入模型成品位置 。並非所有模型都支援變更模型成品位置。
資料設定
在資料欄位中,提供訓練資料集位置的 Amazon S3 URI點。預設 Amazon S3 URI會指向範例訓練資料集。若要編輯預設 Amazon S3URI,請選擇輸入訓練資料集並變更 URI。請務必檢閱 Amazon SageMaker Studio 中的模型詳細資訊卡,以取得格式化訓練資料的相關資訊。
超參數
您可以自訂用於微調模型的訓練工作的超參數。每個可微調模型的可用超參數視模型而有所不同。
以下超參數在模型中很常見:
-
時期 - 一個時期是整個資料集的一個循環。一個批次包括多個間隔,多個批次最終組成一個時期。執行多個週期,直到模型的精準度達到可接受的程度,或者當誤差率降至可接受的程度以下為止。
-
學習速率 - 值應該在時期之間改變的量。在改良模型時,會推動其內部權重,並檢查錯誤率以查看模型是否有所改善。典型的學習速率是 0.1 或 0.01,其中 0.01 是較小的調整,可能會導致訓練需要很長時間才能收斂,而 0.1 則大得多,可能導致訓練過衝。它是您可以調整以訓練模型的主要超參數之一。請注意,對於文字模型,較小的學習率 (5e-5 表示 BERT) 可能會導致更準確的模型。
-
批次大小 – 從資料集中選取每個間隔要傳送至 GPUs 以進行訓練的記錄數目。
在 Studio UI 中檢閱模型詳細資訊卡中的工具提示提示和其他資訊,以進一步了解您選擇的模型特有超參數。
如需可用超參數的詳細資訊,請參閱 通常支援的微調超參數。
部署
指定訓練任務的訓練執行個體類型和輸出成品位置。您只能在微調 Studio UI 時,從與您所選模型相容的執行個體中進行選擇。預設輸出成品位置是 SageMaker 預設儲存貯體。若要變更輸出成品位置,請選擇輸入輸出成品位置並變更 Amazon S3URI。
安全
指定要用於訓練任務的安全設定,包括 SageMaker 用於訓練模型IAM的角色、訓練任務是否應連線至虛擬私有雲端 (VPC),以及任何加密金鑰來保護您的資料。
其他資訊
在其他資訊欄位中,您可以編輯訓練任務名稱。您也可以以鍵值對的形式新增和移除標籤,以協助整理和分類微調訓練任務。
提供微調組態的資訊後,請選擇提交 。如果您選擇進行微調的預先訓練基礎模型在訓練之前需要使用者授權合約 (EULA) 的明確協議,EULA則會在快顯視窗中提供 。若要接受 的條款EULA,請選擇接受 。在下載或使用模型之前,您有責任審查並遵守任何適用的授權條款,並確保這些條款適用於您的使用案例。