提交模型自訂任務 - Amazon Bedrock

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

提交模型自訂任務

您可以在 Amazon Bedrock 主控台或 API 中使用微調或持續預先訓練來建立自訂模型。自訂任務可能需要幾個小時的時間。工作的持續時間取決於訓練資料的大小 (記錄數量、輸入記號和輸出記號)、時期數和批次大小。選擇您偏好方法的索引標籤,然後遵循下列步驟:

Console

若要在主控台中提交模型自訂任務,請執行下列步驟。

  1. AWS Management Console 使用具有 Amazon Bedrock 許可的 IAM 角色登入 ,然後開啟位於 https://https://console.aws.amazon.com/bedrock/ 的 Amazon Bedrock 主控台。

  2. 從左側導覽窗格中,選擇基礎模型下的自訂模型。

  3. 模型索引標籤中,選擇自訂模型,然後根據您想要訓練的模型類型,建立微調任務建立持續預先訓練任務

  4. 模型詳細資訊區段中,執行下列動作。

    1. 選擇您要使用自己的資料自訂的模型,並為產生的模型命名。

    2. (選用) 根據預設,Amazon Bedrock 會使用 擁有和管理的金鑰來加密模型 AWS。若要使用自訂 KMS 金鑰,請選取模型加密並選擇金鑰。

    3. (選用) 若要將標籤與自訂模型建立關聯,請展開標籤區段,然後選取新增標籤

  5. 任務組態區段中,輸入任務的名稱,並選擇性地新增要與任務建立關聯的任何標籤。

  6. (選用) 若要使用虛擬私有雲端 (VPC) 來保護您的訓練資料和自訂任務,請在 VPC 設定區段中選取包含輸入資料和輸出資料 Amazon S3 位置、其子網路和安全群組的 VPC。

    注意

    如果您包含 VPC 組態,主控台就無法為任務建立新的服務角色。建立自訂服務角色,並新增與 中所述範例類似的許可將VPC許可連接至模型自訂角色

  7. 輸入資料區段中,選取訓練資料集檔案的 S3 位置,並在適用時選取驗證資料集檔案。

  8. 超參數區段中,輸入要在訓練中使用的超參數值。

  9. 輸出資料區段中,輸入 Amazon Bedrock 應儲存任務輸出的 Amazon S3 位置。Amazon Bedrock 會將每個 epoch 的訓練損失指標和驗證遺失指標,儲存在您指定之位置的不同檔案中。

  10. 服務存取區段中,選取下列其中一項:

    • 使用現有服務角色 — 從下拉式清單中選取服務角色。如需有關使用適當許可權設定自訂角色的詳細資訊,請參閱 建立模型自訂的服務角色

    • 建立並使用新的服務角色 — 輸入服務角色的名稱。

  11. 選擇微調模型建立持續預先訓練任務以開始任務。

API

請求

使用 Amazon Bedrock 控制平面端點傳送 CreateModelCustomizationJob (請參閱請求和回應格式和欄位詳細資訊的連結) 請求,以提交模型自訂任務。您至少必須提供下列欄位。

  • roleArn – 具有自訂模型許可的服務角色 ARN。如果您使用 主控台,Amazon Bedrock 可以自動建立具有適當許可的角色,或者您可以依照 中的步驟建立自訂角色建立模型自訂的服務角色

    注意

    如果您包含 vpcConfig 欄位,請確定角色具有存取 VPC 的適當許可。如需範例,請參閱「將VPC許可連接至模型自訂角色」。

  • baseModelIdentifier – 要自訂的基礎模型的模型 ID 或 ARN。

  • customModelName— 指定新自訂模型的名稱。

  • jobName – 提供訓練工作的名稱。

  • hyperParameters影響模型自訂程序的超參數

  • trainingDataConfig – 包含訓練資料集 Amazon S3 URI 的物件。根據自訂方法和模型,您也可以包含 validationDataConfig。如需準備資料集的詳細資訊,請參閱準備資料集

  • validationDataconfig – 包含驗證資料集 Amazon S3 URI 的物件。

  • outputDataConfig – 包含要寫入輸出資料的 Amazon S3 URI 的物件。

如果您未指定 customizationType,模型自訂方法預設為 FINE_TUNING

若要防止請求完成多次,請包含 clientRequestToken

您可以針對額外組態包含下列選用欄位。

回應

回應會傳回jobArn可用來監控停止任務的 。

請參閱程式碼範例