準備和上傳訓練資料以進行以指示為基礎的微調建立以指示為基礎的微調訓練任務範例筆記本

使用提示指示微調大型語言模型 (LLM)

指令式微調使用標籤的範例來改善預先訓練的基礎模型在特定任務上的效能。帶有標籤的範例依指令被格式化為提示、回應和用詞。此微調程序會改變模型的權重。有關指令式微調的更多資訊，請參閱文獻FLAN 簡介：更通用的指令微調語言模型和擴展指令微調的語言模型。

微調語言網路 (FLAN) 模型使用指令調整，讓模型更適合解決一般下游 NLP 任務。Amazon SageMaker JumpStart 在 FLAN 模型系列中提供了許多基礎模型。例如，FLAN-T5 模型會針對各種任務進行指令微調，以提升各種常見使用案例的零樣本表現。透過額外的資料和微調，指令式模型可以進一步適應訓練期間沒考慮到的更具體任務。

若要使用提示-回應對任務指示，在特定任務上微調 LLM：

在 JSON 檔案中準備您的說明。如需提示回應對檔案所需格式和資料資料夾結構的詳細資訊，請參閱準備和上傳訓練資料以進行以指示為基礎的微調。
建立您的微調訓練任務。如需說明，請參閱建立以指示為基礎的微調訓練任務。

您可以在中找到end-to-end範例範例筆記本。

只有一部分 JumpStart 基礎模型與以指令為基礎的微調相容。指令式網域適應性微調適用於下列基礎模型：

注意

有些 JumpStart 基礎模型，例如 Llama 2 7B，需要接受最終使用者授權合約，才能微調和執行推論。如需詳細資訊，請參閱終端使用者授權協議。

Flan-T5 基礎
Flan-T5 大型
Flan-T5 小型
Flan-T5 XL
Flan-T5 XXL
Llama 2 13B
Llama 2 13B 聊天
Llama 2 13B Neuron
Llama 2 70B
Llama 2 70B 聊天
Llama 2 7B
Llama 2 7B 聊天
Llama 2 7B Neuron
混合 7B
RedPajama INCITE Base 3B V1
RedPajama INCITE Base 7B V1
RedPajama INCITE 聊天 3B V1
RedPajama INCITE 聊天 7B V1
RedPajama INCITE 指示 3B V1
RedPajama INCITE 指示 7B V1

準備和上傳訓練資料以進行以指示為基礎的微調

指示型微調的訓練資料必須以 JSON Lines 文字檔案格式提供，其中每一行都是字典。所有訓練資料都必須位於單一資料夾中。資料夾可以包含多個 .jsonl 檔案。

訓練資料夾也可以包含範本 JSON 檔案 (template.json)，描述資料的輸入和輸出格式。如果未提供範本檔案，則會使用下列範本檔案：


{
  "prompt": "Below is an instruction that describes a task, paired with an input that provides further context. Write a response that appropriately completes the request.\n\n### Instruction:\n{instruction}\n\n### Input:\n{context}",
  "completion": "{response}"
}

根據 template.json 檔案，訓練資料的每個 .jsonl 項目必須包含 {instruction}、 {context}和 {response} 欄位。

如果您提供自訂範本 JSON 檔案，請使用 "prompt"和 "completion"金鑰來定義您自己的必要欄位。根據下列自訂範本 JSON 檔案，訓練資料的每個 .jsonl 項目必須包含 {question}、 {context}和 {answer} 欄位：


{
  "prompt": "question: {question} context: {context}",
  "completion": "{answer}"
}

用於訓練和測試的分割資料

您可以選擇性地提供另一個包含驗證資料的資料夾。此資料夾也應該包含一或多個 .jsonl 檔案。如果未提供驗證資料集，則會將訓練資料的集合量設為保留，以供驗證之用。當您選擇超參數來微調模型時，可以調整用於驗證的訓練資料百分比。

將微調資料上傳至 Amazon S3

將準備好的資料上傳至 Amazon Simple Storage Service (Amazon S3)，以便在微調 JumpStart 基礎模型時使用。您可以使用下列命令來上傳資料：


from sagemaker.s3 import S3Uploader
import sagemaker
import random

output_bucket = sagemaker.Session().default_bucket()
local_data_file = "train.jsonl"
train_data_location = f"s3://{output_bucket}/dolly_dataset"
S3Uploader.upload(local_data_file, train_data_location)
S3Uploader.upload("template.json", train_data_location)
print(f"Training data: {train_data_location}")

建立以指示為基礎的微調訓練任務

將資料上傳至 Amazon S3 之後，您可以微調和部署 JumpStart 基礎模型。若要在 Studio 中微調模型，請參閱在 Studio 中微調模型。若要使用 SageMaker Python SDK 微調模型，請參閱使用 JumpStartEstimator類別微調公開可用的基礎模型。

範例筆記本

如需以指示為基礎的微調的詳細資訊，請參閱下列範例筆記本：

您的瀏覽器已停用或無法使用 Javascript。

您必須啟用 Javascript，才能使用 AWS 文件。請參閱您的瀏覽器說明頁以取得說明。

文件慣用形式

使用網域調整來微調模型

擷取增強產生