擷取增強型生成

基礎模型通常是離線訓練的，使得模型在訓練模型之後建立的任何資料都是不可知的。此外，基礎模型會在非常一般的網域語料庫上進行訓練，因此對於網域特定任務的效率較低。您可以使用擷取增強型生成（RAG）從基礎模型外部擷取資料，並透過在內容中新增相關擷取資料來增強提示。如需RAG模型架構的詳細資訊，請參閱適用於知識密集型NLP任務的擷取增強型產生。

透過 RAG，用於增強提示的外部資料可以來自多個資料來源，例如文件儲存庫、資料庫或 APIs。第一步是將您的文件和任何使用者查詢轉換為相容的格式，以執行相關性搜尋。為了使格式相容，文件集合或知識庫以及使用者提交的查詢會使用嵌入語言模型轉換成數值表示。嵌入是在向量空間中將文字以數字表示的過程。RAG 模型架構會比較知識程式庫向量內使用者查詢的內嵌。然後，原始使用者提示會附加來自知識庫中類似文件的相關上下文。然後將此增強提示發送到基礎模型。您可以非同步更新知識庫及相關嵌入。

A model architecture diagram of Retrieval Augmented Generation (RAG).

擷取的文件應足夠大，以包含有用的內容，以協助增強提示，但足夠小，以適應提示的最大序列長度。您可以使用任務特定的 JumpStart 模型，例如來自的一般文字內嵌（GTE）模型 Hugging Face，為您的提示和知識庫文件提供內嵌。比較提示和文件內嵌以尋找最相關的文件後，請使用補充內容建構新的提示。然後，將增強型提示傳遞至您選擇的文字產生模型。

範例筆記本

如需RAG基礎模型解決方案的詳細資訊，請參閱下列範例筆記本：

您可以複製 Amazon SageMaker 範例儲存庫，以在 Studio 中您選擇的 Jupyter 環境中執行可用的 JumpStart 基礎模型範例。如需可用於在中建立和存取 Jupyter 的應用程式的詳細資訊 SageMaker，請參閱 Amazon SageMaker 工作室支持的應用。

您的瀏覽器已停用或無法使用 Javascript。

您必須啟用 Javascript，才能使用 AWS 文件。請參閱您的瀏覽器說明頁以取得說明。

文件慣用形式

使用提示指示微調模型

評估模型