翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
検索拡張生成
基盤モデルは通常オフラインでトレーニングされるため、モデルはモデルのトレーニング後に作成されたどのデータにも依存しません。さらに、基盤モデルは非常に一般的なドメインコーパスでトレーニングされるため、ドメイン固有のタスクにはあまり効果的ではありません。Retrieval Augmented Generation (RAG) を使用して、基盤モデルの外側からデータを取得し、コンテキストに関連する取得したデータを追加することでプロンプトを補強できます。RAG モデルアーキテクチャの詳細については、「Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks
を使用するとRAG、プロンプトの拡張に使用される外部データは、ドキュメントリポジトリ、データベース、 などの複数のデータソースから取得できますAPIs。最初のステップは、関連性検索を実行するために、ドキュメントとユーザークエリを互換性のある形式に変換することです。形式を互換性のあるものにするために、ドキュメントコレクションまたはナレッジライブラリ、およびユーザーが送信したクエリを、埋め込み言語モデルを使用して数値表現に変換します。埋め込みとは、ベクトル空間でテキストに数値表現を与えるプロセスです。RAG モデルアーキテクチャは、ナレッジライブラリのベクトル内のユーザークエリの埋め込みを比較します。その後、元のユーザープロンプトに、ナレッジライブラリ内の類似ドキュメントからの関連コンテキストが追加されます。次に、この拡張プロンプトが基盤モデルに送信されます。ナレッジライブラリと関連する埋め込みは非同期で更新できます。
取得したドキュメントは、プロンプトを補強するのに役立つコンテキストを含むのに十分な大きさにする必要がありますが、プロンプトの最大シーケンス長に収まるのに十分な大きさにする必要があります。の一般テキスト埋め込み (GTE) JumpStart モデルなど、タスク固有のモデルを使用できます。Hugging Face、プロンプトとナレッジライブラリドキュメントの埋め込みを提供します。プロンプトとドキュメントの埋め込みを比較して最も関連性の高いドキュメントを見つけたら、補足コンテキストで新しいプロンプトを作成します。次に、拡張プロンプトを選択したテキスト生成モデルに渡します。
サンプルノートブックの例
RAG 基盤モデルソリューションの詳細については、次のノートブックの例を参照してください。
Amazon SageMaker サンプルリポジトリ