Kernkonzepte
大規模言語モデルの検索拡張生成において、クエリを多様性と情報量を考慮して複数回書き換えることで、より適切な文書検索と回答生成が可能になる。
Zusammenfassung
DMQR-RAG: 多様な複数クエリ書き換えによる検索拡張生成
本論文は、検索拡張生成 (RAG) における文書検索と最終的な回答の質を向上させることを目的とした、多様な複数クエリ書き換えフレームワーク (DMQR-RAG) を提案しています。
静的な知識ベースと幻覚の問題を抱える大規模言語モデル (LLM) に対し、検索拡張生成 (RAG) における文書検索の精度を向上させる。
従来の単一クエリ書き換えや多様性に欠ける複数クエリ書き換えの限界を克服し、多様性と情報量を考慮した複数クエリ書き換え手法を提案する。
情報量に基づく複数クエリ書き換え戦略の提案:
情報の等価性: 元のクエリを洗練する「一般的なクエリ書き換え (GQR)」と、検索エンジンに適した「キーワード書き換え (KWR)」
情報の拡張: 事前情報を加える「擬似回答書き換え (PAR)」
情報の削減: 重要な情報のみを抽出する「コアコンテンツ抽出 (CCE)」
適応的な書き換え戦略選択方法の導入:
軽量なプロンプトと少数 shot 学習を用いて、各クエリに最適な書き換え戦略を動的に選択する。