核心概念
大規模言語モデルの答案生成能力を向上させるため、検索結果の統合方法を探索し、不確実性のモデル化と事後融合の活用が有効であることを示した。
摘要
本研究は、大規模言語モデル(LLM)と検索結果を統合する最適な手法を探索している。
- 単純な検索結果の連結では、正解が含まれていても「不明」な出力が20%程度発生する課題がある。
- 代替手法として、各検索結果を個別にLLMに入力し、多数決で最終答案を決める方法を検討したが、正解が多数派の答案にならない問題がある。
- そこで以下の4つの統合手法を提案した:
- 連結 + 事後融合: 最初に連結アプローチで答案を生成し、「不明」の場合に事後融合で再度答案を生成する。
- 事後融合 + 連結: 事後融合で候補答案を生成し、その後連結アプローチで最終答案を決める。
- 剪定プロンプト: 関連性の低い検索結果を排除し、関連性の高い結果のみをLLMに入力する。
- 要約プロンプト: 検索結果を要約してLLMに入力する。
これらの手法を3つの質問応答データセットで評価した結果、提案手法は従来の連結アプローチに比べて10%以上の精度向上を達成した。特に、連結 + 事後融合が最も優れた性能を示した。
統計資料
検索結果を連結して入力した場合、約20%の回答で「不明」が出力された。
検索結果を個別に入力し多数決で答案を決めた場合、正解が多数派の答案にならない割合が12%から22%に増加した。
引述
「大規模言語モデル(LLM)は、限られた知識表現のため、オープンドメインの質問応答において不正確さや詳細不足に悩まされることがある。」
「検索結果を LLM に統合する効果的な戦略は、相対的に研究が少ない分野である。」