Conceptos Básicos
大規模言語モデルを用いた質問応答システムでは、作り話に基づく誤った回答が生成されることがある。本研究では、適合予測を用いて、検索補強型質問応答システムに対して、回答の正解性を統計的に保証する手法を提案する。
Resumen
本研究は、大規模言語モデルを用いた質問応答システムにおける誤った回答の問題に取り組んでいる。
- 検索補強型質問応答(Retrieval Augmented Question Answering: RAG)は、誤った回答を避けるための有望な手法だが、回答の正確性を保証するものではない。
- そこで本研究では、適合予測を用いた新しい手法「信頼できる検索補強型質問応答(TRAQ)」を提案する。
- TRAQは、検索モデルと生成モデルにそれぞれ適合予測を適用し、得られた予測セットを統合することで、回答の正解性を高い確率で保証する。
- さらに、Bayesian最適化を用いて、予測セットのサイズを最小化する。
- 実験の結果、TRAQは所望の正解性を保ちつつ、予測セットのサイズを平均16.2%削減できることを示した。
Estadísticas
大規模言語モデルを用いた質問応答システムでは、作り話に基づく誤った回答が生成されることがある。
検索補強型質問応答(RAG)は、誤った回答を避けるための有望な手法だが、回答の正確性を保証するものではない。
Citas
"大規模言語モデル(LLM)を用いた質問応答タスクでは、しばしば、作り話に基づく誤った回答が生成される。"
"検索補強型生成(RAG)は、誤った回答を避けるための有望な戦略だが、その正確性を保証するものではない。"