Conceitos essenciais
大規模言語モデル (LLM) を用いた質問応答システムにおいて、検索された文書の関連性をLLMが正確に評価できるようにすることで、外部知識の活用を最適化し、より正確な回答生成を可能にする。
Resumo
REAR: 関連性認識型検索拡張フレームワーク
この論文では、オープン領域質問応答 (QA) におけるLLMの外部知識活用を最適化するため、関連性認識型検索拡張フレームワークREARが提案されています。従来のRAG (Retrieval-Augmented Generation) システムでは、LLMは検索された文書の関連性を正確に評価できず、誤った情報に基づいた回答を生成する可能性がありました。REARは、LLMに文書の関連性評価能力を付与することで、この問題に対 addressing します。
REARは、関連性評価、関連性に基づく生成、知識の信頼性検証の3つのステップで構成されています。
関連性評価
まず、LLMを用いてクエリと文書のペアを関連性埋め込みにマッピングし、評価モジュールによって関連性スコアを算出します。
関連性に基づく生成
関連性スコアを埋め込み層でデンスベクトルに変換し、LLMに提供することで、関連性の度合いに応じた回答生成を誘導します。
知識の信頼性検証
生成された回答の信頼性を検証するために、ソースの信頼性と知識の整合性という2つの観点から評価を行います。
ソースの信頼性
LLMが文書に高い関連性スコアを付与した場合、その文書に基づいた回答は信頼性が高いとみなされます。
知識の整合性
LLMのパラメトリック知識と外部知識との間に矛盾がないかを検証します。具体的には、関連性スコアをゼロに設定して回答を生成し、その尤度を計算することで、LLMが自身の知識に基づいて回答を生成できているかを評価します。
REARの学習には、二段階関連性融合とノイズ耐性学習という2つの手法が用いられます。
二段階関連性融合
従来の二値分類タスクに加えて、選好ベースの細粒度タスクを導入することで、より正確な関連性評価を実現します。
ノイズ耐性学習
負例となる文書をコーパスに追加することで、LLMのノイズに対する識別能力を高めます。