核心概念
KGDGにおけるシーケンスレベルの確信度が幻覚を減少させることを提案する。
摘要
この研究では、KGDG(Knowledge Grounded Dialogue Generation)におけるシーケンスレベルの確信度と幻覚の関係を探求しています。モデル予測の確信度を確率的確信度と意味的確信度に分解し、Probabilistic CRR(P-CRR)とSemantic CRR(S-CRR)を提案しています。これらの手法は、異なるサイズや構造の4つのモデルで実験され、KGDGタスクにおけるモデル幻覚の削減効果が証明されています。
統計資料
Probabilistic Certainty: 0.265 (p値 ≪ 0.01)
Semantic Certainty: 0.165 (p値 ≪ 0.01)
引述
"Both types of sequence-level certainty are negatively and significantly correlated with hallucination probability."
"Among different decoding methods assessed, Nucleus Sampling with Top-k and P-CRR achieves the best performance."