Conceitos essenciais
為了增強大型語言模型在問答任務中準確利用外部知識的能力,本文提出了一種名為 REAR 的新型框架,它通過相關性評估模組和針對性訓練策略,有效地識別和利用相關文件,從而提高問答的準確性和可靠性。
摘要
本研究針對開放域問答任務中大型語言模型(LLM)對外部知識利用不足的問題,提出了一種名為 REAR 的新型框架。REAR 的核心思想是通過引入相關性評估模組,使 LLM 能夠精確地評估檢索文件的相關性,並據此自適應地利用內部和外部知識來生成更準確的答案。
研究背景
現有的檢索增強生成(RAG)方法通常無法準確評估檢索文件的相關性,導致 LLM 可能會被誤導或錯誤地使用外部知識。為了解決這個問題,REAR 框架應運而生。
REAR 框架
REAR 框架主要包含三個關鍵組成部分:
**相關性評估模組:**該模組用於評估檢索文件與問題之間的相關性程度。REAR 利用 LLM 將問題和文件映射到相關性嵌入空間,並通過評估模組量化為相關性分數。
**相關性指導的生成:**REAR 將相關性分數整合到 LLM 的生成過程中,指導 LLM 根據文件的相關性程度自適應地利用外部證據。
**知識可靠性驗證:**REAR 採用兩種策略來驗證生成答案的可靠性:(a) 來源可靠性:根據文件相關性評估結果判斷答案來源的可靠性;(b) 知識一致性:通過評估 LLM 在不參考文件的情況下生成相同答案的可能性,來驗證外部知識與 LLM 內部知識的一致性。
模型訓練
REAR 框架採用了兩種訓練策略來優化模型性能:
**雙粒度相關性融合:**該策略結合了粗粒度和細粒度相關性監督,以克服二元判別方法的局限性,提高相關性評估的精度。
**抗噪訓練:**通過在訓練過程中引入負面樣本,增強 LLM 對無關信息的辨別能力,提高模型的魯棒性。
實驗結果
在四個公開的開放域問答數據集上的實驗結果表明,REAR 框架在問答準確率方面顯著優於現有的 RAG 方法。此外,REAR 還表現出較強的泛化能力,能夠有效地處理未見過的數據。
總結
REAR 框架通過引入相關性評估模組和針對性訓練策略,有效地解決了 LLM 在問答任務中對外部知識利用不足的問題,提高了問答的準確性和可靠性。未來,REAR 框架有望應用於更廣泛的知識密集型任務中。
Estatísticas
REAR significantly outperforms other LLMs in generating accurate responses when the reference document is irrelevant, highlighting its robust resistance to interference from noisy documents.
REAR approach performs well when provided with a single document (i.e., the top retrieved one), while base models without fine-tuning suffer from significant degradation in this case.
REAR approach is very robust to external retrievers of varied retrieval capacities.