本論文介紹了一種名為 FIRE 的新型事實查核框架,旨在解決傳統事實查核系統中證據檢索和斷言驗證分離所導致的效率低下的問題。FIRE 框架採用迭代的方式整合了證據檢索和斷言驗證,允許語言模型在不確定的情況下才依賴外部證據檢索,從而更有效地利用其內部知識進行判斷。
大型語言模型(LLM)在各種任務中表現出色,但它們也可能產生與事實不符的內容。事實查核對於確保準確的信息傳播至關重要,而識別網上最相關的證據是事實查核流程中的關鍵挑戰。傳統方法將問題框架為問答任務,但這種方法效率低下,因為它沒有充分利用 LLM 在預訓練期間嵌入的內部知識,並且沒有複製人類搜索策略中的迭代推理過程。
FIRE 是一個基於代理的框架,它將證據檢索和斷言驗證整合到一個迭代過程中。該框架包含三個關鍵組件:
在多個數據集上進行的實驗表明,FIRE 不僅略微提高了準確性,而且還將 LLM 計算成本平均降低了 7.6 倍,將搜尋成本降低了 16.5 倍,使其非常適合生產使用。
對錯誤案例的分析表明,需要改進基準數據集的質量,並更加關注驗證細粒度的斷言。未來的研究方向包括整合記憶庫以存儲驗證結果,以及擴展系統以支持其他模態,例如代碼和圖像。
FIRE 是一種新穎且高效的事實查核框架,它透過迭代檢索和驗證的方式整合了證據檢索和斷言驗證。實驗結果表明,FIRE 在保持高準確性的同時顯著降低了計算成本,使其成為大規模事實查核應用的理想選擇。
翻譯成其他語言
從原文內容
arxiv.org
深入探究