核心概念
本文介紹了一個基於抽象語義表示 (AMR) 的新聞驗證系統 AMREx,該系統利用 AMR 圖譜匹配和文本相似度來判斷聲明與證據之間的關係,並生成部分可解釋的理由。
論文資訊
Jayaweera, C., Youm, S., & Dorr, B. (2024). AMREx: AMR for Explainable Fact Verification. arXiv preprint arXiv:2411.01343v1.
研究目標
本研究旨在開發一個可解釋的新聞驗證系統,利用抽象語義表示 (AMR) 來判斷聲明與證據之間的語義相似度,並生成支持其判斷的理由。
方法
AMREx 系統結合了 Smatch(一種用於衡量語義包含度的 AMR 評估指標)和文本相似度來計算聲明和證據之間的蘊含分數。系統首先將聲明和證據轉換為 AMR 圖譜,然後使用 Smatch 算法計算圖譜之間的結構相似度,並結合基於 SBERT 嵌入的文本相似度,得出最終的蘊含分數。根據預設的閾值,系統將蘊含分數轉換為支持、反駁或信息不足等新聞真實性標籤。此外,AMREx 還可以通過 AMR 節點映射來解釋其預測結果,並可作為提示,引導大型語言模型生成自然語言解釋。
主要發現
AMREx 在 AVeriTeC 新聞驗證數據集上的準確率超過了基準模型,證明了該方法在真實世界新聞驗證中的有效性。
AMREx 採用可解釋的流程,並在適用的情況下返回可解釋的 AMR 節點映射,以闡明系統的新聞真實性預測。
研究表明,AMREx 的輸出可以用於提示大型語言模型,以 AMR 映射為指導生成自然語言解釋,從而降低出現幻覺的可能性。
總結
AMREx 是一個基於 AMR 的新聞驗證系統,它不僅可以有效地判斷聲明的真實性,還可以提供部分可解釋的理由。儘管 AMREx 的性能與其他基於深度學習的模型相比還不夠高,但其可解釋性使其成為分析和改進新聞驗證系統的寶貴工具。
局限性與未來研究方向
AMREx 的性能很大程度上取決於 AMR 解析器的準確性,而現有的 AMR 解析器還不夠完善。
AMREx 的 AMR 節點映射在處理結構相似度較低的文本時效果較差。
未來需要對 AMREx 的可解釋性進行更深入的評估,並與其他可解釋的新聞驗證系統進行比較。
統計資料
AMREx 在 AVeriTeC 新聞驗證數據集上的準確率超過了基準模型。
當 λ = 0 時,AMRExFEV ERacc,f1 在識別支持性(聲明,證據)對方面更有效,但在反駁實例方面表現不佳。
AMRExAV eriTecacc 在識別可反駁的(聲明,證據)對和具有衝突證據的對方面表現與 AVeriTeC 基準模型相當。