核心概念
本文提出了一個利用大型語言模型提升實體解析結果的不確定性降低框架。該框架通過選擇最有價值的匹配問題來有效地利用大型語言模型,從而在有限預算下提高實體解析的準確性。
摘要
本文提出了一個利用大型語言模型提升實體解析結果的不確定性降低框架。首先,該框架初始化可能的實體分區及其概率分佈,然後選擇最有價值的匹配問題(MQ)來向大型語言模型(LLM)查詢,根據LLM的回答調整可能分區的概率分佈,從而降低整體結果的不確定性。為了在有限預算下提高成本效益,作者設計了一種高效的算法來選擇最有價值的匹配問題。此外,作者還提出了一種錯誤容忍技術和動態調整方法,以處理LLM可能產生的錯誤並最終達到正確的實體分區。實驗結果表明,該方法在效率和有效性方面都很出色,在實際應用中很有前景。
統計資料
在DBLP-ACM數據集上,使用1k預算時,Greedy算法(k=5)的不確定性從2.8降到0.5,而隨機算法從2.8降到1.2。
在Walmart-Amazon數據集上,使用1k預算時,Greedy算法(k=5)的不確定性從2.6降到0.4,而隨機算法從2.6降到1.0。
在Abt-Buy數據集上,使用1k預算時,Greedy算法(k=5)的不確定性從2.7降到0.6,而隨機算法從2.7降到1.1。