核心概念
本文提出利用大型語言模型的迭代反饋來增強工具檢索的方法,以解決工具檢索中的複雜用戶指令和工具描述以及檢索模型與使用模型之間的錯位問題。
摘要
本文提出了一種利用大型語言模型的迭代反饋來增強工具檢索的方法。具體來說,在每一輪迭代中,大型語言模型會先理解用戶指令和工具功能,然後評估當前檢索到的工具的有效性,並根據評估結果對用戶指令進行改進。改進後的用戶指令將替換之前的指令,用於下一輪的工具檢索。通過這種迭代過程,檢索模型可以逐步吸收大型語言模型對用戶需求的理解,從而提高工具檢索的性能。
此外,本文還構建了一個全面的工具檢索基準測試集TR-bench,包含了現實世界中工具更新的情況。實驗結果表明,本文提出的方法在該基準測試集上的in-domain和out-of-domain評估中均取得了最佳性能。
統計資料
與傳統文檔檢索相比,工具檢索的用戶指令通常更加複雜和模糊,工具描述與用戶指令的相關性也較低。
現有的工具檢索方法存在檢索模型與使用模型之間的錯位問題,這會進一步降低工具使用的性能。
引述
"工具學習不僅提高了LLM在現有任務上的性能,還允許它們解決以前超出其能力範圍的任務。此外,使用工具的能力是邁向高級智能的關鍵標誌。"
"工具檢索雖然實用且必要,但卻未得到足夠的研究。一些方法採用了傳統的文檔檢索方法來為LLM檢索工具,但我們認為它們忽略了工具檢索的獨特挑戰。"