本文提出了一種利用大型語言模型的迭代反饋來增強工具檢索的方法。具體來說,在每一輪迭代中,大型語言模型會先理解用戶指令和工具功能,然後評估當前檢索到的工具的有效性,並根據評估結果對用戶指令進行改進。改進後的用戶指令將替換之前的指令,用於下一輪的工具檢索。通過這種迭代過程,檢索模型可以逐步吸收大型語言模型對用戶需求的理解,從而提高工具檢索的性能。
此外,本文還構建了一個全面的工具檢索基準測試集TR-bench,包含了現實世界中工具更新的情況。實驗結果表明,本文提出的方法在該基準測試集上的in-domain和out-of-domain評估中均取得了最佳性能。
他の言語に翻訳
原文コンテンツから
arxiv.org
深掘り質問