本文提出了一個中央答案模型(CAM)來解決具身問答(EQA)任務中的多代理情境。在傳統的EQA設置中,只有單一代理探索環境並回答問題。相比之下,我們的方法使用多個大型語言模型(LLM)代理,每個代理都獨立探索環境並回答問題。CAM則負責從這些獨立回答中聚合出最終答案。
我們的實驗結果顯示,CAM在EQA任務中的準確率比基線的多數投票和辯論方法高出46%。CAM不需要代理之間的任何通信,避免了相關的成本。我們還嘗試了多種非線性和線性的機器學習算法來實現CAM,並在不同大小的Matterport3D環境中進行了評估。我們還研究了當有惡意代理參與時,CAM的表現。最後,我們通過置換特徵重要性(PFI)分析了CAM對不同特徵的依賴程度。
Til et andet sprog
fra kildeindhold
arxiv.org
Vigtigste indsigter udtrukket fra
by Bhrij Patel,... kl. arxiv.org 09-17-2024
https://arxiv.org/pdf/2406.10918.pdfDybere Forespørgsler