Основные понятия
「思維之樹」(ToT)作為一種增強大型語言模型推理能力的方法,其成功主要歸功於強大的生成器,而非辨別器。
Аннотация
「思維之樹」:大型模型的生成能力優於辨別能力
這篇研究論文探討了「思維之樹」(ToT)在增強大型語言模型(LLM)推理能力方面的有效性。ToT 是一種搜索導向的方法,透過生成器提出多個中間推理步驟,並利用辨別器評估這些步驟以選擇最有希望的步驟,從而擴展了「思維鏈」(CoT)方法。
本研究旨在探討以下三個研究問題:
擴展生成器的規模是否能提高 ToT 的效能?
擴展辨別器的規模是否能提高 ToT 的效能?
在哪些條件下,ToT 的效能優於「輸入-輸出」(IO)和 CoT?
研究人員選擇了兩個具有挑戰性的推理任務:「24 點遊戲」和「騎士與惡棍謎題」,並使用了六個不同規模的開源語言模型進行實驗。他們將 ToT 框架分解為生成器和辨別器兩個模組,並分別使用具有可控準確率的預測生成器和預測辨別器來評估每個模組對 ToT 整體效能的影響。