核心概念
本文提出了一種名為LogicPro的新方法,通過利用廣泛可用的算法問題和代碼解決方案來增強大型語言模型的複雜邏輯推理能力。
摘要
本文提出了一種名為LogicPro的新方法,旨在通過利用廣泛可用的算法問題和代碼解決方案來增強大型語言模型的複雜邏輯推理能力。
該方法分為四個步驟:
利用算法問題和相應的代碼構建測試樣本輸入。
基於這些測試樣本和算法問題構建複雜的推理問題。
從代碼解決方案中獲取中間變量結果。
將複雜的推理問題與中間變量結果整合形成最終的問答對。
通過這種方法,我們可以構建一個足夠困難、多樣化和可擴展的數據集,同時還能獲得由中間變量值引導的高質量推理過程。
實驗結果表明,該方法在BBH27、GSM8K、HellSwag、Logicqa、Reclor和RTE等多個數據集上顯著提升了多個模型的性能,優於現有的多種推理數據集。
統計資料
通過算法問題和代碼解決方案,我們構建了2,360個不同的測試樣本。
我們最終獲得了69,866個問答對的訓練數據集。