我們提出了一種新穎的蒙特卡羅樹搜索(MCTS)推理算法,顯著提高了大型語言模型的推理準確性和速度。我們的方法包括:1)基於對比解碼原理設計了一個高度可解釋的獎勵模型;2)採用投機性解碼實現了平均52%的節點級推理速度提升;3)改進了UCT節點選擇策略和回溯傳播,進一步提高了性能。