Newclid 是一個基於 AlphaGeometry 的全新符號幾何求解器,它透過模組化程式碼庫、新的除錯和視覺化工具以及 GeoGebra 整合,顯著提高了使用者友好性和推理能力。
本文提出了一種名為 AIPS 的代數不等式證明系統,該系統無需人類演示即可自動生成和解決奧林匹克級別的代數不等式問題。
CoqPilot 是一個 VS Code 外掛程式,旨在利用大型語言模型和其他方法簡化 Coq 程式碼的生成,並透過整合多種生成方法和自動校驗功能,協助使用者更有效率地編寫 Coq 證明。
通過在大規模 LEAN 問題集上進行專家迭代訓練,InternLM2.5-StepProver 在自動定理證明方面取得了顯著進展,證明了專家迭代和評論模型在解決複雜數學問題方面的有效性。
本文提出了一種名為 3D-Prover 的新型自動定理證明方法,該方法利用行列式點過程 (DPP) 從候選策略中選擇語義多樣且高質量的子集,從而有效地修剪搜索空間並提高證明效率。
LeanAgent 是一個基於終身學習的自動定理證明框架,它能夠在不斷擴展的數學知識庫上持續泛化和改進,而不會遺忘先前學到的知識,展現出在處理複雜數學問題上的潛力。
TheoremLlama 框架透過生成 NL-FL 對齊數據集、採用區塊訓練和課程數據排序等訓練技術,並利用迭代證明編寫方法,成功將通用大型語言模型轉化為精通 Lean4 的定理證明專家。