核心概念
LLEMMA, ein großes Sprachmodell für Mathematik, übertrifft alle bekannten offenen Basismodelle sowie die unveröffentlichten Minerva-Modelle in Bezug auf mathematische Fähigkeiten. LLEMMA kann darüber hinaus ohne weitere Feinabstimmung Werkzeugnutzung und formalen Theorembeweisen durchführen.
摘要
Der Artikel stellt LLEMMA, ein großes Sprachmodell für Mathematik, vor. LLEMMA wurde durch fortgesetzte Vortrainierung des Code Llama-Modells auf Proof-Pile-2, einer Mischung aus wissenschaftlichen Artikeln, Webdaten mit mathematischen Inhalten und mathematischem Code, entwickelt.
LLEMMA übertrifft alle bekannten offenen Basismodelle sowie die unveröffentlichten Minerva-Modelle auf der MATH-Benchmark in Bezug auf mathematische Fähigkeiten. Darüber hinaus kann LLEMMA ohne weitere Feinabstimmung Werkzeugnutzung und formalen Theorembeweisen durchführen.
Die Autoren veröffentlichen alle Artefakte, einschließlich 7-Milliarden- und 34-Milliarden-Parameter-Modelle, Proof-Pile-2 und Code zur Replikation der Experimente.
統計資料
"Wenn eine Zahl durch 5 geteilt wird, beträgt der Rest 3. Was ist der Rest, wenn die doppelte Zahl durch 5 geteilt wird?"
"2 * n = n + n"
"(n mod 5 + n mod 5) mod 5 = (3 + 3) mod 5 = 1"
引述
"LLEMMA, ein großes Sprachmodell für Mathematik, übertrifft alle bekannten offenen Basismodelle sowie die unveröffentlichten Minerva-Modelle in Bezug auf mathematische Fähigkeiten."
"LLEMMA kann darüber hinaus ohne weitere Feinabstimmung Werkzeugnutzung und formalen Theorembeweisen durchführen."