Core Concepts
Ein neuartiger Deep-Reinforcement-Learning-Algorithmus (A3C-RL) wird vorgestellt, der Graph-Aufmerksamkeitsmechanismen und einen BERT-basierten Bewertungsmodell nutzt, um geometrische Probleme durch automatisches Hinzufügen von Hilfselementen effizient zu lösen.
Abstract
Der Artikel beschreibt einen Ansatz zum automatischen Lösen geometrischer Probleme, indem Hilfselemente wie Linien oder Punkte automatisch hinzugefügt werden. Dafür wird ein Deep-Reinforcement-Learning-Framework (A3C-RL) entwickelt, das folgende Komponenten enthält:
AttnStrategy: Ein Netzwerk zur Strategiegenerierung, das den Suchraum durch einen Graph-Aufmerksamkeitsmechanismus reduziert, indem es sich auf für den Schluss relevante Komponenten konzentriert.
BERT-basiertes Bewertungsmodell: Ein tiefes neuronales Netzwerk, das die Beiträge verschiedener Strategien zum Problemlösen bewertet und so die effizientesten Strategien auswählt.
Monte-Carlo-Baum-Suche (MCTS): Wird verwendet, um die ausgewählten Strategien zum Hinzufügen von Hilfselementen zu testen und das Problemlösungsergebnis zu bewerten.
Die Experimente zeigen, dass der A3C-RL-Algorithmus die Genauigkeit des Problemlösens im Vergleich zur traditionellen MCTS-Methode um 32,7% auf 83,5% verbessert. Außerdem übertrifft A3C-RL die Leistung von Menschen bei geometrischen Fragen aus der jährlichen Universitätsaufnahmeprüfung in China.
Stats
Der A3C-RL-Algorithmus verbessert die Genauigkeit des Problemlösens um 32,7% im Vergleich zur traditionellen MCTS-Methode.
Der A3C-RL-Algorithmus übertrifft die Leistung von Menschen bei geometrischen Fragen aus der jährlichen Universitätsaufnahmeprüfung in China.
Quotes
"Solving a geometric problem is essentially a search problem with the goal of finding a sequence of deductions leading from presumed facts to the given conjecture."
"Strategy selection thus plays a critical role in narrowing down the search space and making it tractable."