Core Concepts
大規模言語モデルを用いることで、Diproche CNLの設計と変換のプロセスを簡素化し、より自然な表現の自由度を高めることができる。
Abstract
Diproche ("Didactical Proof Checking")システムは、初年次の「証明入門」クラスで学生に証明を紹介するための自動証明チェッカーである。従来のシステムでは、Prologによる定形節文法を使ってコントロールされた自然言語(CNL)を実装していた。本論文では、大規模言語モデルを用いた自動形式化の可能性を探り、初期的な良好な結果を得た。
大規模言語モデルを用いることで、CNLの設計と変換のプロセスを大幅に簡素化できる。また、より自然な表現の自由度を高めることができる。従来のCNLは、透明性と使いやすさのバランスを取るのが難しかったが、大規模言語モデルを使えば、この問題を解決できる可能性がある。
本研究では、OpenAIのDaVinci-3モデルを用いて、Diproche CNLの自動形式化のプロトタイプを構築した。また、より最近のGPT-4モデルでも同様の実験を行い、高い性能を確認した。
自動形式化の精度は、入力文の長さに制限があるため、まだ完全ではないが、基本的な証明問題では十分な性能を発揮する。また、大規模言語モデルを用いることで、CNLの柔軟性と寛容性が高まり、学習者にとってより使いやすいシステムになると期待される。
今後の課題としては、大規模言語モデルを局所的に利用できるようにすること、自動形式化以外の機能(フィードバック、ヒント生成、ミスの診断など)への応用を検討することが挙げられる。
Stats
大規模言語モデルを用いることで、CNLの設計と変換のプロセスを大幅に簡素化できる。
大規模言語モデルを使えば、より自然な表現の自由度を高めることができる。
Diproche CNLの自動形式化の精度は、入力文の長さの制限により、まだ完全ではないが、基本的な証明問題では十分な性能を発揮する。
大規模言語モデルを用いることで、CNLの柔軟性と寛容性が高まり、学習者にとってより使いやすいシステムになると期待される。