Core Concepts
プログラム合成における構文エラーの早期拒否と完全なプログラムの検出を可能にする効率的な左右商パーサーを開発しました。
Abstract
大規模言語モデルはプログラム合成や高度な自動補完に有用ですが、出力されるコードが構文的に正しいことは保証されません。本論文では、任意の文脈自由文法の左右商を操作するEarleyスタイルのパーサーを開発し、多くの一般的なプログラミング言語の文法で見られるいくつかの文脈依存機能に対してインクリメンタルパースおよび商演算を拡張します。これらの貢献により、効率的で一般的かつ確固たる左右商パース方法が実現されます。Python 3向けFItM補完タスクで手法を評価し、制約生成が推奨されるコード内の構文エラー発生率を大幅に削減できることを示しました。
Stats
大規模言語モデルはプログラム合成や高度な自動補完に使用される。
Earleyスタイルパーサーは任意の文脈自由文法で操作可能。
Python 3向けFItM補完タスクで制約生成が構文エラー削減に有効。
Quotes
"Constrained generation can significantly reduce the incidence of syntax errors in recommended code."
"An efficient, general, and well-grounded method for left and right quotient parsing."