Core Concepts
大規模言語モデルは、宣言的仕様の修復において、既存の手法を上回る効果を示す。
Abstract
本研究は、Alloy仕様の自動修復における大規模言語モデル(LLM)の有効性を包括的に評価したものである。Alloy仕様の修復は、命令型言語のプログラム修復に比べて研究が少ない分野である。
本研究では、修復エージェントと促進エージェントからなる新しい修復パイプラインを提案した。このパイプラインは、LLMを活用して、Alloy仕様の修復を行う。
広範な評価の結果、特にGPT-4系列のLLMが、実行時間とトークン使用量がわずかに増加するものの、既存手法を上回る修復効果を示すことが明らかになった。この研究は、宣言的仕様の自動修復分野の進展に貢献し、LLMのこの分野での有望な可能性を示している。
Stats
提案された修復仕様は、元の仕様と同一であってはならない。
修復された仕様は、一貫性があり(インスタンスを持つ)、すべての主張が有効(カウンターエグザンプルがない)でなければならない。