本研究では、コンパイラバグの分離に大規模言語モデル(LLM)を活用する新しいアプローチ「LLM4CBI」を提案している。コンパイラバグの分離は重要な課題であるが、バグに関する情報が限られているため困難である。従来のアプローチは、テストプログラムの変異問題に変換するが、変異戦略の非効率さや人的努力の高さが課題となっていた。
LLM4CBI では、3つの新しいコンポーネントを設計することで、LLMの能力を活用している。
複雑性指標に基づくプロンプト生成: データフロー分析とコントロールフロー分析を活用し、プログラムの最も複雑な変数と挿入位置を特定する。
記憶型プロンプト選択: 強化学習を用いて、特定のテストプログラムに適したプロンプトを継続的に選択する。
テストプログラムの軽量検証: 静的解析を用いて、未定義の動作を含むプログラムを検出・除外する。
評価の結果、LLM4CBIは、従来手法であるDiWiとRecBiと比較して、Top-1/Top-5の結果でそれぞれ69.70%/21.74%、24.44%/8.92%多くのバグを分離できることが示された。また、LLM4CBIのコンポーネントは他のLLMにも置き換え可能であり、合理的な結果が得られることも確認された。
In un'altra lingua
dal contenuto originale
arxiv.org
Approfondimenti chiave tratti da
by Haoxin Tu,Zh... alle arxiv.org 04-24-2024
https://arxiv.org/pdf/2307.00593.pdfDomande più approfondite