本論文は、LLMを活用したテストケース生成手法「AID」を提案している。AIの自動生成コードの普及に伴い、ソフトウェアのバグ検出が重要な課題となっている。従来の自動テスト生成手法は、テストオラクルの生成に課題があった。一方、LLMは自然言語理解能力が高いため、テストオラクルの自動生成に期待されている。
AIの提案手法「AID」は以下の3つのステップから構成される:
AIDは、TrickyBugs(人間が書いたプログラム)とEvalPlus(AIが生成したプログラム)のデータセットで評価された。その結果、AIDは既存手法と比べて、再現率、精度、F1スコアが最大で1.80倍、2.65倍、1.66倍向上した。特に、論理的に複雑なプログラムに対して大きな改善が見られた。
To Another Language
from source content
arxiv.org
Key Insights Distilled From
by Kaibo Liu,Yi... at arxiv.org 04-17-2024
https://arxiv.org/pdf/2404.10304.pdfDeeper Inquiries