本論文は、LLMを活用したテストケース生成手法「AID」を提案している。AIの自動生成コードの普及に伴い、ソフトウェアのバグ検出が重要な課題となっている。従来の自動テスト生成手法は、テストオラクルの生成に課題があった。一方、LLMは自然言語理解能力が高いため、テストオラクルの自動生成に期待されている。
AIの提案手法「AID」は以下の3つのステップから構成される:
AIDは、TrickyBugs(人間が書いたプログラム)とEvalPlus(AIが生成したプログラム)のデータセットで評価された。その結果、AIDは既存手法と比べて、再現率、精度、F1スコアが最大で1.80倍、2.65倍、1.66倍向上した。特に、論理的に複雑なプログラムに対して大きな改善が見られた。
Sang ngôn ngữ khác
từ nội dung nguồn
arxiv.org
Thông tin chi tiết chính được chắt lọc từ
by Kaibo Liu,Yi... lúc arxiv.org 04-17-2024
https://arxiv.org/pdf/2404.10304.pdfYêu cầu sâu hơn