本論文は、LLMを活用したテストケース生成手法「AID」を提案している。AIの自動生成コードの普及に伴い、ソフトウェアのバグ検出が重要な課題となっている。従来の自動テスト生成手法は、テストオラクルの生成に課題があった。一方、LLMは自然言語理解能力が高いため、テストオラクルの自動生成に期待されている。
AIの提案手法「AID」は以下の3つのステップから構成される:
AIDは、TrickyBugs(人間が書いたプログラム)とEvalPlus(AIが生成したプログラム)のデータセットで評価された。その結果、AIDは既存手法と比べて、再現率、精度、F1スコアが最大で1.80倍、2.65倍、1.66倍向上した。特に、論理的に複雑なプログラムに対して大きな改善が見られた。
A otro idioma
del contenido fuente
arxiv.org
Ideas clave extraídas de
by Kaibo Liu,Yi... a las arxiv.org 04-17-2024
https://arxiv.org/pdf/2404.10304.pdfConsultas más profundas