本研究では、Defects4JとBugsInPyのデータセットを拡張し、リアルワールドのソフトウェアプロジェクトから抽出されたバージョンに含まれる複数の不具合を同定している。
まず、テストケースの移植によって、各バージョンに存在する追加の不具合を特定する。次に、不具合位置の特定により、それらの不具合の正確な位置を特定する。これにより、単一の不具合しか含まれていないという既存データセットの限界を克服し、より現実的な複数不具合バージョンのデータセットを構築した。
Defects4Jデータセットでは平均9.2個、BugsInPyデータセットでは平均18.6個の不具合を同定した。また、不具合の平均ライフスパンは1-2週間程度であるが、100日以上続く不具合も存在することが分かった。
本データセットは、複数不具合の同定や修正に関する研究に活用できる。また、機械学習ベースのデバッグ手法の訓練データとしても有用である。今後は、不具合修正パッチの追加や、より複雑なバージョン履歴への対応などの改善が期待される。
A otro idioma
del contenido fuente
arxiv.org
Ideas clave extraídas de
by Dylan Callag... a las arxiv.org 03-29-2024
https://arxiv.org/pdf/2403.19171.pdfConsultas más profundas