Core Concepts
대규모 언어 모델을 활용하여 고급 프로그래밍 과제의 버그를 효과적으로 수정할 수 있는 PaR 프레임워크를 제안한다.
Abstract
이 논문은 고급 프로그래밍 과제 수정을 위한 새로운 데이터셋 Defects4DS를 소개하고, 이를 바탕으로 대규모 언어 모델을 활용하는 PaR 프레임워크를 제안한다.
Defects4DS 데이터셋:
고급 프로그래밍 과제 4개로 구성되며, 682개의 학생 제출 코드를 포함
코드 길이가 평균 55줄로 기존 데이터셋보다 길고, 복잡한 문법 요소(구조체, 포인터, 다차원 배열) 사용이 많음
버그 유형과 수정 유형을 4가지 차원에서 상세히 분석
PaR 프레임워크:
동료 솔루션 선택: 버그 코드와 유사한 동료 솔루션을 선별
다중 소스 프롬프트 생성: 다양한 정보(과제 설명, 입출력 예시, 버그 코드, 동료 솔루션 등)를 종합하여 프롬프트 생성
프로그램 수정: 생성된 프롬프트를 대규모 언어 모델에 입력하여 수정된 코드 출력
평가 결과:
PaR는 기존 LLM 기반 및 기호 기반 접근법보다 Defects4DS와 ITSP 데이터셋에서 각각 19.94%와 15.2% 더 높은 수정률을 달성
버그 유형별 분석 결과, PaR가 다양한 버그 유형에서 우수한 성능을 보임
Stats
버그가 1개인 코드는 전체의 58.4%를 차지한다.
관련 버그가 있는 코드는 전체의 58.6%를 차지한다.
변수 관련 버그가 가장 많은 비중을 차지한다.