المفاهيم الأساسية
COVERUP은 커버리지 분석과 대규모 언어 모델(LLM)의 조합을 통해 높은 커버리지의 Python 회귀 테스트를 생성하는 새로운 시스템이다.
الملخص
COVERUP은 커버리지 분석과 LLM과의 대화를 반복적으로 수행하여 커버리지를 향상시킨다. 기존 접근법인 CODAMOSA에 비해 COVERUP은 전반적으로 더 높은 커버리지를 달성한다. 모듈 단위로 볼 때 COVERUP은 라인 커버리지 81%, 분기 커버리지 53%, 라인+분기 커버리지 78%를 달성하는 반면, CODAMOSA는 각각 62%, 35%, 55%를 달성한다. COVERUP의 반복적이고 커버리지 기반의 접근법이 효과적이며, 이는 전체 성공의 약 절반을 차지한다.
الإحصائيات
전체 코드 기준 COVERUP의 라인 커버리지는 61.4%, 분기 커버리지는 42.7%, 라인+분기 커버리지는 57.0%이다.
모듈 단위 중간값 기준 COVERUP의 라인 커버리지는 80.9%, 분기 커버리지는 53.0%, 라인+분기 커버리지는 77.9%이다.
기존 접근법인 CODAMOSA (codex)의 전체 코드 기준 커버리지는 라인 53.8%, 분기 33.9%, 라인+분기 49.1%이다.
CODAMOSA (gpt4)의 전체 코드 기준 커버리지는 라인 54.1%, 분기 32.4%, 라인+분기 48.9%이다.
기존 접근법 대비 COVERUP의 모듈 단위 중간값 커버리지는 라인 80.9%, 분기 53.0%, 라인+분기 77.9%로 크게 향상되었다.
اقتباسات
"COVERUP은 커버리지 분석과 대규모 언어 모델(LLM)의 조합을 통해 높은 커버리지의 Python 회귀 테스트를 생성하는 새로운 시스템이다."
"COVERUP의 반복적이고 커버리지 기반의 접근법이 효과적이며, 이는 전체 성공의 약 절반을 차지한다."