이 논문은 자연어 요구사항을 바탕으로 전체 코드 저장소를 자동으로 생성하는 새로운 소프트웨어 엔지니어링 과제인 NL2Repo를 소개한다. 이를 해결하기 위해 CODES라는 다중 레이어 스케치 기반 프레임워크를 제안한다.
CODES는 다음 3단계로 구성된다:
CODES는 프롬프트 엔지니어링과 지도 학습 미세조정 두 가지 방식으로 구현되었다. 프롬프트 엔지니어링은 기존 코드 언어 모델을 활용하고, 지도 학습 미세조정은 100개의 코드 저장소 데이터로 모델을 개선한다.
CODES의 성능을 평가하기 위해 SketchEval이라는 새로운 벤치마크를 구축했다. SketchEval은 19개의 실제 GitHub 저장소로 구성되며, SketchBLEU라는 새로운 평가 지표를 사용한다. 또한 30명의 참여자를 대상으로 한 실험적 연구를 수행했다.
실험 결과, CODES는 NL2Repo 과제에서 효과적이고 실용적인 것으로 나타났다. 특히 지도 학습 미세조정 버전이 프롬프트 엔지니어링 버전보다 우수한 성능을 보였다. 이는 CODES의 다중 레이어 스케치 접근법과 지도 학습 데이터의 중요성을 입증한다.
翻译成其他语言
从原文生成
arxiv.org
更深入的查询