이 논문은 LLM(Large Language Model)을 활용하여 취약점 탐지 성능을 향상시키는 접근법인 MuCoLD(Multi-role Consensus through LLMs Discussions)를 소개한다.
초기화 단계에서 테스터가 코드 세그먼트를 분석하여 취약점 존재 여부에 대한 초기 판단을 내린다.
토론 단계에서는 테스터와 개발자가 상호작용하며 다양한 관점을 교환하고 토론을 통해 취약점 존재 및 분류에 대한 합의를 도출한다.
결론 단계에서는 최종 판단을 내리고 결과를 출력한다.
실험 결과, MuCoLD 접근법은 단일 역할 접근법에 비해 정확도 4.73%, 재현율 58.9%, F1 점수 28.1% 향상되었다. 이는 다양한 역할의 관점을 통합하여 취약점 탐지 성능을 높일 수 있음을 보여준다.
향후 연구에서는 더 다양한 역할(예: 프로그램 관리자)을 포함하고, 다중 분류 및 취약점 수정 등으로 확장할 계획이다.
翻译成其他语言
从原文生成
arxiv.org
更深入的查询