이 연구는 코드 취약점 탐지 문제에 대한 새로운 접근법을 제안한다. 기존 연구들은 취약점 유형을 구분하지 않고 단일 분류기로 탐지하는 방식을 사용했지만, 이는 다양한 취약점 특성을 효과적으로 학습하기 어렵다는 한계가 있었다. 또한 취약점 데이터 수집의 어려움으로 인해 모델이 과적합되는 문제도 있었다.
이를 해결하기 위해 FGVulDet 모델을 제안했다. FGVulDet은 각 취약점 유형별로 개별 분류기를 학습하고, 앙상블 방식으로 최종 예측을 수행한다. 또한 취약점 보존 데이터 증강 기법을 통해 데이터 다양성을 높이고 희소 취약점 유형에 대한 성능을 향상시켰다.
실험 결과, FGVulDet은 기존 정적 분석 기반 및 딥러닝 기반 접근법에 비해 우수한 성능을 보였다. 특히 재현율과 F1-score 측면에서 큰 성능 향상을 달성했다. 또한 각 데이터 증강 기법의 효과를 분석한 결과, 제안한 모든 기법이 성능 향상에 기여함을 확인했다.
To Another Language
from source content
arxiv.org
Thông tin chi tiết chính được chắt lọc từ
by Shangqing Li... lúc arxiv.org 04-16-2024
https://arxiv.org/pdf/2404.09599.pdfYêu cầu sâu hơn