Belangrijkste concepten
딥러닝 모델 학습 시 발생하는 데이터 버그는 모델 성능 저하의 주요 원인이며, 특히 코드, 텍스트, 메트릭 기반 데이터에서 다양한 증상으로 나타난다.
Samenvatting
딥러닝 모델의 데이터 버그 영향 분석: 코드, 텍스트, 메트릭 기반 데이터를 중심으로
본 연구는 소프트웨어 엔지니어링 작업에 사용되는 딥러닝 모델 학습 시 데이터 품질 및 전처리 문제가 모델 학습에 미치는 영향을 실증적으로 분석하는 것을 목표로 한다.
본 연구는 코드 기반, 텍스트 기반, 메트릭 기반 데이터를 사용하는 딥러닝 모델을 대상으로 한다. 각 데이터 유형별 대표적인 작업(취약점 탐지, 중복 버그 리포트 탐지, 결함 예측)을 선정하고, 각 작업에 대한 최첨단 기준 모델(LineVul, DCCNN, DeepJIT)을 선정하였다. 각 모델에 대해 깨끗한 데이터를 사용하는 기준 모델, 데이터 품질 문제가 있는 데이터를 사용하는 모델, 전처리 작업이 생략된 데이터를 사용하는 모델 등 세 가지 변형 모델을 구축하였다. 각 모델 변형은 15회씩 실행하여 Weights & Biases 프레임워크를 사용하여 학습 과정을 기록하고, 모델의 손실, 정확도, 기울기, 가중치, 편향과 같은 지표를 분석하였다. 또한, Attention-Based Analysis, t-SNE, Grad-CAM과 같은 설명 가능한 AI 기술을 사용하여 데이터 품질 문제가 모델 학습에 미치는 영향을 정성적으로 분석하였다. 마지막으로, 본 연구에서 도출된 결과의 일반화 가능성을 평가하기 위해 초기 분석에 포함되지 않은 6개의 새로운 데이터 세트(Juliet, D2A, Mozilla, Spark, Go, JDT)를 사용하여 추가 실험을 수행하였다.