핵심 개념
생성적 적대 신경망을 활용하여 실제 네트워크 트래픽과 유사한 합성 데이터를 생성함으로써 네트워크 침입 탐지 시스템의 성능을 향상시킬 수 있다.
초록
이 연구에서는 네트워크 침입 탐지 시스템(NIDS)의 성능 향상을 위해 생성적 적대 신경망(GAN) 모델을 활용하는 새로운 접근법을 제안한다. 실제 네트워크 트래픽 데이터와 유사한 합성 데이터를 생성하여 NIDS 학습 데이터를 보강함으로써, 특히 학습 데이터가 부족한 공격 유형에 대한 탐지 성능을 향상시킬 수 있다.
세 가지 GAN 모델(Vanilla GAN, Wasserstein GAN, Conditional Tabular GAN)을 구현하여 실제 네트워크 트래픽 패턴을 모방하는 합성 데이터를 생성하였다. 이렇게 생성된 데이터를 CIC-IDS2017 벤치마크 데이터셋에 추가하여 NIDS 모델의 성능을 평가한 결과, GAN 모델을 활용하면 학습 데이터가 부족한 공격 유형에 대한 침입 탐지 성능을 크게 향상시킬 수 있음을 확인하였다.
통계
네트워크 트래픽 데이터셋 CIC-IDS2017에는 총 2,271,320개의 정상 트래픽 샘플과 1,956개의 봇넷 공격 샘플이 포함되어 있다.
생성된 봇넷 샘플을 원본 데이터셋에 49배 추가하여 학습한 NIDS 모델은 봇넷 탐지 정밀도 1.00, 재현율 0.76, F1-점수 0.87을 달성하였다.
생성된 봇넷 샘플을 원본 데이터셋에 99배 추가하여 학습한 NIDS 모델은 봇넷 탐지 정밀도 1.00, 재현율 0.82, F1-점수 0.90을 달성하였다.
인용구
"생성적 적대 신경망을 활용하여 실제 네트워크 트래픽과 유사한 합성 데이터를 생성함으로써 네트워크 침입 탐지 시스템의 성능을 향상시킬 수 있다."
"GAN 모델을 활용하면 학습 데이터가 부족한 공격 유형에 대한 침입 탐지 성능을 크게 향상시킬 수 있다."