Core Concepts
트윈 오토인코더(TAE)는 입력 데이터를 분리 가능한 표현으로 변환하여 사이버 공격 탐지 성능을 향상시킨다.
Abstract
이 논문은 사이버 공격 탐지를 위한 새로운 딥러닝 모델인 트윈 오토인코더(TAE)를 제안한다. TAE는 입력 데이터를 잠재 표현으로 변환한 후 이를 다시 분리 가능한 표현으로 변환한다. 이렇게 변환된 분리 가능한 표현은 기존 오토인코더 모델의 잠재 표현보다 공격과 정상 데이터를 더 잘 구분할 수 있다. TAE는 인코더, 헤르마프로디트, 디코더의 3개 하위 네트워크로 구성되며, 헤르마프로디트가 분리 가능한 표현을 재구성한다. 실험 결과, TAE는 다양한 사이버 보안 데이터셋에서 기존 최신 모델들보다 우수한 성능을 보였다. 특히 복잡하고 정교한 공격 탐지에서 TAE의 성능이 두드러졌다.
Stats
다양한 사이버 공격 유형이 존재하며, 매년 수천 개의 새로운 취약점과 악성 코드가 보고되고 있다.
IoT 데이터셋은 고차원적이고 특징 간 상관관계가 높으며, NSLKDD 데이터셋은 R2L 및 U2R 공격이 매우 낮은 비율로 존재하는 불균형 데이터셋이다.
일부 공격은 정상 사용자의 행동을 모방하여 은닉되어 있어 탐지가 어렵다.
Quotes
"오토인코더 모델은 입력 데이터를 잠재 표현으로 변환하지만, 이 잠재 표현은 공격과 정상 데이터를 잘 구분하지 못하는 문제가 있다."
"트윈 오토인코더는 잠재 표현을 분리 가능한 표현으로 변환하여 공격과 정상 데이터의 구분을 향상시킨다."