핵심 개념
신뢰할 수 있는 특징 선택을 통해 기계 학습 모델의 강건성과 계산 효율성을 향상시킬 수 있다.
초록
이 연구는 사이버 공격 탐지를 위한 특징 선택 및 합의 프로세스를 제시한다. 5가지 특징 선택 방법을 CICIDS2017, NewCICIDS, HIKARI21, NewHIKARI 데이터셋에 적용하여 두 가지 특징 집합을 선택했다. 이 특징 집합을 사용하여 4가지 기계 학습 모델(RF, XGB, LGBM, EBM)을 일반 및 적대적 학습으로 학습시켰다. 마지막으로 적대적 회피 강건성 벤치마크를 수행하여 다양한 특징 집합의 신뢰성과 모델의 적대적 예제에 대한 취약성을 분석했다. 데이터 다양성이 높은 데이터셋, 시간 관련 특징 선택, 더 구체적인 특징 집합 사용, 적대적 학습을 통해 기계 학습 모델의 적대적 강건성이 향상되었다. 일반화 성능 저하 없이, 오탐 증가 없이, 계산 자원 증가 없이 모델의 강건성이 크게 향상되어 기업 컴퓨터 네트워크에서 의심스러운 활동과 교란된 트래픽 흐름을 안정적으로 탐지할 수 있게 되었다.
통계
전체 연결 시간이 가장 중요한 특징이다.
전방 및 후방 패킷 IAT 특징들이 중요하다.
유휴 시간 관련 특징들이 중요하다.
인용구
"신뢰할 수 있는 특징 선택을 통해 기계 학습 모델의 강건성과 계산 효율성을 향상시킬 수 있다."
"데이터 다양성이 높은 데이터셋, 시간 관련 특징 선택, 더 구체적인 특징 집합 사용, 적대적 학습을 통해 기계 학습 모델의 적대적 강건성이 향상되었다."
"일반화 성능 저하 없이, 오탐 증가 없이, 계산 자원 증가 없이 모델의 강건성이 크게 향상되어 기업 컴퓨터 네트워크에서 의심스러운 활동과 교란된 트래픽 흐름을 안정적으로 탐지할 수 있게 되었다."