이 논문은 네트워크 트래픽 내 악성코드 탐지 및 분류를 위한 트랜스포머 기반 알고리즘을 소개한다.
데이터 준비 단계에서는 UNSW-NB15와 CIC-IOT23 데이터셋을 사용하였다. 각 데이터셋에서 TCP/UDP 패킷의 페이로드 바이트를 추출하고, 중복된 페이로드를 제거하였다. 이후 페이로드 바이트를 16진수에서 10진수로 변환하여 모델의 입력으로 사용하였다.
모델 아키텍처는 임베딩 레이어, 트랜스포머 블록 및 자기 주의 메커니즘, 출력 레이어로 구성된다. 트랜스포머의 자기 주의 메커니즘을 통해 페이로드 내 복잡한 패턴과 의존성을 효과적으로 학습할 수 있다.
이 모델을 이진 분류와 다중 분류 실험에 적용한 결과, 기존 방법들에 비해 우수한 성능을 보였다. UNSW-NB15 데이터셋에서 이진 분류 정확도 79.57%, F1-Score 79.57%를 달성했으며, 다중 분류 정확도 74.24%, F1-Score 74.61%를 달성했다. CIC-IOT23 데이터셋에서도 이진 분류 정확도 79.07%, F1-Score 81.25%, 다중 분류 정확도 69.25%, F1-Score 69.31%를 기록했다.
이를 통해 제안된 트랜스포머 기반 모델이 네트워크 트래픽 내 악성코드를 효과적으로 탐지하고 분류할 수 있음을 확인하였다.
לשפה אחרת
מתוכן המקור
arxiv.org
תובנות מפתח מזוקקות מ:
by Kyle Stein,A... ב- arxiv.org 03-28-2024
https://arxiv.org/pdf/2403.18223.pdfשאלות מעמיקות