Core Concepts
URL 문맥 특성을 활용하여 Multi-Head Attention, TCN, LSTM, BiLSTM과 같은 딥러닝 모델의 피싱 웹사이트 탐지 성능을 비교 분석하였다. 실험 결과, BiLSTM 모델이 가장 우수한 성능을 보였다.
Abstract
이 연구는 URL을 순차적 데이터로 간주하고 다양한 딥러닝 모델을 적용하여 피싱 웹사이트를 탐지하는 방법을 제안한다. 기존 연구들이 주로 웹페이지의 정적 특성이나 URL 분석에 의존했던 것과 달리, 이 연구에서는 URL 자체를 순차 데이터로 처리하여 Multi-Head Attention, TCN, LSTM, BiLSTM 등의 딥러닝 모델을 적용하였다.
실험 결과, 모든 딥러닝 모델이 기존 URL 기반 탐지 방법보다 우수한 성능을 보였다. 특히 BiLSTM 모델이 정확도, 정밀도, 재현율, F1-score 면에서 가장 뛰어난 성능을 나타냈다. 반면 DQN 모델은 상대적으로 낮은 성능을 보였다.
또한 모델 별 학습 시간을 분석한 결과, LSTM 모델이 가장 빠른 학습 속도를 보였고 TCN 모델이 가장 느린 것으로 나타났다.
이 연구 결과는 URL 문맥 정보를 활용한 딥러닝 기반 피싱 웹사이트 탐지의 실효성을 입증하였다. 향후 연구에서는 다양한 피싱 웹사이트 데이터셋에 대한 추가 평가가 필요할 것으로 보인다.
Stats
피싱 웹사이트 탐지 모델 중 BiLSTM 모델이 정확도, 정밀도, 재현율, F1-score 면에서 가장 우수한 성능을 보였다.
LSTM 모델이 가장 빠른 학습 속도를 보였고, TCN 모델이 가장 느린 학습 속도를 보였다.
DQN 모델은 상대적으로 낮은 성능을 보였다.
Quotes
"이 연구는 URL을 순차적 데이터로 간주하고 다양한 딥러닝 모델을 적용하여 피싱 웹사이트를 탐지하는 방법을 제안한다."
"실험 결과, 모든 딥러닝 모델이 기존 URL 기반 탐지 방법보다 우수한 성능을 보였다."
"BiLSTM 모델이 정확도, 정밀도, 재현율, F1-score 면에서 가장 뛰어난 성능을 나타냈다."