Core Concepts
深層学習モデルであるマルチヘッドアテンション、TCN、LSTM、BiLSTMを使用して、URLの文脈的特徴からフィッシングウェブサイトを検出する手法の性能を評価した。
Abstract
本研究では、フィッシング型サイバー攻撃に対処するため、URLを系列データとして扱い、深層学習モデルを適用する手法を提案した。具体的には以下の通りである:
URLをトークン列として表現し、マルチヘッドアテンション、TCN、LSTM、BiLSTMといった深層学習モデルを適用した。
これらのモデルを公開データセットで学習・評価し、精度、再現率、F1スコア、正確度などの性能指標を比較した。
実験の結果、BiLSTMモデルが最も優れた性能を示し、平均精度、再現率、F1スコア、正確度がいずれも0.98以上であった。一方、従来のDQNモデルは0.9未満の性能に留まった。
モデルの学習時間については、LSTMが最も短く、TCNが最も長かった。
本研究の成果は、URLの文脈的特徴を活用したフィッシング検出における深層学習の有効性を示しており、セキュリティ分野への応用が期待される。
Stats
実験に使用したデータセットには合計73,575のURLが含まれ、そのうち36,400がレジティメートなURL、37,175がフィッシングURLであった。
学習データは58,860件、テストデータは14,715件に分割された。
Quotes
"本研究は、URLを系列データとして扱い、深層学習モデルを適用することで、フィッシングウェブサイトの一般的な検出が可能であることを示した。"
"実験の結果、BiLSTMモデルが最も優れた性能を示し、平均精度、再現率、F1スコア、正確度がいずれも0.98以上であった。"