Kernekoncepter
強化学習は、マルウェアの事後調査を自動化し、進化する脅威への適応性を高める可能性を秘めているが、その有効性を最大限に引き出すには、報酬システム、特徴抽出、および従来のフォレンジック手法との統合に関するさらなる最適化が必要である。
Resumé
マルウェアの事後調査のための新しい強化学習モデル:有効性と改善点
本研究論文は、従来の人間のフォレンジック専門家の能力を超えるように設計された、インシデント後のマルウェアフォレンジック調査のための新しい強化学習(RL)モデルとフレームワークを提示しています。このモデルは、Windowsシステムからのライブメモリダンプなどのさまざまな技術を統合することで、マルウェア分析を加速し、既知および未知の脅威を特定します。
インシデント後のマルウェアフォレンジック調査において、強化学習(RL)技術を活用して、マルウェアの特定、分析、およびモデルの強化を行う。
英国の司法制度における誤審を軽減するために、フォレンジックプロセスを迅速化する。
セキュリティ侵害後の全体的なサイバーセキュリティ対策を強化するために、RLを適用してヒューリスティックおよびシグネチャベースの分析方法を改善する。
マルウェア分析ワークフローを使用してマルコフ決定プロセス(MDP)を開発し、Q学習アルゴリズムを使用してRLエージェントをトレーニングする。
BlankEnvironment、BlankEnvironment_with_Rewards、BlankEnvironment_with_Timeの3つの異なる環境を使用して、それぞれ異なる報酬メカニズムを使用してマルウェア分析を最適化する。
WannaCryやCerberなどのマルウェアを使用したシミュレーションを含む実験テストを実施して、モデルの有効性を評価する。