本研究では、Android マルウェア検出のための機械学習モデルの構築において、特徴量とモデルの重要性を調査している。
主な内容は以下の通り:
過去の研究を再実装し、大規模な最新のデータセットを用いて再評価を行った。これにより、Android エコシステムにおける現在の性能を把握することができた。
静的分析、動的分析、ハイブリッド分析の3つのアプローチについて、特徴量の重要性とモデルの性能を比較した。
API呼び出しとオペコードが最も有効な静的特徴量であり、TCPネットワークトラフィックが最も有効な動的特徴量であることを示した。
ランダムフォレストが一般的に最も効果的なモデルであり、より複雑な深層学習アプローチよりも優れていることを明らかにした。
静的特徴量と動的特徴量のモデルを組み合わせたアンサンブルアプローチにより、97.8%の高精度を達成した。
他の言語に翻訳
原文コンテンツから
arxiv.org
深掘り質問