Core Concepts
大規模言語モデルを活用し、アプリケーション機能の記述と振る舞いの要約を生成することで、Androidマルウェアの検出精度と解釈性を向上させる。
Abstract
本研究は、Androidマルウェア検出のためのシステム「AppPoet」を提案している。主な特徴は以下の通り:
静的解析によりアプリケーションから権限、API、URLなどの特徴を抽出し、それらを Permission View、API View、URL & uses-feature Viewの3つのビューに分類する。
大規模言語モデルを活用し、各ビューの特徴に対する機能記述と振る舞いの要約を生成する。プロンプトエンジニアリングにより、言語モデルの出力の質と安定性を高めている。
各ビューから生成された記述と要約を連結して特徴ベクトルを作成し、深層学習モデルによる分類器を訓練する。これにより、特徴の意味的情報を効果的に活用できる。
分類結果と各ビューの情報を基に、診断レポートを生成する。これにより、検出結果の解釈性と有用性が向上する。
実験の結果、AppPoetは既存の特徴工学ベースの手法と比べて、検出精度(97.15%)とF1値(97.21%)が優れていることが示された。また、プロンプトエンジニアリングの有効性や診断レポートの有用性も確認された。