本研究では、低リソースISAのバイナリコードを高リソースISAに無監督で翻訳するモデル「UNSUPERBINTRANS」を提案している。
まず、命令埋め込み(instruction embedding)を生成する。命令セットアーキテクチャ(ISA)ごとに単一アーキテクチャ命令埋め込み(MAIE)を生成し、それらを共通の空間にマッピングすることで、クロスアーキテクチャ命令埋め込み(CAIE)を得る。
次に、CAIE を使ってUNSUPERBINTRANSモデルを訓練する。このモデルは、低リソースISAのバイナリを高リソースISAのバイナリに翻訳することができる。
最後に、翻訳されたバイナリを使って、高リソースISAで訓練されたモデルを適用することで、低リソースISAのバイナリを分析できる。
具体的には、コード類似性検出と脆弱性発見の2つのタスクで評価を行った。その結果、UNSUPERBINTRANS は高い精度を達成し、低リソースISAの分析に有効であることが示された。
Egy másik nyelvre
a forrásanyagból
arxiv.org
Mélyebb kérdések