本研究では、低リソースISAのバイナリコードを高リソースISAに無監督で翻訳するモデル「UNSUPERBINTRANS」を提案している。
まず、命令埋め込み(instruction embedding)を生成する。命令セットアーキテクチャ(ISA)ごとに単一アーキテクチャ命令埋め込み(MAIE)を生成し、それらを共通の空間にマッピングすることで、クロスアーキテクチャ命令埋め込み(CAIE)を得る。
次に、CAIE を使ってUNSUPERBINTRANSモデルを訓練する。このモデルは、低リソースISAのバイナリを高リソースISAのバイナリに翻訳することができる。
最後に、翻訳されたバイナリを使って、高リソースISAで訓練されたモデルを適用することで、低リソースISAのバイナリを分析できる。
具体的には、コード類似性検出と脆弱性発見の2つのタスクで評価を行った。その結果、UNSUPERBINTRANS は高い精度を達成し、低リソースISAの分析に有効であることが示された。
Naar een andere taal
vanuit de broninhoud
arxiv.org
Belangrijkste Inzichten Gedestilleerd Uit
by Iftakhar Ahm... om arxiv.org 05-01-2024
https://arxiv.org/pdf/2404.19025.pdfDiepere vragen