本論文は、コード脆弱性検出のための新しいモデルVul-LMGNNを提案している。Vul-LMGNNは、事前学習済みのコード言語モデルと、コードプロパティグラフを組み合わせることで、コードの構文、制御フロー、データ依存性などの重要な属性を効果的に捉えることができる。
具体的には、まずコードプロパティグラフを構築し、事前学習済みのCodeBERTモデルを使ってノードの埋め込みを初期化する。その後、ゲートつきグラフニューラルネットワーク(GGNN)を用いて、ノード間の依存関係を効果的に学習する。さらに、CodeBERTの予測結果とVul-LMGNNの予測結果を線形補間することで、最終的な脆弱性検出結果を得る。
実験の結果、Vul-LMGNNは4つのデータセットで最先端の手法を上回る性能を示した。特に小規模データセットでは約10%高いF1スコアを達成した。また、事前学習モデルの fine-tuning や、GNNアーキテクチャの違いが性能に与える影響についても分析を行っている。
A otro idioma
del contenido fuente
arxiv.org
Ideas clave extraídas de
by Ruitong Liu,... a las arxiv.org 04-24-2024
https://arxiv.org/pdf/2404.14719.pdfConsultas más profundas