本研究では、Python ソースコードの脆弱性検出のために、Gaussian Naive Bayes (GNB)、Decision Tree、Logistic Regression (LR)、Multi-Layer Perceptron (MLP)、Bidirectional Long Short-Term Memory (BiLSTM) の5つの機械学習モデルを適用し、比較を行った。
データセットは、Wartschinski らが公開した GitHub リポジトリから収集したものを使用した。SQL injection、XSS、command injection、XSRF、remote code execution、path disclosure、open redirect の7つの脆弱性タイプを対象とした。
実験の結果、BiLSTMモデルが最も優れた性能を示し、平均精度98.6%、平均F-スコア94.7%、平均精度96.2%、平均再現率93.3%、平均ROC 99.3%を達成した。これは、既存の手法を上回る新しいベンチマークとなっている。
לשפה אחרת
מתוכן המקור
arxiv.org
תובנות מפתח מזוקקות מ:
by Talaya Faras... ב- arxiv.org 04-16-2024
https://arxiv.org/pdf/2404.09537.pdfשאלות מעמיקות