核心概念
ソースコードデータの特性を考慮し、隠れた脆弱性パターンの関係性を活用することで、分布外ソースコードデータを効果的に識別できる。
摘要
本論文は、深層学習を用いて分布外ソースコードデータを識別する手法を提案している。
- ソースコードデータの特性を考慮し、重要な及び脆弱性関連のコードステートメントを自動的に選択する選択ネットワークを導入した。
- 脆弱なソースコードデータ内の隠れた脆弱性パターンの関係性を活用するため、クラスター対比学習を提案した。
- 提案手法は、基準となるデータ分布から大きく外れたソースコードデータを効果的に識別できることを実験的に示した。
- 特に、提案手法は基準手法と比べて、FPR、AUROC、AUPRの各指標で15.27%、7.39%、4.93%の高い性能を達成した。
統計資料
ソースコードデータの脆弱性を正確に検出できないと、重大なセキュリティ上の問題につながる可能性がある。
ソフトウェアの脆弱性は、攻撃者が不正な活動を行う可能性を高めるため、深刻な問題となっている。
引述
「ソフトウェアの脆弱性は、攻撃者が不正な活動を行う可能性を高めるため、深刻な問題となっている。」
「ソースコードデータの特性を考慮し、隠れた脆弱性パターンの関係性を活用することで、分布外ソースコードデータを効果的に識別できる。」