Core Concepts
大規模言語モデルを用いて、サイバーセキュリティ事象の分析と対応能力を強化する
Abstract
本論文では、サイバーセキュリティ事象の分析と対応能力を強化するためのフレームワーク「SEVENLLM」を提案している。
まず、サイバーセキュリティ関連のウェブサイトから収集した高品質な二言語(英語と中国語)のデータを基に、28種類の理解タスクと生成タスクからなる教示コーパス「SEVENLLM-Instruct」を構築した。
次に、SEVENLLM-Instructを用いて、オープンソースの大規模言語モデル(LLaMA、QWen)をサイバーセキュリティ分野向けに微調整した「SEVENLLM」を開発した。
さらに、SEVENLLM-Benchという評価ベンチマークを構築し、SEVENLLMの性能を多角的に評価した。
実験の結果、SEVENLLMは従来のLLMに比べて、サイバーセキュリティ事象の分析と対応能力が大幅に向上することが示された。
Stats
サイバーセキュリティ事象が10億件以上発生している
収集したサイバーセキュリティ関連データは英語6,706件、中国語1,779件
SEVENLLM-Instructには約85,000件のサンプルが含まれている
SEVENLLM-Benchには1,200件のテストサンプルが含まれている
Quotes
"To address the increasing complexity and frequency of cybersecurity incidents emphasized by the recent cybersecurity threat reports with over 10 billion instances, cyber threat intelligence (CTI) plays a critical role in the modern cybersecurity landscape by offering the insights required to understand and combat the constantly evolving nature of cyber threats."
"Inspired by the powerful capability of large language models (LLMs) in handling complex tasks, in this paper, we introduce a framework to benchmark, elicit, and improve cybersecurity incident analysis and response abilities in LLMs for Security Events (called SEVENLLM)."