Core Concepts
Große Sprachmodelle (LLMs) haben sich als effektiv für verschiedene Aufgaben im Bereich der Softwaretechnik erwiesen, einschließlich der Erkennung und Reparatur von Sicherheitslücken. Diese Studie bietet eine systematische Literaturübersicht über Ansätze, die LLMs zur Verbesserung dieser beiden Aufgaben nutzen.
Abstract
Diese Studie bietet eine systematische Literaturübersicht über den Einsatz von Großen Sprachmodellen (LLMs) zur Erkennung und Reparatur von Sicherheitslücken in Software. Die Autoren haben 36 relevante Studien aus den letzten 6 Jahren (2018-2024) analysiert und dabei drei Forschungsfragen beantwortet:
Welche LLMs wurden bisher für die Erkennung und Reparatur von Sicherheitslücken verwendet?
Die Analyse zeigt, dass encoder-only LLMs für die Erkennung und encoder-decoder LLMs für die Reparatur von Sicherheitslücken dominieren.
Wie werden LLMs für die Erkennung von Sicherheitslücken angepasst?
Die Haupttechniken sind Finetuning (82%), Zero-Shot-Prompting (11%) und Few-Shot-Prompting (7%). Finetuning-Techniken wie datenorientierte Innovationen, Kombination mit Programmanalyse, Kombination mit anderen Deep-Learning-Modulen, domänenspezifisches Pretraining und kausales Lernen werden eingesetzt.
Wie werden LLMs für die Reparatur von Sicherheitslücken angepasst?
Auch hier dominiert Finetuning (80%), gefolgt von Zero-Shot-Prompting (13%) und Few-Shot-Prompting (7%). Techniken wie Einbeziehung vielfältiger relevanter Eingaben, modellzentrierte Innovationen, domänenspezifisches Pretraining und Verstärkungslernen werden verwendet.
Basierend auf den Erkenntnissen identifizieren die Autoren mehrere Herausforderungen, wie den Mangel an hochwertigen Datensätzen für Sicherheitslücken, die Komplexität der Vulnerabilitätsdaten, den engen Fokus auf Funktionsebene und die Notwendigkeit höherer Genauigkeit und Robustheit. Darüber hinaus skizzieren sie vielversprechende Forschungsmöglichkeiten, wie die Erstellung eines hochwertigen Testdatensatzes, den Einsatz von Repo-basierten Ansätzen, die Nutzung größerer Decoder-only LLMs und die Entwicklung maßgeschneiderter LLMs für Sicherheitslücken.
Stats
Die Anzahl der Softwaresicherheitslücken hat in letzter Zeit deutlich zugenommen.
Traditionelle Techniken wie regelbasierte Detektoren oder programmanalysebasierte Reparaturwerkzeuge haben Herausforderungen aufgrund hoher Fehlerquoten und ihrer Unfähigkeit, mit verschiedenen Arten von Sicherheitslücken umzugehen.
LLMs haben sich in verschiedenen Aufgaben der Softwaretechnik als effektiv erwiesen und werden zunehmend für die Erkennung und Reparatur von Sicherheitslücken eingesetzt.
Quotes
"LLM-basierte Ansätze für die Erkennung und Reparatur von Sicherheitslücken gewinnen aufgrund ihres Potenzials, automatisch Merkmale aus bekannten Sicherheitslücken zu lernen und unbekannte zu finden/zu beheben, zunehmend an Aufmerksamkeit."
"LLMs haben das Potenzial, umfangreiches Wissen aus dem großangelegten Pretraining zu nutzen, um die Erkennung und Reparatur von Sicherheitslücken zu verbessern."