Das Anonymisieren von Quellcode ist ein schwieriges Problem, das weitere Aufmerksamkeit von der Forschungsgemeinschaft erfordert.
Unser innovativer Deep-Learning-basierter Ansatz LEO kann die Charakteristiken von Quellcode-Daten effektiv lernen und die Beziehungen zwischen versteckten Schwachstellenmustern innerhalb und zwischen Quellcode-Daten nutzen, um die Datenrepräsentationslernung zu verbessern und die Erkennung von Quellcode-Daten außerhalb der Verteilung zu ermöglichen.
Durch eine eingehende Analyse der Unterschiede zwischen maschinell und manuell erstelltem Quellcode in Bezug auf Lexikalische Vielfalt, Prägnanz und Natürlichkeit können charakteristische Muster identifiziert werden, die es ermöglichen, maschinell generierten Quellcode zuverlässig zu erkennen.