Der Artikel befasst sich mit den Herausforderungen beim Anonymisieren von Quellcode. Er beginnt mit einer Einführung in die Autorenzuordnung von Quellcode, bei der Merkmale des Programmierstils verwendet werden, um den Autor eines Programms zu identifizieren. Dies stellt eine Bedrohung für Entwickler von Zensur-Umgehungs- und Datenschutztechnologien dar, da sie identifizierbar werden und strafrechtlich verfolgt werden könnten.
Der Artikel führt ein theoretisches Framework zur Analyse der Quellcode-Anonymität ein. Es wird bewiesen, dass das Erstellen eines allgemeingültigen k-anonymen Programms, bei dem der Autor nicht von k-1 anderen Autoren unterschieden werden kann, im Allgemeinen nicht berechenbar ist. Stattdessen wird ein lockereres Konzept der k-Unsicherheit eingeführt, bei dem die Zuordnungswahrscheinlichkeiten der k ähnlichsten Autoren nahe beieinander liegen.
Basierend auf diesem Konzept werden verschiedene Techniken zur Anonymisierung von Quellcode empirisch untersucht, darunter Codenormalisierung, Nachahmung des Programmierstils und Codeobfuskation. Keine der Techniken bietet einen zuverlässigen Schutz, wenn der Angreifer von der Anonymisierung weiß. Zwar lässt sich die Leistung der Autorenzuordnung deutlich reduzieren, eine vollständige Anonymität wird jedoch nicht erreicht. Der Artikel schlussfolgert, dass das Anonymisieren von Quellcode ein schwieriges Problem ist, das weitere Forschung erfordert.
Para Outro Idioma
do conteúdo original
arxiv.org
Principais Insights Extraídos De
by Micha Horlbo... às arxiv.org 04-11-2024
https://arxiv.org/pdf/2208.12553.pdfPerguntas Mais Profundas