Der Artikel befasst sich mit den Herausforderungen beim Anonymisieren von Quellcode. Er beginnt mit einer Einführung in die Autorenzuordnung von Quellcode, bei der Merkmale des Programmierstils verwendet werden, um den Autor eines Programms zu identifizieren. Dies stellt eine Bedrohung für Entwickler von Zensur-Umgehungs- und Datenschutztechnologien dar, da sie identifizierbar werden und strafrechtlich verfolgt werden könnten.
Der Artikel führt ein theoretisches Framework zur Analyse der Quellcode-Anonymität ein. Es wird bewiesen, dass das Erstellen eines allgemeingültigen k-anonymen Programms, bei dem der Autor nicht von k-1 anderen Autoren unterschieden werden kann, im Allgemeinen nicht berechenbar ist. Stattdessen wird ein lockereres Konzept der k-Unsicherheit eingeführt, bei dem die Zuordnungswahrscheinlichkeiten der k ähnlichsten Autoren nahe beieinander liegen.
Basierend auf diesem Konzept werden verschiedene Techniken zur Anonymisierung von Quellcode empirisch untersucht, darunter Codenormalisierung, Nachahmung des Programmierstils und Codeobfuskation. Keine der Techniken bietet einen zuverlässigen Schutz, wenn der Angreifer von der Anonymisierung weiß. Zwar lässt sich die Leistung der Autorenzuordnung deutlich reduzieren, eine vollständige Anonymität wird jedoch nicht erreicht. Der Artikel schlussfolgert, dass das Anonymisieren von Quellcode ein schwieriges Problem ist, das weitere Forschung erfordert.
Sang ngôn ngữ khác
từ nội dung nguồn
arxiv.org
Thông tin chi tiết chính được chắt lọc từ
by Micha Horlbo... lúc arxiv.org 04-11-2024
https://arxiv.org/pdf/2208.12553.pdfYêu cầu sâu hơn