Główne pojęcia
Ein Werkzeugsatz, der eine verteilte, datenschutzfreundliche Aggregation von Sensordaten auf Edge-Geräten ermöglicht, unter Berücksichtigung der begrenzten Ressourcen der Geräte.
Streszczenie
Der Artikel präsentiert PrivAgE, einen Werkzeugsatz für eine verteilte, datenschutzfreundliche Aggregation von Sensordaten auf Edge-Geräten.
Der Werkzeugsatz besteht aus einer App, einem Server und einem Kommunikationsprotokoll. Nutzer installieren die App auf ihren Edge-Geräten, die Daten wie Umgebungsaufnahmen und Bluetooth-Geräteanzahlen sammeln. Diese Daten werden lokal in Histogrammen aggregiert und mit Rauschen versehen, um Differentiellen Datenschutz zu gewährleisten.
Der Server koordiniert dann eine sichere Aggregation der lokalen, verrauschten Histogramme aller Nutzer mithilfe eines Secure-Summation-Protokolls. Dadurch können weder der Server noch andere Parteien die individuellen Eingaben der Nutzer erfahren. Das Endergebnis, ein globales Histogramm, wird anschließend auf einer Website veröffentlicht, um weitere Analysen zu ermöglichen.
Die Autoren evaluieren den Werkzeugsatz hinsichtlich Leistungsaufnahme, Laufzeit und Bandbreitenverbrauch auf realen und simulierten Geräten. Zusätzlich diskutieren sie eine Erweiterung des Werkzeugsatzes um eine verteilte, differentiell private Clusteranalyse von Umgebungssequenzen.
Statystyki
Die Laufzeit der Secure-Summation-Protokoll-Implementierung beträgt für 10^3 Nutzer ca. 24,5 Sekunden, für 10^4 Nutzer ca. 27,4 Sekunden und für 10^5 Nutzer ca. 28,4 Sekunden.
Die Leistungsaufnahme für akustische Szenenklassifikation alle 5 Minuten erhöht sich um 5% im Vergleich zur Baseline, bei Klassifikation alle Minute jedoch deutlich stärker.
Die Gesamtmenge der übertragenen Daten für einen Nutzer beträgt ca. 6 MB, was deutlich unter dem durchschnittlichen Datenverbrauch von 5-minütigem Instagram-Browsen liegt.
Cytaty
"Valuable insights, such as frequently visited environments in the wake of the COVID-19 pandemic, can oftentimes only be gained by analyzing sensitive data spread across edge-devices like smartphones."
"To still be able to maximize the value of sensory data while simultaneously providing the necessary degree of privacy protection, we see two approaches, namely privacy-preserving federated learning or specialized aggregation schemes."
"To the best of our knowledge, frameworks for privacy-preserving federated learning oftentimes do not provide any code [10, 11], or the provided code can only be used to reproduce experimental results and set up a local implementation [3, 7]."