Core Concepts
Zwei stichprobeneffiziente differentiell private Schätzer für den Mittelwert von d-dimensionalen (sub)Gauß-Verteilungen mit unbekannter Kovarianz. Die Schätzer liefern eine Approximation des Mittelwerts, die in Mahalanobis-Distanz nahe am wahren Mittelwert liegt, ohne dass die Kovarianz selbst geschätzt werden muss.
Abstract
Die Arbeit präsentiert zwei differentiell private Schätzer für den Mittelwert von d-dimensionalen (sub)Gauß-Verteilungen mit unbekannter Kovarianz.
Der erste Schätzer basiert auf dem Exponentialmechanismus, der einen Punkt mit möglichst großer Tukey-Tiefe auswählt. Um die Differentialität zu gewährleisten, wird vor dem Hauptmechanismus geprüft, ob der Datensatz "sicher" ist, d.h. ob die Verteilung der Ausgabe auf benachbarten Datensätzen ähnlich ist. Es wird gezeigt, dass typische Gauß-Daten weit von unsicheren Datensätzen entfernt sind und der Schätzer daher genau und differentiell privat ist.
Der zweite Schätzer addiert zum empirischen Mittelwert Rauschen, dessen Varianz an die empirische Kovarianz angepasst ist, ohne die Kovarianz selbst zu veröffentlichen. Dieser Schätzer funktioniert auch für allgemeinere subgaussische Verteilungen, allerdings mit einer etwas schlechteren Abhängigkeit vom Privatsphäreparameter.
Beide Schätzer erfordern eine sorgfältige Vorverarbeitung der Daten, um die Differentialität zu gewährleisten.
Stats
Die Stichprobenkomplexität beider Schätzer hängt von der Dimension d, dem Genauigkeitsparameter α und dem Privatsphäreparameter ε ab.
Quotes
Keine relevanten Zitate identifiziert.