Core Concepts
Algorithmen zur verteilten Schätzung und zum Lernen von unbekannten statistischen Eigenschaften von Zufallsvariablen, die die Privatsphäre der Agenten unter differentieller Privatsphäre schützen.
Abstract
In dieser Arbeit werden neuartige Algorithmen für die verteilte Schätzung des Erwartungswerts von Suffizienzstatistiken in einer exponentiellen Familienverteilung vorgestellt. Die vorgeschlagenen Methoden nutzen Signale, die von individuellen Agenten empfangen werden, die Schätzungen auf der Grundlage dieser Signale und Informationen aus ihrer lokalen Nachbarschaft pflegen und aktualisieren. Die Algorithmen erweitern die bestehende Literatur zur verteilten Schätzung und ermöglichen es den teilnehmenden Agenten, eine vollständige Suffizienzstatistik aus privaten Signalen zu schätzen, die offline oder online im Laufe der Zeit erfasst wurden, und gleichzeitig die Privatsphäre ihrer Signale und Netzwerknachbarschaften zu wahren. Dies wird durch lineare Aggregationsverfahren mit angepassten Randomisierungsverfahren erreicht, die dem Austausch von Schätzungen unter differentieller Privatsphäre (DP) Beschränkungen Rauschen hinzufügen, sowohl offline als auch online. Es werden Konvergenzratenanalysen und enge Konvergenzschranken für endliche Zeiträume bereitgestellt. Es wird gezeigt, dass das Rauschen, das die Konvergenzzeit zu den besten Schätzungen minimiert, das Laplace-Rauschen ist, mit Parametern, die der Empfindlichkeit jedes Agenten gegenüber seinem Signal und den Netzwerkcharakteristiken entsprechen. Die Algorithmen sind für dynamische Topologien geeignet und ermöglichen einen Ausgleich zwischen Privatsphäre und Genauigkeit.
Stats
Die globale Empfindlichkeit ∆ ist das Maximum des Absolutbetrags der Ableitung von ξ(·).
Mn = max
i∈[n] |ξ(si)| ist der maximale absolute Wert der Suffizienzstatistiken.
a = maxi̸=j aij ist der maximale nicht-diagonale Eintrag der Adjazenzmatrix A.
β⋆= max{λ2(A), |λn(A)|} ist die Spektrallücke von A.
Quotes
"Die Laplace-Verteilung mit Parametern ∆/ε minimiert die Varianz des Rauschens unter den ε-DP-Beschränkungen."
"Die Gesamtfehlergrenze setzt sich aus zwei Termen zusammen: einem Term, der auf die Dezentralisierung zurückzuführen ist, und einem Term, der auf die Varianzen der hinzugefügten DP-Rauschvariablen zurückzuführen ist."