核心概念
Die Arbeit präsentiert einen neuartigen Rahmen zur Gestaltung eines optimalen Rausch-Wahrscheinlichkeitsmassfunktion (PMF), die auf diskrete und endliche Abfragemengen zugeschnitten ist. Der Ansatz optimiert die gesamte Rauschverteilung unter einer beliebigen (ϵ, δ)-Beschränkung, um die Genauigkeit und den Nutzen der Antwort zu verbessern.
摘要
Die Arbeit befasst sich mit der Entwicklung eines optimalen additiven Rauschverfahrens für differentiell private Abfragen mit diskreten endlichen Antwortmengen.
Zunächst wird gezeigt, dass das Problem, eine optimale additive Rauschverteilung für ein gegebenes Paar (ϵ, δ) und eine erwartete Verzerrungskosten zu finden, als gemischt-ganzzahliges lineares Programm (MILP) formuliert werden kann. Dieses MILP-Modell findet die optimale Rausch-PMF, die die spezifizierte erwartete Verzerrungskosten minimiert, während die (ϵ, δ)-Differentiell-Datenschutz-Bedingungen erfüllt werden.
Für zwei spezielle Fälle - "Single Distance" (SD) und "Bounded Distance" (BD) Nachbarschaften - werden explizite Ausdrücke für die optimale Rausch-PMF hergeleitet, die die Fehlerrate minimieren. Die Struktur der optimalen PMF und der Fehlerrate-Funktion wird analysiert, wobei gezeigt wird, dass die optimale (ϵ, δ)-Kurve stückweise linear ist und Diskontinuitäten aufweist.
Numerische Experimente belegen die überlegene Leistung der vorgeschlagenen optimalen Mechanismen im Vergleich zu state-of-the-art-Methoden.
統計資料
Die Anzahl der Haushalte in einem Zensus-Bezirk mit mindestens einem College-Absolventen beträgt 0 bis n, wobei n die Gesamtzahl der Haushalte in diesem Zensus-Bezirk ist.
Die beliebteste Werbeaktion auf einer Website hat Werte von 0 bis n, wobei n die Gesamtzahl der Werbeaktionen ist.
Die Stunde der Spitzenlast-Stromnutzung in einer Nachbarschaft liegt zwischen 0 und 23 Uhr.
引述
"Die Arbeit trägt zur Literatur über differentiellen Datenschutz bei, indem sie einen klaren und systematischen Ansatz zur Gestaltung von Rauschverfahren präsentiert, die nicht nur Datenschutzanforderungen erfüllen, sondern auch die Abfrageverzerrung optimieren."
"Der in dieser Arbeit eingeführte Rahmen eröffnet Wege für verbesserte datenschutzfreundliche Datenbankabfragen und bietet erhebliche Verbesserungen bei Antwortgenauigkeit und Nutzen."