Die Arbeit führt ein neues Maß für die Informationskomplexität von Problemen mit mehrfachem Durchlaufen von Datenströmen ein. Dieses Maß wird dann verwendet, um untere Schranken für zwei wichtige Probleme in Datenströmen herzuleiten:
Das Münzproblem: Hier sieht man einen Datenstrom von n unabhängigen und gleichverteilten Bits {-1, 1} und möchte die Mehrheit mit konstanter Genauigkeit berechnen. Wir zeigen, dass jeder konstante Durchlauf-Algorithmus Ω(log n) Bits Speicher benötigt, was eine deutliche Verbesserung gegenüber der bisherigen Ω(log n) Schranke für Einpass-Algorithmen ist. Dies impliziert auch die erste Ω(log n) Schranke für das Approximieren eines Zählers bis auf einen konstanten Faktor in Turnstile-Datenströmen für mehr als einen Durchlauf.
Das Nadelproblem: Hier sieht man entweder einen Datenstrom von n unabhängigen und gleichverteilten Elementen aus einem Bereich [t], oder es gibt eine zufällig gewählte "Nadel" α∈[t], für die jedes Element mit Wahrscheinlichkeit p gleich α ist und ansonsten gleichverteilt in [t]. Wir zeigen optimale Schranken für mehrfaches Durchlaufen für jedes p< 1/√n log³ n, was eine offene Frage von Lovett und Zhang löst. Selbst für 1 Durchlauf sind unsere Schranken neu.
Darüber hinaus zeigen wir, wie unser Informationskomplexitätsmaß zu einer Reihe weiterer Anwendungen in Datenströmen führt, einschließlich unterer Schranken für ℓp-Norm-Schätzung, ℓp-Punktanfragen und Heavy Hitters sowie komprimierte Sensorprobleme.
Til et annet språk
fra kildeinnhold
arxiv.org
Viktige innsikter hentet fra
by Mark Braverm... klokken arxiv.org 04-01-2024
https://arxiv.org/pdf/2403.20283.pdfDypere Spørsmål