Die Arbeit führt ein neues Maß für die Informationskomplexität von Problemen mit mehrfachem Durchlaufen von Datenströmen ein. Dieses Maß wird dann verwendet, um untere Schranken für zwei wichtige Probleme in Datenströmen herzuleiten:
Das Münzproblem: Hier sieht man einen Datenstrom von n unabhängigen und gleichverteilten Bits {-1, 1} und möchte die Mehrheit mit konstanter Genauigkeit berechnen. Wir zeigen, dass jeder konstante Durchlauf-Algorithmus Ω(log n) Bits Speicher benötigt, was eine deutliche Verbesserung gegenüber der bisherigen Ω(log n) Schranke für Einpass-Algorithmen ist. Dies impliziert auch die erste Ω(log n) Schranke für das Approximieren eines Zählers bis auf einen konstanten Faktor in Turnstile-Datenströmen für mehr als einen Durchlauf.
Das Nadelproblem: Hier sieht man entweder einen Datenstrom von n unabhängigen und gleichverteilten Elementen aus einem Bereich [t], oder es gibt eine zufällig gewählte "Nadel" α∈[t], für die jedes Element mit Wahrscheinlichkeit p gleich α ist und ansonsten gleichverteilt in [t]. Wir zeigen optimale Schranken für mehrfaches Durchlaufen für jedes p< 1/√n log³ n, was eine offene Frage von Lovett und Zhang löst. Selbst für 1 Durchlauf sind unsere Schranken neu.
Darüber hinaus zeigen wir, wie unser Informationskomplexitätsmaß zu einer Reihe weiterer Anwendungen in Datenströmen führt, einschließlich unterer Schranken für ℓp-Norm-Schätzung, ℓp-Punktanfragen und Heavy Hitters sowie komprimierte Sensorprobleme.
To Another Language
from source content
arxiv.org
Key Insights Distilled From
by Mark Braverm... at arxiv.org 04-01-2024
https://arxiv.org/pdf/2403.20283.pdfDeeper Inquiries