In dieser Arbeit stellen wir einen neuen Ansatz zur effizienten Schätzung von Kameraparametern aus spärlichen Ansichten vor. Anstatt direkt globale Kameraparameter wie Rotation und Translation vorherzusagen, wie es bisherige Methoden tun, behandeln wir die Aufgabe als Vorhersage einer Verteilung von Kamerastrophären.
Zunächst beschreiben wir eine einfache Regressionsmethode, die Bildmerkmale mit den entsprechenden Kamerastrophären in Verbindung bringt. Diese Methode übertrifft bereits den Stand der Technik deutlich.
Um die inhärente Unsicherheit in der Posenschätzung aus spärlichen Ansichten zu berücksichtigen, erweitern wir unseren Ansatz zu einem probabilistischen Diffusionsmodell. Dieses Modell kann plausible Verteilungen über mögliche Kameraparameter schätzen und so besser mit Symmetrien und partiellen Beobachtungen umgehen.
Wir evaluieren unsere Methoden auf dem CO3D-Datensatz und zeigen, dass sie sowohl für bekannte als auch unbekannte Objektkategorien state-of-the-art Leistung erzielen. Darüber hinaus demonstrieren wir die Generalisierungsfähigkeit unseres Ansatzes auf Selbstaufnahmen in freier Wildbahn.
To Another Language
from source content
arxiv.org
Key Insights Distilled From
by Jason Y. Zha... at arxiv.org 03-20-2024
https://arxiv.org/pdf/2402.14817.pdfDeeper Inquiries