U-ARE-ME ist ein Algorithmus zur Schätzung der Kamerarotation aus monokularen RGB-Bildern. Er nutzt die Annahme einer Manhattan-Welt, um die Kamerarotation aus den pro-Pixel geschätzten Oberflächennormalen zu berechnen.
Zunächst wird für jedes Einzelbild die Rotation optimiert, indem eine gewichtete Kostenfunktion minimiert wird, die die Unsicherheit in den Normalenschätzungen berücksichtigt. Dadurch werden Bildpixel mit unzuverlässigen Normalen heruntergewichtet.
Anschließend wird eine zeitlich konsistente Schätzung über eine Sequenz von Bildern hinweg durchgeführt. Dafür wird ein Faktor-Graph-Modell verwendet, das die Einzelbildschätzungen sowie deren Unsicherheit nutzt, um eine global konsistente Rotationsschätzung zu erhalten. Ausreißer-Messungen werden dabei robust behandelt.
Die Experimente zeigen, dass U-ARE-ME vergleichbare Genauigkeit wie RGB-D-Methoden erreicht, aber deutlich robuster ist als klassische merkmalbasierte SLAM-Verfahren. Insbesondere in herausfordernden Umgebungen mit Bildrauschen und Unschärfe übertrifft U-ARE-ME andere monokulare Ansätze. Darüber hinaus kann U-ARE-ME auch in nicht-inertialen Referenzrahmen eingesetzt werden, um die Beschränkungen von IMU-Sensoren zu überwinden.
A otro idioma
del contenido fuente
arxiv.org
Ideas clave extraídas de
by Aalok Patwar... a las arxiv.org 03-26-2024
https://arxiv.org/pdf/2403.15583.pdfConsultas más profundas