Eine neuartige hybride SNN-ANN-Architektur kombiniert die Stärken von Spiking Neural Networks (SNNs) und Analog Neural Networks (ANNs), um den optischen Fluss aus ereignisbasierten Kamerabildern effizient zu schätzen.
IFFNeRF schätzt die 6DoF-Kamerapose eines gegebenen Bildes, ohne eine initiale Pose zu benötigen, indem es auf der Neural Radiance Fields (NeRF)-Formulierung aufbaut.
Dieses Papier stellt ein neues offenes Problem vor, die offene Vokabular-Kategorie-Level-Objektpose- und Größenschätzung. Durch die Nutzung von visuell-sprachlichen Grundmodellen kann das Modell die Pose und Größe von Objekten in Szenenbildern schätzen, basierend auf freien Textbeschreibungen der Objekte.
Eine neuartige Methode zur nahtlosen Anpassung von vortrainierten Grundlagenmodellen für die visuelle Ortskennung, die sowohl globale als auch lokale Merkmale zur Unterscheidung von Orten effizient erzeugt.
EC-Depth, ein neuartiges zweistufiges selbstüberwachtes Framework, verbessert die Genauigkeit und Robustheit der Tiefenschätzung, insbesondere in herausfordernden Szenarien, durch Konsistenzregularisierung und konsistenzbasierte Pseudo-Label-Filterung.
DynaMoN nutzt semantische Segmentierung und generische Bewegungsmasken, um die Kameraposenschätzung in dynamischen Umgebungen zu verbessern und die Qualität der Neuansichtsynthese zu erhöhen.
Eine kompakte 3D-Gaussian-Splatting-basierte SLAM-Lösung, die Speichereffizienz, Trainingsgeschwindigkeit und Renderleistung deutlich verbessert, ohne die Rekonstruktionsqualität zu beeinträchtigen.
Ein neuartiges, vollständig datengetriebenes neuronales Markov-Zufallsfeld-Modell, das sowohl die Potenzialfunktionen als auch den Nachrichtenaustausch mithilfe von Neuronalen Netzen lernt. Dies ermöglicht eine präzisere Modellierung der komplexen Beziehungen zwischen Pixeln und führt zu state-of-the-art Genauigkeit und Robustheit bei der Stereo-Tiefenschätzung.
Eine 6-DoF-monokulare RGB-basierte Posenschätzungsmethode, die eine vortrainierte Plenoxels-Darstellung der Umgebung nutzt, um die Kamerapose durch Minimierung des photometrischen Fehlers zwischen gerenderten und Referenzbildern zu schätzen.
Bildbasierte Pose-Regressions-Modelle können eine kostengünstige, konsistente und genaue Alternative zur Positionsbestimmung in Unterwassermissionen bieten. Durch den Einsatz von LSTM-Schichten und Datenaugmentierung können die Modelle die Positionsgenauigkeit in Unterwasserumgebungen weiter verbessern.