Kernkonzepte
Durch den Einsatz von Wärmebildaufnahmen neben RGB-Bildern können neuronale Szenenrepräsentationen wie NeRFs erweitert und verbessert werden.
Zusammenfassung
Die Studie untersucht vier verschiedene Strategien, um eine zweite Modalität, neben RGB-Bildern, in neuronale Szenenrepräsentationen zu integrieren:
- Training von Grund auf für beide Modalitäten (TS)
- Feinabstimmung eines RGB-Modells auf die zweite Modalität (FT)
- Hinzufügen eines zweiten Zweigs zum Basismodell (RGB-X)
- Hinzufügen einer separaten Komponente für die zweite Modalität (SC)
Für die Evaluation wurde ein neuer Datensatz, ThermalMix, mit hochaufgelösten, präzise ausgerichteten RGB- und Wärmebildaufnahmen von sechs Objekten erstellt. Die Ergebnisse zeigen, dass die Strategie RGB-X die besten Rekonstruktionen von Wärmebildern liefert, während sie auch gute Ergebnisse für RGB-Bilder erzielt. Darüber hinaus lassen sich die Erkenntnisse auf andere Modalitäten wie Nah-Infrarot-Bilder und Tiefenkarten übertragen.
Statistiken
Die Wärmebildkamera hatte eine Auflösung von 640 x 480 Pixeln bei 60 Hz und einen Messbereich von -40 bis +2.000 Grad Celsius mit einer Genauigkeit von ±1 Grad Celsius.
Zitate
"Durch den Einsatz von Wärmebildaufnahmen neben RGB-Bildern können neuronale Szenenrepräsentationen wie NeRFs erweitert und verbessert werden."
"Die Strategie RGB-X liefert die besten Rekonstruktionen von Wärmebildern, während sie auch gute Ergebnisse für RGB-Bilder erzielt."