Nutzung von sprachbasierten Tiefenhinweisen zur monokularen Tiefenschätzung
Menschliche Sprache enthält implizite Informationen über die wahrscheinliche Verteilung von Objekttiefen in der Welt. Diese Informationen können verwendet werden, um die Leistung bestehender monokularer Tiefenschätzungssysteme zu verbessern.