Durch die Nutzung von Pseudo-Labels aus Perspektiven-Aufnahmen kann das Leistungsvermögen von Modellen zur Segmentierung von Vogelperspektiven-Aufnahmen aus Mehrfachkameras in Szenarien mit begrenzten annotierten Daten oder Domänenanpassung deutlich verbessert werden.
Wir schlagen eine Methode vor, die Höhen in der Vogelperspektive (BEV) explizit modelliert, ohne zusätzliche LiDAR-Daten zu verwenden. Unsere Methode ist äquivalent zu tiefenbasierten Methoden, hat aber Vorteile bei der Robustheit gegenüber unterschiedlichen Kameraanordnungen.