Centrala begrepp
Ein Umgebungsvorhersagemodell, das Semantikinformationen einbezieht, kann die Genauigkeit der Vorhersage von zukünftigen Belegungszuständen im Vergleich zu Modellen ohne Semantik verbessern.
Sammanfattning
Das vorgeschlagene Umgebungsvorhersagemodell besteht aus zwei Modulen: einem Semantikvorhersagemodul und einem Belegungsvorhersagemodul. Das Semantikvorhersagemodul lernt, wie sich die Umgebungssemantik zeitlich entwickelt, während das Belegungsvorhersagemodul diese Semantikinformationen nutzt, um die zukünftigen Belegungszustände vorherzusagen.
Das Semantikvorhersagemodul basiert auf einer angepassten Version der PredNet-Architektur, die darauf trainiert wird, zukünftige semantische Gitterkarten (SMGMs) vorherzusagen. Das Belegungsvorhersagemodul erhält diese vorhergesagten SMGMs als zusätzlichen Eingabekanal neben den vergangenen Belegungsgitterkarten (OGMs) und lernt, die zukünftigen Belegungszustände unter Berücksichtigung der Semantikinformationen vorherzusagen.
Die Experimente auf dem Waymo Open Dataset zeigen, dass das vorgeschlagene Modell, das Semantikinformationen einbezieht, eine höhere Vorhersagegenauigkeit und eine bessere Beibehaltung der Erscheinung bewegter Objekte in den Vorhersagen über längere Vorhersagezeiträume hinweg erreicht als Baseline-Methoden, die nur Belegungsinformationen oder Umgebungsdynamik verwenden.
Statistik
Die Vorhersagegenauigkeit (MSE) des semantikbasierten Modells ist 22,6% besser als die des Baseline-Modells, das nur Umgebungsdynamik verwendet, und 25,1% besser als das Baseline-Modell ohne Semantik- oder Dynamikinformationen.
Die Beibehaltung der Struktur der Umgebung in den Vorhersagen (IS-Metrik) ist 22,6% besser als beim Baseline-Modell mit Umgebungsdynamik und 32,1% besser als beim Baseline-Modell ohne zusätzliche Informationen.
Die Vorhersagegenauigkeit für dynamische Objekte (dynamischer MSE) ist 22,9% besser als beim Baseline-Modell mit Umgebungsdynamik und 18,9% besser als beim Baseline-Modell ohne zusätzliche Informationen.
Citat
"Mit unserem vorgeschlagenen semantikbasierten Modell können wir die Erscheinung bewegter Objekte in den Vorhersagen über längere Vorhersagezeiträume hinweg besser beibehalten als die Baseline-Methoden."
"Die Verbesserung der Vorhersagegenauigkeit ist darauf zurückzuführen, dass das Modell Zugriff auf sowohl die Belegungswahrscheinlichkeit als auch die Objektklasse jeder Zelle hat und so die Bewegung besser räumlich und zeitlich propagieren kann."