Präzise Schätzung von Szenenfluss durch räumlich-zeitliche Merkmalseinbettung und aufmerksames Lernen für Echtzeit-Szenenanalyse
Unser Modell STARFlow schätzt den Szenenfluss präzise, indem es globale aufmerksame Zuordnung zwischen aufeinanderfolgenden Frames sowie räumlich-zeitliche Merkmalseinbettung für lokale Verfeinerung nutzt. Zusätzlich verbessern neuartige domänenadaptive Verluste die Generalisierungsfähigkeit auf verschiedene Datensätze.