Die vorgeschlagene Methode QMVOS führt Objektabfragen ein, um die objektagnostische gedächtnisbasierte Videoobjektsegmentierung mit objektbezogener Wahrnehmung und dynamischer Vorhersage zu ergänzen. Dies ermöglicht eine effiziente und effektive Interaktion zwischen mehreren Objekten.
Eine neue Methode für selbstüberwachte Videoobjektsegmentierung, die auf dem Destillationslernen von deformierbarer Aufmerksamkeit basiert. Die Methode verwendet eine leichtgewichtige Architektur, die sich zeitlichen Änderungen effektiv anpasst, und überträgt Objektrepräsentationen von einem großen Modell auf ein kleineres Modell.
Cutie, ein neuronales Netzwerk für Videoobjektsegmentierung, verwendet ein objektorientiertes Gedächtnis-Lesen, um die Objektrepräsentation aus dem Gedächtnis zurück in das Segmentierungsergebnis einzubinden. Dies führt zu einer deutlich robusteren Leistung, insbesondere in herausfordernden Szenarien.