Kernkonzepte
TAO-Amodal ist ein Benchmark, der die Fähigkeiten aktueller Tracker zur amodalen Verfolgung von Objekten unter starker Verdeckung bewertet. Der Benchmark umfasst 332.000 Boxen, die 833 Objektkategorien in 2.907 Videos abdecken.
Zusammenfassung
TAO-Amodal ist ein umfassender Benchmark für die amodale Objektverfolgung. Er basiert auf dem TAO-Datensatz und erweitert ihn um amodale Boxannotationen für vollständig und teilweise verdeckte Objekte, einschließlich solcher, die teilweise außerhalb des Bildrahmens liegen.
Der Benchmark umfasst folgende Kernpunkte:
- 332.000 amodale Boxannotationen für 833 Objektkategorien in 2.907 Videos
- Evaluierung der Leistung aktueller Tracker und Segmentierungsverfahren bei der amodalen Verfolgung
- Untersuchung von Finetuning-Strategien und Datenaugmentierung, um die Leistung bei der Verfolgung verdeckter Objekte zu verbessern
Die Evaluierung zeigt, dass bestehende Methoden Schwierigkeiten haben, Objekte unter starker Verdeckung zu erkennen und zu verfolgen. Einfache Finetuning-Ansätze können die Leistung bei der amodalen Erkennung und Verfolgung jedoch um bis zu 3,3% bzw. 2,1% steigern.
Statistiken
Über 332.000 amodale Boxannotationen für 833 Objektkategorien in 2.907 Videos
139.000 Boxen für teilweise verdeckte Objekte, 35.100 Boxen für stark verdeckte Objekte, 9.600 Boxen für Objekte außerhalb des Bildrahmens
Zitate
"TAO-Amodal aims at assessing the occlusion reasoning capabilities of current trackers for amodal tracking of any object."
"We find that existing methods, even when adapted for amodal tracking, struggle to detect and track objects under heavy occlusion."