In dieser Arbeit wird ein neuartiger Ansatz vorgestellt, um das Problem der Langzeitabhängigkeit für ruhende Objekte in Ereigniskameras durch Verfolgung von Verdeckung zu lösen. Die Architektur behält die reichhaltigsten räumlich-zeitlichen Informationen bei und verfolgt nur ruhende oder pseudo-verdeckte Objekte anstelle von tatsächlich verdeckten Objekten.
Zunächst wird ein Algorithmus zum automatischen Beschriften von ruhenden Objekten vorgeschlagen, um das Training der Objektpermanenz zu überwachen. Dann wird eine Modul zur räumlich-zeitlichen Merkmalsaggregation eingeführt, das eine bessere Verfolgung von ruhenden oder pseudo-verdeckten Objekten ermöglicht. Schließlich wird ein Konsistenzverlust vorgeschlagen, um die Robustheit der Gesamtpipeline zu erhöhen, indem nur ruhende Objekte beibehalten und tatsächlich verdeckte Objekte verworfen werden.
Die umfassenden Experimente zeigen die Wirksamkeit jeder Komponente unseres TEDNet, das eine state-of-the-art-Leistung in der objektbasierten Ereigniserkennung erreicht. Darüber hinaus wird ein Auto-Beschriftungsalgorithmus vorgeschlagen, um nicht nur zusätzliche Etiketten für ruhende Objekte hinzuzufügen, um das Training der Objektpermanenz zu überwachen, sondern auch jene Objekte zu verwerfen, die am Anfang einiger Videos nicht erkannt werden können, um das Modelltraining robuster zu machen.
翻譯成其他語言
從原文內容
arxiv.org
深入探究