Die Studie untersucht die Auswirkungen von verlustbehafteter Videokompression auf Objekterkennungsaufgaben mit Fisheye-Kameras, wie sie in Fahrzeugsystemen zur Rundumsicht eingesetzt werden.
Zunächst wird der Kompressionsgewinn verschiedener Videocodecs (AVC, HEVC) auf Fisheye-Datensätzen (Woodscape, FishEye8K) analysiert. Dabei zeigt sich, dass Kompressionsraten über 50:1 möglich sind, wenn die Bewegungsmodelle der Codecs die Kamerabewegung gut abbilden können.
Anschließend wird der Einfluss der Kompression auf die Objekterkennung mit YOLOv7 untersucht. Dabei wird deutlich, dass die Leistung bis zu einem Kompressionsparameter (QP) von 20 kaum beeinträchtigt wird. Bei höheren Kompressionsraten nimmt die Genauigkeit (mAP) jedoch stärker ab.
Um die Auswirkungen auf die stark verzerrten Randbereiche des Fisheye-Bildes besser zu erfassen, wird eine zonale mAP-Metrik eingeführt. Diese zeigt, dass die Kompression die Objekterkennung in den Randbereichen deutlich stärker beeinträchtigt als im Bildmittelpunkt.
Abschließend wird ein verbessertes Bewegungsmodell für Videocodecs vorgestellt, das die Epipolargeometrie der Fisheye-Kamera nutzt. Damit lässt sich die Vorhersagegenauigkeit um 34% steigern, was zu einer weiteren Verbesserung der Kompressionsraten führen kann.
In eine andere Sprache
aus dem Quellinhalt
arxiv.org
Wichtige Erkenntnisse aus
by Madhumitha S... um arxiv.org 03-26-2024
https://arxiv.org/pdf/2403.16338.pdfTiefere Fragen