Core Concepts
Eine Methode für die beliebig ausgerichtete Objekterkennung namens "Task-wise Sampling Convolutions" (TS-Conv) wird vorgeschlagen, die adaptiv aufgabenspezifische Merkmale aus entsprechenden empfindlichen Regionen abtastet und diese Merkmale zusammen ausrichtet, um eine dynamische Labelzuweisung für bessere Vorhersagen zu leiten.
Abstract
Der Artikel analysiert das Problem der inkonsistenten Merkmale für die Lokalisierungs- und Klassifizierungsaufgaben in Modellen für die beliebig ausgerichtete Objekterkennung (AOOD), was zu Mehrdeutigkeiten und Qualitätseinbußen bei den Objektvorhersagen führen kann.
Um dieses Problem zu lösen, wird eine AOOD-Methode namens "Task-wise Sampling Convolutions" (TS-Conv) vorgeschlagen. TS-Conv tastet adaptiv aufgabenspezifische Merkmale aus entsprechenden empfindlichen Regionen ab und bildet diese Merkmale zusammen aus, um eine dynamische Labelzuweisung für bessere Vorhersagen zu leiten.
Spezifisch wird die Abtastposition der Lokalisierungskonvolution in TS-Conv durch die Vorhersage der ausgerichteten Begrenzungsbox (OBB) überwacht, die mit den räumlichen Koordinaten verbunden ist. Während die Abtastposition und der Konvolutionskern der Klassifizierungskonvolution so gestaltet sind, dass sie sich entsprechend den verschiedenen Ausrichtungen adaptiv anpassen lassen, um die Ausrichtungsrobustheit der Merkmale zu verbessern.
Darüber hinaus wird eine dynamische aufgabenorientierte Labelzuweisung (DTLA) entwickelt, um optimale Kandidatenpositionen auszuwählen und Label dynamisch entsprechend den gewichteten aufgabenorientierten Scores zuzuweisen, die aus TS-Conv erhalten werden.
Umfangreiche Experimente auf mehreren öffentlichen Datensätzen, die verschiedene Szenen, multimodale Bilder und mehrere Objektkategorien abdecken, belegen die Effektivität, Skalierbarkeit und überlegene Leistung des vorgeschlagenen TS-Conv.
Stats
Die Lokalisierungsgenauigkeit wird durch den Generalized Intersection over Union (GIoU) [39] und den mittleren quadratischen Fehler (MSE) der Vorhersagen für die Seitenlängen der OBB gemessen.
Die Fläche des OBB im Verhältnis zur Fläche des umgebenden horizontalen Begrenzungsrahmens (HBB) wird ebenfalls als Maß für die Lokalisierungsgenauigkeit verwendet.
Quotes
"Eine Methode für die beliebig ausgerichtete Objekterkennung namens "Task-wise Sampling Convolutions" (TS-Conv) wird vorgeschlagen, die adaptiv aufgabenspezifische Merkmale aus entsprechenden empfindlichen Regionen abtastet und diese Merkmale zusammen ausrichtet, um eine dynamische Labelzuweisung für bessere Vorhersagen zu leiten."
"Um dieses Problem zu lösen, wird eine AOOD-Methode namens "Task-wise Sampling Convolutions" (TS-Conv) vorgeschlagen."