Główne pojęcia
Eine leichtgewichtige und effiziente Methode zur Erkennung von Objekten mit beliebiger Ausrichtung, die nur mit Einzelpunkt-Annotationen trainiert wird. Die Methode kombiniert Wissen aus synthetischen visuellen Mustern und nutzt Selbstüberwachung durch Transformationen, um die Größe und den Winkel realer Objekte zu schätzen.
Streszczenie
Die Studie präsentiert eine neue Methode namens Point2RBox, die eine effiziente Lösung für die Erkennung von Objekten mit beliebiger Ausrichtung (Oriented Object Detection, OOD) unter Verwendung von Einzelpunkt-Annotationen darstellt.
Kernpunkte:
- Point2RBox ist ein End-to-End-Ansatz, der direkt die Vorhersage von Objekten mit beliebiger Ausrichtung (Rotated Bounding Boxes, RBoxes) aus Einzelpunkt-Annotationen lernt. Dies ist effizienter als zweistufige Ansätze wie Point-to-HBox-to-RBox.
- Der Schlüssel ist die Kombination von Wissen aus synthetischen visuellen Mustern, um die Größe und den Winkel realer Objekte zu schätzen. Dabei werden die Merkmale um die annotierten Punkte auf die synthetischen Muster mit bekannten Bounding Boxes übertragen.
- Zusätzlich wird Selbstüberwachung durch Transformationen (Rotation, Skalierung, Spiegelung) eingesetzt, um die relative Größe und Rotation zwischen Objekten wahrzunehmen.
- Umfangreiche Experimente zeigen, dass Point2RBox die Leistung von Zwei-Stufen-Alternativen deutlich übertrifft und mit State-of-the-Art-Methoden vergleichbare Ergebnisse erzielt, obwohl es sich um einen Einzelpunkt-überwachten Ansatz handelt.
Statystyki
Die Kosten für die Annotation von Rotated Bounding Boxes (RBoxes) sind etwa 36,5% höher als für Horizontal Bounding Boxes (HBoxes) und 104,8% höher als für Einzelpunkt-Annotationen.
Point2RBox erzielt auf dem DOTA-v1.0-Datensatz eine durchschnittliche Präzision (AP50) von 40,27%, was deutlich über dem zweistufigen Ansatz P2BNet+H2RBox-v2 (21,87%) liegt.
Auf dem DIOR-Datensatz erreicht Point2RBox 27,34% AP50 und auf dem HRSC-Datensatz 79,40% AP50.
Cytaty
"Point2RBox ist die erste End-to-End-Lösung für die Einzelpunkt-überwachte Erkennung von Objekten mit beliebiger Ausrichtung."
"Point2RBox verwendet ein leichtgewichtiges Paradigma, erreicht aber dennoch eine wettbewerbsfähige Leistung unter den Einzelpunkt-überwachten Alternativen."