Der Artikel präsentiert eine neuartige Methode für die kategoriebasierte 6D-Objektposenschätzung, die als "Instance-Adaptive and Geometric-Aware Keypoint Learning" (AG-Pose) bezeichnet wird.
Die Kernidee besteht darin, eine Reihe von adaptiven Keypoints zu verwenden, um die geometrischen Informationen verschiedener Instanzen zu repräsentieren. Dazu werden zwei Schlüsselkomponenten eingeführt:
Instance-Adaptive Keypoint Detection (IAKD): Dieses Modul kann adaptiv Keypoints für verschiedene Instanzen erkennen, um deren geometrische Strukturen darzustellen. Es verwendet lernbare Abfragen, die an die Objektmerkmale angepasst werden, um Keypoint-Heatmaps zu erzeugen. Zusätzlich werden Verluste eingeführt, um eine gleichmäßige Verteilung der Keypoints auf der Objektoberfläche zu fördern.
Geometric-Aware Feature Aggregation (GAFA): Dieses Modul integriert die lokalen und globalen geometrischen Informationen effizient in die Keypoint-Merkmale. Es aggregiert Merkmale von benachbarten Punkten unter Verwendung relativer Positionseinbettungen, um lokale Geometrie zu erfassen. Zusätzlich werden globale Merkmale und relative Positionseinbettungen zwischen Keypoints integriert, um globale Geometrie zu berücksichtigen.
Die Kombination dieser beiden Module ermöglicht es dem Modell, robuste Keypoint-Korrespondenzen für die Posenschätzung auf unbekannten Instanzen zu etablieren.
Die Experimente auf den Datensätzen CAMERA25 und REAL275 zeigen, dass der vorgeschlagene AG-Pose-Ansatz den Stand der Technik deutlich übertrifft, ohne kategoriebasierte Formpriors zu verwenden.
לשפה אחרת
מתוכן המקור
arxiv.org
תובנות מפתח מזוקקות מ:
by Xiao Lin,Wen... ב- arxiv.org 03-29-2024
https://arxiv.org/pdf/2403.19527.pdfשאלות מעמיקות