CalibFormer ist ein neuartiger Ansatz zur automatischen Kalibrierung von LiDAR und Kamera. Das Netzwerk besteht aus drei Hauptkomponenten:
Merkmalsextraktionsmodul: Hier werden hochauflösende Merkmalsrepräsentationen aus den Kamera- und LiDAR-Daten extrahiert, indem eine erweiterte Version der Deep Layer Aggregation (DLA) verwendet wird.
Merkmalsabgleichmodul: Ein mehrkopfiges Korrelationsmodul berechnet die Korrelation zwischen den Merkmalen der beiden Modalitäten auf feinkörnige Weise, um die Zuordnung zwischen den Sensordaten zu verbessern.
Transformer-basiertes Parameterschätzungsmodul: Ein Swin-Transformer-Encoder und ein Transformer-Decoder werden eingesetzt, um die Korrelationsmerkmale effektiv zu verarbeiten und die Translations- und Rotationsparameter genau zu schätzen.
Die Experimente auf dem KITTI-Datensatz zeigen, dass CalibFormer eine mittlere Translationsabweichung von 0,8751 cm und eine mittlere Rotationsabweichung von 0,0562° erreicht, was die Leistung anderer state-of-the-art-Methoden übertrifft. Darüber hinaus demonstriert das Netzwerk eine hohe Robustheit und Generalisierungsfähigkeit.
翻譯成其他語言
從原文內容
arxiv.org
深入探究