Die Kernidee von TransPose ist, dass die Geometrie und Topologie von Punktwolken eine Anleitung für den Austausch globaler Informationen liefern können. Dazu entwerfen wir zunächst einen auf Graphkonvolutionsnetzwerken basierenden Featureextraktor, um lokale Merkmale effizient zu extrahieren. Um die lokalen Merkmale auch mit globalen Informationen anzureichern, nutzen wir dann den Transformer-Encoder. Darüber hinaus führen wir eine geometriebewusste Komponente als induktive Voreinstellung in den Transformer-Encoder ein, um den Austausch globaler Informationen eng mit der Punktwolkenaufgabe zu koppeln. Umfangreiche Experimente auf drei Benchmark-Datensätzen zeigen, dass unser Ansatz im Vergleich zu anderen Methoden, die nur RGB-D-Bilder verwenden, wettbewerbsfähige Ergebnisse erzielt.
לשפה אחרת
מתוכן המקור
arxiv.org
תובנות מפתח מזוקקות מ:
by Xiao Lin,Dem... ב- arxiv.org 04-02-2024
https://arxiv.org/pdf/2310.16279.pdfשאלות מעמיקות