本論文は、ポイントクラウドを使った単一物体追跡(3D SOT)の課題に取り組んでいる。
まず、疎なポイントクラウドを密な柱状表現に変換し、ピラミッド型のエンコーディングを行うPE-PFEを提案する。これにより、ポイントの特徴表現を強化し、ネットワークの最適化を促進する。
次に、画像ドメインのバックボーン設計がポイントクラウドに適していないことに着目し、モダリティ対応のトランスフォーマーベースのバックボーンを設計する。具体的には、早期の段階でより多くの計算リソースを割り当てることで、ポイントクラウドの幾何学的情報をより効果的に捉えられるようにする。
最後に、上記の設計を組み合わせたPillarTrackネットワークを構築する。KITTI及びnuScenesデータセットでの実験結果から、提案手法が高速かつ高精度な単一物体追跡を実現していることが示された。
إلى لغة أخرى
من محتوى المصدر
arxiv.org
الرؤى الأساسية المستخلصة من
by Weisheng Xu,... في arxiv.org 04-12-2024
https://arxiv.org/pdf/2404.07495.pdfاستفسارات أعمق