自動運転シーンにおける3D知覚のための効果的な方法として、LiDARセマンティックセグメンテーションにおける多モダリティ融合が証明されています。しかし、ほとんどの現在のLiDARセマンティックセグメンテーションパイプラインは複雑な融合機構を持っています。ポイントペイントは、LiDARポイントを視覚情報と直接結びつける非常に直感的な方法です。しかし、以前のポイントペイントのような手法は、カメラとLiDAR間の投影エラーに苦しんでいました。我々の実験では、この投影エラーがポイントペイントにおいて問題だとわかりました。その結果、私たちは深度認識型ポイントペイントメカニズムを提案しました。さらに、LiDARが意味的分割を行うための望ましい視覚特徴について詳しく見ています。Visual Information as Cueを上昇させることで、LVICはnuScenes LiDARセマンティックセグメンテーションベンチマークで1位を獲得します。
إلى لغة أخرى
من محتوى المصدر
arxiv.org
الرؤى الأساسية المستخلصة من
by Zichao Dong,... في arxiv.org 03-11-2024
https://arxiv.org/pdf/2403.05159.pdfاستفسارات أعمق