本研究は、自動運転車両のLiDARポイントクラウドの自己教師あり学習に取り組んでいる。
まず、単一モダリティ(ポイントクラウドのみ)、クロスモダリティ(画像とポイントクラウド)、マルチモダリティ(前2者の組み合わせ)の3つのモダリティを比較検討し、クロスモダリティが最も優れた性能を示すことを明らかにした。
次に、ポイントクラウドの特性に合わせて、インスタンス認識と類似性バランシングを考慮した対照学習ユニットを提案した。具体的には、初期の対照学習ユニットを一様にサンプリングし、幾何クラスタリングによってインスタンスを発見する。さらに、画像特徴の類似性に基づいて、セマンティックに近い対照学習ユニットを除外することで、より効果的な対照学習を実現する。
提案手法は、Waymo Open Dataset、nuScenes、SemanticKITTI、ONCEなどの4つの主要ベンチマークにおいて、3D物体検出や3Dセマンティックセグメンテーションなどの下流タスクで顕著な性能向上を示した。
Til et annet språk
fra kildeinnhold
arxiv.org
Viktige innsikter hentet fra
by Mu Cai, Chen... klokken arxiv.org 09-12-2024
https://arxiv.org/pdf/2409.06827.pdfDypere Spørsmål