Основные понятия
大規模ビジョンモデルを活用し、クロスモーダルマスクマッチングアルゴリズムを開発することで、様々な環境下でロバストかつ高精度なLiDAR-カメラ外部パラメータ推定を実現する。
Аннотация
本研究は、オンラインでターゲットフリーなLiDAR-カメラ外部パラメータ推定手法MIAS-LCECを提案している。
まず、仮想カメラを導入し、LiDARポイントクラウドの強度情報を投影することで、カメラ視点に近いLIP画像を生成する。次に、MobileSAMというState-of-the-Art(SoTA)の大規模ビジョンモデルを用いて、LIP画像とRGB画像の両方をセグメンテーションする。
その後、提案するクロスモーダルマスクマッチング(C3M)アルゴリズムを適用し、信頼性の高い対応点を生成する。最後に、得られた対応点をPnPソルバーの入力とすることで、外部パラメータを推定する。
提案手法は、様々な屋内外環境下、悪天候や照明条件下においても高いロバスト性と精度を示し、既存手法と比較して優れた性能を発揮する。特に、超広視野角のソリッドステートLiDARに対して顕著な改善が見られた。
また、提案手法は、オフラインのターゲットベース手法と同等の性能を達成できることも示された。
Статистика
LiDARポイントクラウドとRGB画像の対応点の再投影誤差は約1ピクセルである。
提案手法のオイラー角誤差は既存手法と比べて22-88%減少し、並進誤差は40-95%減少した。
提案手法の平均並進誤差は、既存手法よりも全てのデータセットで低い値を示した。
Цитаты
大規模ビジョンモデルを活用することで、様々な環境下でロバストかつ高精度なLiDAR-カメラ外部パラメータ推定を実現できる。
提案するクロスモーダルマスクマッチング(C3M)アルゴリズムにより、信頼性の高い対応点を生成できる。
提案手法は、オフラインのターゲットベース手法と同等の性能を達成できる。