核心概念
低解像度LiDARデータから高解像度LiDARポイントクラウドを効率的に再構築する新しい手法を提案する。
要約
本論文では、低解像度LiDARデータから高解像度LiDARポイントクラウドを効率的に再構築する新しい手法「TULIP」を提案している。
まず、LiDARデータをレンジ画像に変換し、Swin Transformerベースのネットワークを用いて2D空間でアップサンプリングを行う。レンジ画像の特性に合わせて、パッチサイズや注意機構のウィンドウ形状を最適化することで、従来手法よりも優れた性能を実現している。
具体的には以下の工夫を行っている:
1×4のパッチサイズを採用し、垂直方向の情報を保持しつつ水平方向を圧縮
長方形のウィンドウ形状を使うことで、遠距離の物体も適切に再構築
円形パディングを導入し、LiDARセンサモデルに整合した処理を実現
提案手法は、シミュレーションデータおよび実世界のKITTI、DurLARデータセットで評価され、従来手法を大きく上回る性能を示している。特に、物体間の境界を鮮明に再現し、ノイズの少ない高品質なポイントクラウドを生成できることが確認された。
統計
低解像度LiDARデータ(入力)の解像度は、垂直方向が16ライン、水平方向が1024ピクセルである。
高解像度LiDARデータ(出力)の解像度は、垂直方向が64ライン、水平方向が1024ピクセルである。