本論文は、単眼深度推定の性能を向上させるための手法を提案している。
主な内容は以下の通り:
大規模カーネル注意機構(LKA)を用いた深度ネットワークデコーダーを提案した。LKAは、2次元構造を維持しつつ長距離依存関係をモデル化し、チャンネル適応性も保持できる。これにより、詳細な深度情報を推定できる。
深度マップの詳細を正確に復元するためのアップサンプリングモジュールを導入した。従来の単純な補間手法では深度境界が不明瞭になるが、提案手法では高精度な深度マップを生成できる。
KITTI データセットで実験を行い、提案手法が既存手法と比べて優れた性能を示すことを確認した。特に、絶対相対誤差(AbsRel)が0.095、平均二乗誤差(RMSE)が4.148と良好な結果が得られた。
以上のように、本手法は単眼深度推定の精度を大幅に向上させることができる。
To Another Language
from source content
arxiv.org
Key Insights Distilled From
by Xuezhi Xiang... at arxiv.org 09-27-2024
https://arxiv.org/pdf/2409.17895.pdfDeeper Inquiries