核心概念
標準的なRGBカメラを搭載した移動ロボットを使用して、注意ベースのニューラルネットワークを活用することで、マンハッタン環境における隠れた人物の2D軌跡を正確に推定する。
摘要
本研究では、標準的なRGBカメラを搭載した移動ロボットを使用して、動的な非視線内(NLOS)追跡を行う新しいデータ駆動型アプローチを提案している。従来のNLOSイメージング手法は、静止カメラや専用の検出器を使用しており、動的な環境での適用が困難であった。
提案手法の主な特徴は以下の通り:
- 平面抽出パイプラインにより、移動カメラから得られる複数の中継壁の中から、最大のNLOS情報を持つ平面を選択する。
- 注意機構を備えたトランスフォーマーベースのニューラルネットワークを使用し、異なるアスペクト比を持つ複数の平面を同時に処理することで、NLOS追跡の精度を向上させる。
- 合成データと実世界データを組み合わせて学習を行い、動的な環境でも高精度な追跡を実現する。
実験結果では、提案手法が既存の受動型NLOS手法を大きく上回る性能を示しており、平均位置RMSE 15.94 mmを達成している。また、カメラの急激な動きにも頑健であることを確認した。本手法は、救助活動やペデストリアン検知など、様々なNLOSアプリケーションに応用可能である。
統計資料
隠れた人物の2D位置の平均二乗誤差(RMSE)は15.94 mm
隠れた人物の2D速度の平均二乗誤差(RMSE)は1.38 mm/s