Core Concepts
本研究では、ユーザーの過去の移動軌跡と周辺環境の視覚情報を活用し、ユーザーの将来の移動軌跡を確率的に予測する手法を提案する。
Abstract
本研究では、ユーザーの視点から見た周辺環境の情報を活用して、ユーザーの将来の移動軌跡を確率的に予測する手法を提案している。
過去の移動軌跡とカメラで撮影した視覚情報(RGB、深度、セマンティックセグメンテーション)を統合した「視覚メモリ」を生成し、これをディフュージョンモデルの入力とすることで、複数の可能性のある軌跡を生成することができる。
また、ハイブリッド生成手法を導入することで、高速な推論が可能となっている。
提案手法は、衝突回避性、滑らかさ、複数の可能性のある軌跡の生成といった観点で、既存手法を上回る性能を示している。
Stats
ユーザーの過去の移動速度と加速度の平均絶対誤差の合計は、滑らかさの指標として使用されている。
ユーザーの移動軌跡が障害物と衝突しない時間ステップの数が、衝突回避性の指標として使用されている。