本研究では、画像フレームとイベントデータを融合することで、高フレームレートでの任意点追跡を実現するFE-TAPを提案した。
まず、EvoFusionモジュールを設計し、異なる周波数の画像フレームとイベントデータを効果的に融合する。これにより、時間的な整列が不要で、両モダリティの長所を活かすことができる。
次に、トランスフォーマーベースのモジュールを用いて、点の軌跡を反復的に最適化する。これにより、点の軌跡の時空間的な関係性を捉え、滑らかな軌跡を生成できる。
実験の結果、提案手法はECデータセットで5%、EDSデータセットで24%のパフォーマンス向上を達成した。さらに、実際の走行シナリオでの検証でも、高速移動や複雑な背景に対する頑健性を示した。
Egy másik nyelvre
a forrásanyagból
arxiv.org
Mélyebb kérdések