この論文は、イベントベースのオプティカルフロー推定とステレオマッチングを単一の統合モデルEMatchで解決する新しいフレームワークを提案しています。
従来のイベントベースビジョン研究では、時間的タスク(オプティカルフロー、オブジェクトトラッキングなど)と空間的タスク(ステレオマッチング、深度推定など)のいずれかに焦点が当てられており、両者の統合は試みられていませんでした。しかし、フロー推定とステレオマッチングはどちらも、密な対応マッチング問題として扱うことができます。
EMatchは、時間的再帰型ネットワーク(TRN)と空間的文脈アテンション(SCA)を用いて、初期イベントストリームを共通の表現空間にマッピングします。
TRNとSCAによって時間的および空間的に集約されたイベント特徴により、密な対応マッチングのための統合特徴マップが生成されます。この特徴マップを用いて、参照イベントストリームとターゲットイベントストリーム間で類似性を比較し、対応関係を特定することで、フローまたは視差を推定します。
DSECベンチマークを用いた実験により、EMatchはオプティカルフロー推定とステレオマッチングの両方において最先端の性能を達成することが示されました。また、EMatchはマルチタスク融合とクロスタスク転移にも優れており、単一の統合アーキテクチャ内で両方のタスクにおいて最先端の性能を達成しています。
EMatchは、イベントベースのオプティカルフロー推定とステレオマッチングを統合的に扱うことができる新しいフレームワークです。EMatchは、時間的および空間的知覚のギャップを埋め、モーションとステレオ推定の同時処理を可能にします。
לשפה אחרת
מתוכן המקור
arxiv.org
תובנות מפתח מזוקקות מ:
by Pengjie Zhan... ב- arxiv.org 11-25-2024
https://arxiv.org/pdf/2407.21735.pdfשאלות מעמיקות