核心概念
提案されたContextual Spatial AttentionモジュールとSelective Recurrent Unitは、エッジとスムーズな領域の異なる周波数の情報をキャプチャするためにネットワークを支援します。
摘要
この論文では、新しいイテレーティブアップデートオペレータであるSRUを提案し、コンテキスト情報から抽出された注意マップによって情報を適応的に融合する能力を示しています。提案されたSelective-Stereoは、KITTI、ETH3D、およびMiddleburyのリーダーボードでほぼすべてのメトリックで1位を獲得しています。CSAモジュールが生成する異なる注意マップは、異なるネットワークで異なる傾向を示しており、その適応能力の反映です。また、SRUは事前定義された値によって制限されている受容野に直面していますが、メモリコストを削減するために軽量畳み込みと組み合わせて研究する方向性もあります。
統計資料
KITTI 2012 D1-all: 1.60%
KITTI 2015 2-noc: 1.70%
Middlebury Bad 2.0: 3.05%
ETH3D Bad 0.5: 1.65%
引述
"Our Selective-Stereo ranks 1st on KITTI, ETH3D, and Middlebury in almost all metrics among all published methods."
"We consistently improve the performance of these networks without introducing a significant increase in parameters and time."
"Our Selective-IGEV outperforms IGEV in detailed and weak texture regions."