Temel Kavramlar
DCVSMNet은 두 개의 작은 비용 볼륨을 사용하여 풍부한 매칭 정보를 저장하고 결합 모듈을 통해 정보를 융합하여 기존의 빠른 스테레오 매칭 네트워크보다 향상된 정확도와 일반화 능력을 달성하는 새로운 스테레오 매칭 네트워크입니다.
Özet
DCVSMNet: 이중 비율 볼륨 스테레오 매칭 네트워크 연구 논문 요약
참고: Mahmoud Tahmasebi, Saif Huq, Kevin Meehan, Marion McAfee (2024). DCVSMNet: Double Cost Volume Stereo Matching Network. arXiv:2402.16473v2
본 연구는 스테레오 매칭 작업에서 속도와 정확도를 모두 향상시키는 효율적인 딥러닝 기반 아키텍처인 DCVSMNet(Double Cost Volume Stereo Matching Network)을 제안합니다.
DCVSMNet은 두 개의 작은 비용 볼륨(상위 및 하위)을 사용하여 스테레오 이미지에서 깊이 정보를 추출합니다. 각 비용 볼륨은 그룹 와이즈 상관관계 또는 노름 상관관계와 같은 다른 방법을 사용하여 형성됩니다. 그런 다음 두 개의 병렬 3D 아워글래스 네트워크를 사용하여 이러한 볼륨을 개별적으로 처리합니다. 상위 및 하위 비용 볼륨에서 추출한 기하 정보를 융합하기 위해 결합 모듈이 제안됩니다. 두 병렬 집합 블록의 인코더 부분은 이 정보를 융합하기 전에 더 미세하고 자세한 기능으로 인코딩합니다. 그런 다음 집합 블록의 디코더 부분 내의 여러 척도에서 정제된 정보를 융합하여 네트워크가 스테레오 장면의 세부 구조를 학습하도록 합니다. 마지막으로 상위 및 하위 분기 출력의 합계를 회귀하여 최종 disparity 맵을 추정합니다.