Core Concepts
본 연구는 동적 장면에서 일관된 스테레오 매칭을 달성하기 위해 양방향 정렬 메커니즘을 개발하였다. 이를 통해 지역적으로는 인접 프레임의 정보를 활용하고 전역적으로는 전체 시퀀스의 일관성을 활용할 수 있다.
Abstract
본 논문은 동적 스테레오 매칭 문제를 다룬다. 최근 딥러닝 기반 스테레오 매칭 방법들은 정확도, 효율성, 강건성 면에서 큰 발전을 이루었지만, 비디오 시퀀스에서의 일관된 깊이 추정은 여전히 과제로 남아있다.
제안하는 BiDAStereo 프레임워크는 다음과 같은 핵심 구성요소를 가진다:
삼중 프레임 상관관계 층(TFCL): 인접 프레임들을 양방향으로 정렬하여 비용 볼륨을 구축함으로써 지역적 시간 정보를 활용한다.
동작 전파 순환 유닛(MRU): 인접 프레임의 동작 특징을 양방향으로 정렬하고 융합하여 전체 시퀀스의 일관성을 활용한다.
실험 결과, 제안 방법은 다양한 벤치마크에서 최신 기술 대비 우수한 성능을 보였으며, 특히 동적 장면에서의 시간적 일관성이 크게 향상되었음을 확인할 수 있다.
Stats
동적 장면에서 제안 방법이 기존 방법 대비 13.1% 더 나은 시간적 일관성을 보였다.
제안 방법은 Sintel final 데이터셋에서 TEPE 지표 기준 36.1% 향상된 성능을 달성했다.
Quotes
"동적 장면에서 제안 방법이 기존 방법 대비 13.1% 더 나은 시간적 일관성을 보였다."
"제안 방법은 Sintel final 데이터셋에서 TEPE 지표 기준 36.1% 향상된 성능을 달성했다."