Core Concepts
입체 매칭 네트워크의 성능을 향상시키기 위해 픽셀별 적응형 다중 모달 확률 분포 모델링을 통한 새로운 크로스 엔트로피 손실 함수를 제안한다.
Abstract
이 논문은 입체 매칭 네트워크의 성능 향상을 위한 새로운 손실 함수를 제안한다. 기존 연구에서는 단일 모달 확률 분포를 가정하였지만, 이는 특히 경계 픽셀에서 과도한 평활화 및 정렬 오류를 야기한다. 이에 저자들은 픽셀별 적응형 다중 모달 확률 분포 모델링 기법을 제안한다.
먼저 각 픽셀 주변의 디스패리티 값들을 클러스터링하여 다중 모달을 추출한다. 이후 각 모달의 가중치를 지역 구조 정보에 기반하여 결정하여 최종 혼합 라플라시안 분포를 구성한다. 이를 크로스 엔트로피 손실 함수에 적용하여 네트워크 학습을 수행한다.
또한 다중 모달 출력을 효과적으로 처리하기 위한 우세 모달 디스패리티 추정기를 제안한다. 실험 결과, 제안 방법은 기존 방법 대비 KITTI 벤치마크에서 최신 성능을 달성하였으며, 도메인 일반화 및 희소 지도 감독에서도 우수한 성능을 보였다.
Stats
경계 픽셀의 약 60%가 다중 모달 분포를 가진다.
제안 방법은 단일 모달 손실 대비 KITTI 2015에서 D1 지표 약 0.5% 향상을 달성했다.
제안 방법은 20% 희소 지도 감독에서도 단일 모달 방법 대비 약 10% 성능 향상을 보였다.
Quotes
"대부분의 경계 픽셀은 다중 모달 분포를 가진다."
"단일 모달 분포 가정은 경계 픽셀에서 과도한 평활화 및 정렬 오류를 야기한다."
"적응형 다중 모달 확률 분포 모델링은 네트워크 학습을 효과적으로 안내할 수 있다."