Core Concepts
최적화 기반 장기 추적 방법을 개선하여 효율성과 강건성을 크게 향상시켰다.
Abstract
이 논문은 비디오 내 모든 픽셀을 효율적이고 강력하게 추적하는 새로운 최적화 기반 접근법을 제안한다. 기존의 최적화 기반 추적 기술인 OmniMotion은 최적화 시간이 너무 오래 걸려 실용적이지 않았다. 또한 OmniMotion은 랜덤 시드 선택에 민감해 수렴이 불안정했다.
이를 개선하기 위해 다음과 같은 기술을 도입했다:
국소적 공간-시간 특징 그리드와 비선형 보간 함수를 사용하는 새로운 가역 변형 네트워크 CaDeX++를 제안했다. 이를 통해 효율성과 표현력을 크게 향상시켰다.
모노크롬 깊이 추정을 활용해 장면 기하학을 표현하고, DINOv2 장기 의미 정보를 최적화 과정에 반영했다.
이를 통해 OmniMotion 대비 10배 이상 빠른 수렴 속도와 향상된 정확도 및 강건성을 달성했다.
Stats
제안 방식은 OmniMotion 대비 10배 이상 빠른 수렴 속도를 보였다.
제안 방식은 DAVIS 데이터셋에서 OmniMotion 대비 정확도가 향상되었다.
제안 방식은 RGB-Stacking 데이터셋에서 다른 피드포워드 방식들보다 우수한 성능을 보였다.
Quotes
"OmniMotion [34]은 금지적으로 긴 최적화 시간이 소요되어 실용적이지 않다."
"OmniMotion [34]은 랜덤 시드 선택에 민감해 수렴이 불안정하다."
"제안 방식은 OmniMotion [34] 대비 10배 이상 빠른 수렴 속도와 향상된 정확도 및 강건성을 달성했다."