공간-시간 비디오 초해상도(ST-VSR)는 비디오 프레임 보간(VFI)과 비디오 초해상도(VSR)를 통합한 문제이다. 기존 방법들은 이 두 문제를 독립적으로 다루었지만, 최근 연구는 이를 통합적으로 다루고자 한다.
기존 방법들은 정확한 움직임 추정 및 보상(MEMC)에 어려움을 겪는데, 특히 큰 움직임에 대해 성능이 저하된다.
본 논문은 ST-VSR 문제를 신경 연산자 학습 문제로 정의하여 접근한다. 저해상도 및 저프레임률 입력에서 풍부한 시공간 정보를 가진 고해상도 및 고프레임률 출력을 생성하는 매핑을 학습한다.
제안 방법은 Galerkin 타입 주의 메커니즘을 사용하여 효율적이고 정확한 MEMC를 수행한다. 이를 통해 큰 움직임에 대해서도 정확한 추정이 가능하다.
실험 결과, 제안 방법이 기존 최신 기법들을 모든 평가 지표에서 뛰어넘는 성능을 보인다. 특히 복잡한 움직임이 있는 데이터셋에서 큰 성능 향상을 보인다.
To Another Language
from source content
arxiv.org
Key Insights Distilled From
by Yuantong Zha... at arxiv.org 04-10-2024
https://arxiv.org/pdf/2404.06036.pdfDeeper Inquiries