이 논문은 확산 모델을 이용한 비디오 초해상도 기법을 제안한다. 기존 확산 모델 기반 초해상도 기법은 각 프레임을 독립적으로 처리하여 공간적 충실도와 시간적 일관성이 저하되는 문제가 있었다. 이를 해결하기 위해 저해상도 비디오로부터 공간 적응 및 시간적 일관성 학습을 수행한다.
구체적으로, 공간 적응 모듈(SFA)은 저해상도 비디오 특징을 이용하여 고해상도 프레임 특징을 픽셀 단위로 적응적으로 조절한다. 시간적 일관성 모듈(TFA)은 고해상도 비디오 특징 내 시간적 상호작용을 강화하고, 저해상도 비디오 특징과의 교차 주의 메커니즘을 통해 시간적 정렬을 수행한다. 이를 통해 고해상도 비디오 생성 시 공간적 충실도와 시간적 일관성을 향상시킨다.
실험 결과, 제안 기법인 SATeCo는 REDS4와 Vid4 데이터셋에서 기존 최신 기법 대비 우수한 성능을 보였다. 특히 사용자 선호도 평가에서도 높은 점수를 받아 제안 기법의 효과를 검증하였다.
Til et annet språk
fra kildeinnhold
arxiv.org
Viktige innsikter hentet fra
by Zhikai Chen,... klokken arxiv.org 03-26-2024
https://arxiv.org/pdf/2403.17000.pdfDypere Spørsmål