본 논문은 순환 신경망 기반 비디오 초해상도 모델의 안정성 향상을 위한 방법을 제안한다.
먼저, 비디오 길이와 동적 특성에 따라 비디오 초해상도 성능이 달라지는 것을 확인하였다. 이는 학습 시 사용되는 짧은 비디오 클립과 추론 시 사용되는 긴 비디오 간의 도메인 갭으로 인한 것으로 분석되었다.
이를 해결하기 위해 제안하는 방법은 다양한 비디오 속성에 따른 은닉 상태를 학습하는 것이다. 이를 통해 비디오 길이와 동적 특성에 관계없이 안정적인 초해상도 성능을 달성할 수 있다.
또한 계산 비용을 줄이기 위해 학습 과정에서 은닉 상태를 재사용하는 방법을 제안하였다. 더불어 프레임 수 조건화를 통해 학습 안정성을 추가로 향상시켰다.
실험 결과, 제안 방법은 다양한 길이와 동적 특성을 가진 비디오에서 기존 방법보다 우수한 성능을 보였다.
Para outro idioma
do conteúdo fonte
arxiv.org
Principais Insights Extraídos De
by Hiroshi Mori... às arxiv.org 03-26-2024
https://arxiv.org/pdf/2403.15832.pdfPerguntas Mais Profundas