이 논문은 사전 학습된 StyleGAN 모델을 활용하여 고품질의 풍경 시네마그래프를 자동으로 생성하는 방법을 제안합니다.
먼저, 입력 이미지를 StyleGAN의 잠재 공간과 특징 공간에 투영합니다. 이때 잠재 코드 뿐만 아니라 중간 특징을 함께 사용하여 원본 이미지의 세부 정보를 잘 보존할 수 있습니다.
다음으로, 입력 이미지를 정적 영역과 동적 영역으로 구분하는 마스크를 예측합니다. 이를 통해 정적 영역의 구조를 잘 보존할 수 있습니다.
그 다음, 모션 생성기를 사용하여 입력 이미지에 대한 모션 필드를 예측합니다. 이 모션 필드는 Euler 적분을 통해 미래 프레임의 변위 필드를 계산하는데 사용됩니다.
마지막으로, 사전 학습된 StyleGAN 모델에 다중 스케일 깊은 특징 워핑(MSDFW) 모듈을 추가하여 시네마그래프 프레임을 생성합니다. MSDFW는 StyleGAN의 중간 특징을 워핑하여 고품질의 시네마그래프를 생성할 수 있습니다.
제안 방법은 기존 시네마그래프 생성 방법들과 비교하여 정적 일관성과 모션 품질 측면에서 우수한 성능을 보였으며, 사용자 연구에서도 높은 선호도를 얻었습니다.
إلى لغة أخرى
من محتوى المصدر
arxiv.org
الرؤى الأساسية المستخلصة من
by Jongwoo Choi... في arxiv.org 03-22-2024
https://arxiv.org/pdf/2403.14186.pdfاستفسارات أعمق