본 논문은 텍스트 기반 포즈 비디오 편집이라는 새로운 개념을 소개한다. 기존 비디오 편집 기술은 속성, 배경, 스타일 등의 변경에 국한되었지만, 제안하는 방법은 비디오 내 인간 행동을 자유롭게 편집할 수 있다.
제안 방법인 ReimaginedAct는 다음과 같은 과정으로 구성된다:
이를 위해 새로운 평가 데이터셋 WhatifVideo-1.0을 제안하였다. 이 데이터셋은 다양한 시나리오와 난이도 수준의 비디오, 질문, 정답 비디오를 포함한다. 실험 결과, 제안 방법이 기존 방법들에 비해 우수한 성능을 보였다.
To Another Language
from source content
arxiv.org
Ключові висновки, отримані з
by Lan Wang,Vis... о arxiv.org 03-13-2024
https://arxiv.org/pdf/2403.07198.pdfГлибші Запити