본 논문은 텍스트 기반 포즈 비디오 편집이라는 새로운 개념을 제안한다. 기존 비디오 편집 기술은 속성, 배경, 스타일 등의 변경에 국한되었지만, 제안 방법인 ReimaginedAct는 비디오 내 인간 행동을 자유롭게 편집할 수 있다.
ReimaginedAct는 다음과 같은 과정으로 동작한다.
이를 위해 새로운 평가 데이터셋 WhatifVideo-1.0을 제공하며, 다양한 시나리오와 난이도 수준을 포함한다. 실험 결과, 제안 방법이 기존 방법 대비 우수한 성능을 보였다.
In un'altra lingua
dal contenuto originale
arxiv.org
Approfondimenti chiave tratti da
by Lan Wang,Vis... alle arxiv.org 03-13-2024
https://arxiv.org/pdf/2403.07198.pdfDomande più approfondite