본 논문은 텍스트 기반 포즈 비디오 편집이라는 새로운 개념을 제안한다. 기존 비디오 편집 기술은 속성, 배경, 스타일 등의 변경에 국한되었지만, 제안 방법인 ReimaginedAct는 비디오 내 인간 행동을 자유롭게 편집할 수 있다.
ReimaginedAct는 다음과 같은 과정으로 동작한다.
이를 위해 새로운 평가 데이터셋 WhatifVideo-1.0을 제공하며, 다양한 시나리오와 난이도 수준을 포함한다. 실험 결과, 제안 방법이 기존 방법 대비 우수한 성능을 보였다.
To Another Language
from source content
arxiv.org
Key Insights Distilled From
by Lan Wang,Vis... at arxiv.org 03-13-2024
https://arxiv.org/pdf/2403.07198.pdfDeeper Inquiries