본 논문은 텍스트 기반 포즈 비디오 편집이라는 새로운 개념을 소개한다. 기존 비디오 편집 기술은 속성, 배경, 스타일 등의 변경에 국한되었지만, 제안하는 방법은 비디오 내 인간 행동을 자유롭게 편집할 수 있다.
제안 방법인 ReimaginedAct는 다음과 같은 과정으로 구성된다:
이를 위해 새로운 평가 데이터셋 WhatifVideo-1.0을 제안하였다. 이 데이터셋은 다양한 시나리오와 난이도 수준의 비디오, 질문, 정답 비디오를 포함한다. 실험 결과, 제안 방법이 기존 방법들에 비해 우수한 성능을 보였다.
To Another Language
from source content
arxiv.org
Key Insights Distilled From
by Lan Wang,Vis... at arxiv.org 03-13-2024
https://arxiv.org/pdf/2403.07198.pdfDeeper Inquiries