본 논문은 텍스트 기반 포즈 비디오 편집이라는 새로운 개념을 소개한다. 기존 비디오 편집 기술은 속성, 배경, 스타일 등의 변경에 국한되었지만, 제안하는 방법은 비디오 내 인간 행동을 자유롭게 편집할 수 있다.
제안 방법인 ReimaginedAct는 다음과 같은 과정으로 구성된다:
이를 위해 새로운 평가 데이터셋 WhatifVideo-1.0을 제안하였다. 이 데이터셋은 다양한 시나리오와 난이도 수준의 비디오, 질문, 정답 비디오를 포함한다. 실험 결과, 제안 방법이 기존 방법들에 비해 우수한 성능을 보였다.
A otro idioma
del contenido fuente
arxiv.org
Ideas clave extraídas de
by Lan Wang,Vis... a las arxiv.org 03-13-2024
https://arxiv.org/pdf/2403.07198.pdfConsultas más profundas