본 논문은 텍스트 기반 포즈 비디오 편집이라는 새로운 개념을 제안한다. 기존 비디오 편집 기술은 속성, 배경, 스타일 등의 변경에 국한되었지만, 제안 방법인 ReimaginedAct는 비디오 내 인간 행동을 자유롭게 편집할 수 있다.
ReimaginedAct는 다음과 같은 과정으로 동작한다.
이를 위해 새로운 평가 데이터셋 WhatifVideo-1.0을 제공하며, 다양한 시나리오와 난이도 수준을 포함한다. 실험 결과, 제안 방법이 기존 방법 대비 우수한 성능을 보였다.
לשפה אחרת
מתוכן המקור
arxiv.org
תובנות מפתח מזוקקות מ:
by Lan Wang,Vis... ב- arxiv.org 03-13-2024
https://arxiv.org/pdf/2403.07198.pdfשאלות מעמיקות