AnyV2V는 비디오 편집 프로세스를 두 단계로 분리한다:
첫 번째 단계에서 AnyV2V는 다양한 이미지 편집 모델(InstructPix2Pix, InstantID 등)을 활용할 수 있어 광범위한 비디오 편집 작업을 지원한다. 기존 텍스트 프롬프트 기반 편집 방식 외에도 참조 이미지 기반 스타일 전이, 주체 기반 편집, 정체성 조작 등 새로운 비디오 편집 작업을 수행할 수 있다.
두 번째 단계에서 AnyV2V는 DDIM 역변환과 중간 특징 주입을 통해 소스 비디오의 외형과 동작을 유지하며 편집된 비디오를 생성한다.
AnyV2V는 기존 접근법 대비 프롬프트 정렬 35%, 사용자 선호도 25% 향상을 보였으며, 새로운 3가지 편집 작업에서도 높은 성공률을 달성했다. 빠르게 발전하는 이미지 편집 모델과의 호환성을 통해 AnyV2V는 다양한 사용자 요구에 부응할 수 있을 것으로 기대된다.
Til et andet sprog
fra kildeindhold
arxiv.org
Vigtigste indsigter udtrukket fra
by Max Ku,Cong ... kl. arxiv.org 03-22-2024
https://arxiv.org/pdf/2403.14468.pdfDybere Forespørgsler