AnyV2V는 비디오 편집 프로세스를 두 단계로 분리한다:
첫 번째 단계에서 AnyV2V는 다양한 이미지 편집 도구를 활용할 수 있어 광범위한 비디오 편집 작업을 지원한다. 기존 텍스트 프롬프트 기반 편집 방식 외에도 참조 이미지 기반 스타일 전이, 주체 기반 편집, 정체성 조작 등의 새로운 비디오 편집 작업을 수행할 수 있다.
두 번째 단계에서 AnyV2V는 DDIM 역변환과 중간 특징 주입을 통해 소스 비디오의 외관과 동작 일관성을 유지한다. 텍스트 프롬프트 기반 편집에서 AnyV2V는 이전 최고 접근법보다 프롬프트 정렬 35%, 사용자 선호도 25% 향상을 보였다. 새로운 3가지 작업에서도 AnyV2V는 높은 성공률을 달성했다.
AnyV2V는 빠르게 발전하는 이미지 편집 방법을 원활하게 통합할 수 있어 다양한 사용자 요구에 부응할 수 있을 것으로 기대된다.
Naar een andere taal
vanuit de broninhoud
arxiv.org
Belangrijkste Inzichten Gedestilleerd Uit
by Max Ku,Cong ... om arxiv.org 03-22-2024
https://arxiv.org/pdf/2403.14468.pdfDiepere vragen