Kernekoncepter
OnlyFlow는 보조 비디오에서 추출한 광학 흐름을 활용하여 텍스트 프롬프트와 입력 비디오의 모션을 모두 따르는 사실적인 비디오를 생성하는 새로운 모션 기반 비디오 생성 모델입니다.
Resumé
OnlyFlow: 광학 흐름 기반 모션 컨디셔닝을 통한 비디오 확산 모델
본 논문에서는 텍스트 프롬프트와 입력 비디오의 모션을 모두 따르는 사실적인 비디오를 생성하는 새로운 모션 기반 비디오 생성 모델인 OnlyFlow를 제안합니다. OnlyFlow는 보조 비디오에서 추출한 광학 흐름을 활용하여 비디오 확산 모델의 모션을 조절합니다.
OnlyFlow 프레임워크: OnlyFlow는 입력 비디오에서 광학 흐름을 추출하여 학습 가능한 광학 흐름 인코더에 입력합니다. 인코더는 다양한 스케일에서 모션 특징을 추출하여 비디오 생성을 위한 3D U-Net 구조의 디노이징 확산 모델의 어텐션 레이어에 주입합니다.
광학 흐름 컨디셔닝: OnlyFlow는 입력 보조 비디오의 광학 흐름을 사용하여 비디오 생성을 제어합니다. 광학 흐름은 프레임 간 픽셀 변위를 설명하며, 모션 특징 추출 및 주입을 통해 생성된 비디오에 통합됩니다.
실험 결과: OnlyFlow는 다양한 비디오 생성 작업에서 최첨단 방법과 비교하여 긍정적인 결과를 보여줍니다. 정량적, 정성적 및 사용자 선호도 연구를 통해 OnlyFlow가 텍스트 정렬, 모션 충실도 및 시간적 일관성 측면에서 우수한 성능을 보여줍니다.