본 연구는 비디오 예측 문제에 대해 상태 공간 모델 기반의 접근법을 제안한다. 기존 연구들은 비결정적 동작 예측의 어려움으로 인해 정적 배경과 동적 객체를 구분하지 않고 전체 프레임을 예측하는 방식을 사용했다.
이에 반해 본 연구는 비디오 프레임 생성을 비결정적 외관 예측과 확률적 동작 예측으로 분해한다. 외관 예측 부분은 배경의 결정적 변화를 다루며, 동작 예측 부분은 동적 객체의 불확실한 움직임을 다룬다.
또한 조건부 프레임에서 장기 동작 추세를 추론하여 미래 프레임 생성 시 일관성을 높인다. 실험 결과 본 모델이 다양한 데이터셋에서 우수한 성능을 보였다.
Till ett annat språk
från källinnehåll
arxiv.org
Djupare frågor