이 논문은 비디오 회의, 가상 현실 게임, 환자 건강 모니터링 등의 비디오 모션 전송 애플리케이션에서 대역폭 사용을 효율적으로 줄이는 방법을 제안한다.
키포인트 기반 비디오 표현을 사용하여 복잡한 모션을 모델링하고, 변분 순환 신경망(VRNN)을 이용해 키포인트를 예측한다. 예측된 키포인트를 광학 흐름 추정기와 생성기 네트워크를 통해 비디오 프레임으로 합성한다.
실험 결과, 제안된 VRNN 기반 키포인트 예측 방법이 기존 키포인트 기반 비디오 모션 전송 프레임워크 대비 최대 2배의 추가 대역폭 절감 효과를 보였다. 이는 비디오 품질을 크게 저하시키지 않으면서도 대역폭 사용을 크게 줄일 수 있음을 의미한다.
Vers une autre langue
à partir du contenu source
arxiv.org
Questions plus approfondies