Core Concepts
VRNNを使用したキーポイント予測により、ビデオモーション転送アプリケーションの帯域効率が向上します。
Abstract
著者らは、動的オブジェクトを表すFOMMを使用して、キーポイントベースの表現とVRNNによる予測を組み合わせて、ビデオフレームの合成を実証しました。
VRNNによるキーポイント予測は、既存の手法よりも2倍の追加帯域削減を可能にしました。
データセットごとに異なる3つの異なるデータセットで提案されたアーキテクチャが実証されました。
1. 導入
需要増大に伴い、ビデオ会議や仮想現実ゲームなどのアプリケーションで動画転送技術が重要性を増しています。
2. 関連研究
ピクセルおよび高レベル特徴空間でのビデオ予測方法が検討されています。
キーポイントベースの動画転送モデルがバンド幅節約に成功しています。
3. 提案パイプライン
FOMM内でキーポイント予測を適用し、VRNNとVAEによる予測を行いました。
キーポイント予測とビデオ合成パイプライン全体が図示されています。
Stats
VRNNは既存手法よりも2倍以上の追加帯域削減を実現しました。
Quotes
"Across all datasets, our results consistently demonstrate the superior performance of VRNN in video prediction."