本研究では、動画の長さや動きの特性に依存せずに安定した動画超解像を実現するための手法を提案している。
まず、動画の長さや動きの特性によって動画超解像の性能が大きく変化することを実験的に確認した。これは、RNNの隠れ状態が動画の特性に応じて変化するためである。
そこで本手法では、RNNの隠れ状態を動画特性に応じて変化させながら学習する手法を提案した。具体的には、動画クリップから得られた隠れ状態を効率的に再利用しながら学習を行う手法(Partial-Initialization BPTT)と、入力動画のフレーム数を条件付けることで超解像の難易度に応じた処理を行う手法を提案した。
実験の結果、提案手法は従来手法よりも長短様々な動画に対して安定した超解像性能を発揮することが示された。また、提案手法は学習コストの増加を抑えつつ高い性能を実現できることも確認された。
Vers une autre langue
à partir du contenu source
arxiv.org
Questions plus approfondies