Core Concepts
従来のビデオコーデックをニューラルネットワークベースの前処理器と後処理器で包み込むことで、2Dビデオコーデックを3Dビデオ圧縮に拡張することができる。この手法は、ハードウェアアップグレードなしで、従来のビデオコーデックを使用しながら、ビット レート効率を大幅に向上させることができる。
Abstract
本論文では、ステレオスコピックビデオ会議のための新しい圧縮方式を提案している。従来のビデオコーデックをニューラルネットワークベースの前処理器と後処理器で包み込むことで、2Dビデオコーデックを3Dビデオ圧縮に拡張することができる。
提案手法の主な特徴は以下の通り:
複雑な圧縮処理をハードウェアで効率的に実装されている標準ビデオコーデックに委ねることで、システムの効率性と高い圧縮率を両立できる。
前処理器と後処理器のニューラルネットワークが、ビューや信号モダリティ間の冗長性を削減し、帯域幅の圧迫を大幅に緩和する。
既存の標準化された3Dビデオコーデックとは異なり、ハードウェアの変更を必要としないため、低遅延かつ高いレート-歪み性能を実現できる。
実験結果では、提案手法がH.264やHEVCなどの従来のビデオコーデックと比べて、同等の画質で約29.3%のビットレート削減を達成できることを示している。また、合成データセットだけでなく、実撮影データセットでも良好な一般化性を示している。
Stats
提案手法はH.264ベースで29.3%、HEVCベースで27.1%のビットレート削減を達成した。
提案手法は合成データセットだけでなく、実撮影データセットでも良好な一般化性を示した。
Quotes
"従来のビデオコーデックをニューラルネットワークベースの前処理器と後処理器で包み込むことで、2Dビデオコーデックを3Dビデオ圧縮に拡張することができる。"
"提案手法は、ハードウェアの変更を必要とせずに、低遅延かつ高いレート-歪み性能を実現できる。"