核心概念
転移学習と時空間特徴を活用した効率的なビットレートラダー構築方法を提案する。
要約
ビデオ業界における高品質な映像提供の課題は、効率的なビットレートが重要。
伝統的な一般化されたビットレートラダー方式は非効率であり、コンテンツに適した決定を行うことが困難。
転移学習と時空間特徴を活用した新しいビットレートラダー予測手法を提案。
102のビデオシーンでのテストでは、計算量が94.1%削減され、1.71%のBD-Rate費用で実証された。
DNNアーキテクチャとモデリング手順
提案手法の全体的なワークフローはトレーニングおよびテスト段階で説明される。
ネットワークアーキテクチャには事前トレーニング済みのDNNから抽出された深層空間および時間特徴が含まれる。
ビットレートラダー予測ステップ
最適なラダーを見つけるために最高解像度から始める。
HQポイント(最高品質)を予測し、そのポイントを最上部ラングに使用する。
次の行を見つけるために解像度交差点を予測し、HQポイントと共に示す。
参考ビットレートラダー構築
PF内の2D速度品質スペースを探索し、参照ビットレートラダー(RL)を構築する。
多数のエンコード後、PFからCRF予測値が取得されてRLが構築される。
実験結果
CRF予測器のパフォーマンス評価やBDメトリックス評価が行われる。
HQポイント予測の影響や略奪研究も実施されている。
統計
102個のビデオシーンで94.1%削減された計算量。1.71% BD-Rate費用で実証。
引用
"Providing high-quality video with efficient bitrate is a main challenge in video industry."
"Machine learning has been used to reduce the computational cost of content-aware encoding."