核心概念
ユーザーの視聴パターンとQoE選好の多様性に対応するため、アンサンブル学習と表現学習を用いた、汎用性の高いニューラル適応型没入ビデオストリーミングシステム「MANSY」を提案する。
要約
MANSY: アンサンブル学習と表現学習を用いた、汎用性の高いニューラル適応型没入ビデオストリーミング
本論文では、ユーザーの視聴パターンとQoE選好の多様性という課題に対処し、汎用性の高い没入ビデオストリーミングシステムを実現することを目的とする。
視聴パターンの多様性に対応するため、多重ビューポート軌道入出力(MTIO)アーキテクチャとTransformerに基づくビューポート予測モデルを設計する。MTIOアーキテクチャは、複数の入力ヘッドと出力ヘッドを用いることで、暗黙的なアンサンブル学習を実現し、計算コストを抑えながら予測バイアスを低減する。Transformerベースのバックボーンは、注意機構を用いることで長期的な依存関係を効果的に学習し、ビューポート移動の傾向をより正確に予測する。
QoE選好の多様性に対応するため、表現学習を用いてDRLビットレート選択モデルを学習する。具体的には、相互情報量を報酬関数に組み込むことで、ユーザーのQoE選好から有用な潜在表現を抽出できるようにモデルを学習させる。これにより、学習時に観測されなかったQoE選好にも対応できるようになり、汎用性が向上する。また、相互情報量の直接計算が困難であるため、報酬計算のために相互情報量項を推定する効率的なNNモデルを設計する。