핵심 개념
現実世界のSDRTV映像をHDRTVに変換する際、符号化アーティファクトの増幅が課題となる。本稿では、デュアル逆劣化タスク(ビデオ修復と逆トーンマッピング)として捉えた新しい手法DIDNetを提案し、アーティファクト抑制と高品質なHDRTV生成を両立させる。
초록
DIDNet: 現実世界のSDRTVからHDRTVへの変換のためのデュアル逆劣化ネットワーク
本論文は、現実世界の標準ダイナミックレンジテレビ(SDRTV)コンテンツを高ダイナミックレンジテレビ(HDRTV)コンテンツに変換する際に生じる、符号化アーティファクト増幅の問題 addressed する新しい手法を提案しています。
本研究は、現実世界のSDRTV映像をHDRTVに変換する際、符号化アーティファクトの増幅を抑えつつ、高品質なHDRTV映像を生成することを目的としています。
本論文では、DIDNetと呼ばれるデュアル逆劣化ネットワークを提案しています。DIDNetは、ビデオ修復と逆トーンマッピングという2つの逆劣化タスクを同時に学習することで、アーティファクトの抑制と高品質なHDRTV生成を両立させています。
DIDNetの主な構成要素
時間空間アライメント特徴融合モジュール(TSAF):複数フレームの情報を活用し、デフォーマブル畳み込みを用いることで、空間的なアライメントを行い、アーティファクトを除去します。
補助的な教師あり学習:高品質なSDRTVフレームを教師信号として用いることで、TSAFがアーティファクト除去とSDRTVフレームの品質向上を学習することを促進します。
特徴周波数強調モジュール(FFE):HDRTVがSDRTVよりも多くの高周波成分を含むことに着目し、ウェーブレットベースの注意機構を用いることで、高周波成分を強調し、HDRTVの視覚的な品質を向上させています。
デュアル変調逆トーンマッピングモジュール(DMITM):従来のグローバル特徴変調(GFM)の計算量が多いという問題 addressed するため、畳み込みカーネル変調とスケーリング変調を組み合わせた、より効率的かつ効果的なトーンマッピングを実現しています。
3D ConditionNet:複数フレームのSDRTVを入力とし、グローバルな色 prior を抽出することで、より正確な特徴変調ベクトルを推定し、フレーム間のジッターを軽減しています。