核心概念
夜間画像を昼間画像に変換する際、照明劣化の分離と劣化認識型コントラスト学習を用いることで、より高品質で意味構造を保持した画像を生成できる。
本論文は、夜間画像を昼間画像に変換する、夜間から昼間への画像変換 (Night2Day) における新たな手法であるN2D3 (Night to Day via Degradation Disentanglement) を提案している。この手法は、夜間画像に存在する様々な劣化パターンを分離し、劣化を考慮した形で画像変換を行うことで、従来手法よりも高品質で意味構造を保持した昼間画像を生成することを目的とする。
研究の背景
夜間画像は、昼間画像と比較して、暗さ、照明むら、ハイライト、光のにじみなど、様々な劣化が生じやすい。これらの劣化は、人間の視覚認識だけでなく、物体検出やセグメンテーションなどのコンピュータビジョンタスクにとっても大きな課題となる。夜間画像を昼間画像に変換することで、夜間における視認性を向上させ、様々なタスクの精度向上に貢献できる。
従来手法の問題点
従来のNight2Day手法では、CycleGANやCUTなど、画像変換技術を用いて夜間画像から昼間画像への変換を試みてきた。しかし、これらの手法は、夜間画像に存在する複雑な劣化を考慮せずに一様に処理を行うため、変換後の画像にアーティファクトが発生したり、意味構造が適切に保持されないなどの問題があった。
N2D3 の提案
N2D3は、これらの問題を解決するために、物理に基づいた劣化分離モジュールと、劣化を考慮したコントラスト学習モジュールを導入している。
劣化分離モジュール
まず、夜間環境における物理的な特性を考慮し、Kubelka-Munk理論に基づいた測光モデルを構築する。このモデルを用いることで、夜間画像における照明分布を分析し、暗部、適切な照明領域、ハイライト領域、光の影響領域の4つの領域に画像を分離する。特に、光の影響領域は、適切な照明領域と輝度レベルが類似しているため、従来の輝度情報のみを用いた分離手法では困難であった。N2D3では、測光モデルから導出される色不変量を用いることで、光の影響領域を効果的に分離することを可能にしている。
劣化を考慮したコントラスト学習モジュール
次に、分離された各劣化領域に対して、それぞれ異なる重み付けを行いながらコントラスト学習を行う。具体的には、生成された昼間画像のパッチと、元の夜間画像の対応するパッチとの間の相互情報を最大化するように学習する。この際、各劣化領域におけるパッチの重要度に応じて重み付けを行うことで、より意味構造を保持した画像生成が可能となる。
実験結果
BDD100KおよびAlderleyの2つの公開データセットを用いて、N2D3の有効性を検証した。その結果、FIDスコアやSIFTスコアなどの評価指標において、従来手法を上回る性能を達成し、視覚的にもより高品質な昼間画像を生成できることが確認された。また、セマンティックセグメンテーションなどの下流タスクにおいても、N2D3を用いることで精度が向上することが示された。
結論
本論文では、夜間画像から昼間画像への変換において、劣化の分離と劣化認識型コントラスト学習を用いることで、より高品質で意味構造を保持した画像を生成できることを示した。
統計
BDD100KデータセットでFIDスコアが5.4向上
AlderleyデータセットでFIDスコアが10.3向上、SIFTスコアが4.52向上
BDD100Kデータセットを用いたセマンティックセグメンテーションで、夜間画像に直接推論する場合と比較して、mIoUが5.95向上