核心概念
本稿では、少量のターゲットドメインデータと既存のソースドメインデータを用いて、クロスドメイン画像ノイズ除去を実現する適応ドメイン学習(ADL)スキームを提案する。
要約
書誌情報
Qian, Z., Qi, C., Law, K. L., Fu, H., Lei, C., & Chen, Q. (2024). Adaptive Domain Learning for Cross-domain Image Denoising. Advances in Neural Information Processing Systems, 38. arXiv:2411.01472v1 [cs.CV]
研究目的
異なるカメラセンサーで撮影された画像のノイズ除去を、限られた量のターゲットドメインデータを用いて効果的に行うことを目的とする。
方法論
- 異なるセンサーからの既存のRAW画像ノイズ除去データセット(ソースドメイン)と、新しいセンサーからの少量のデータ(ターゲットドメイン)を組み合わせて、新しいセンサー用のノイズ除去モデルを学習する適応ドメイン学習(ADL)スキームを提案する。
- ソースドメイン内の、ターゲットドメインのモデルの微調整に有害なデータ(ドメインギャップが大きいため、学習時に追加するとパフォーマンスが低下するデータ)を自動的に削除する。
- センサー固有の情報(センサーの種類やISO感度)を入力として受け取り、画像ノイズ除去のための入力データを理解するための変調モジュールを導入する。
- 提案手法を、スマートフォンやデジタル一眼レフカメラで撮影された様々な公開データセットを用いて評価する。
主な結果
- 提案手法は、ターゲットドメインセンサーからの少量の画像データを用いて、クロスドメイン画像ノイズ除去において従来手法を上回る性能を示した。
- 提案するADLは、既存のノイズキャリブレーションモデルをクロスドメインデータで微調整して、その性能をさらに向上させることができる。
結論
- 提案するADLスキームは、新しいセンサーからの少量のデータを用いて、既存のRAW画像ノイズ除去データセットから有用な情報を活用し、不要なデータを削除することで、クロスドメイン画像ノイズ除去を実現する効果的な手法である。
- カスタマイズされた変調戦略により、ネットワークが異なるセンサーやノイズ分布に適応することができる。
意義
本研究は、限られたデータで高性能なクロスドメイン画像ノイズ除去を実現する新しい道を切り開き、実用的な画像処理アプリケーションに貢献するものである。
限界と今後の研究
- 提案手法は、ノイズの種類や程度が大きく異なる場合、性能が低下する可能性がある。
- 今後の研究では、より複雑なノイズモデルや、より広範なセンサータイプに対応できるよう、手法を拡張する必要がある。
統計
ターゲットドメインのデータ量は、ソースドメインのデータ量の約100分の1と非常に少ない。
提案手法は、MZSRと転移学習ベースラインと比較して、それぞれ平均0.71dB、0.39dBの性能向上を示した。
ELDデータセットとSIDデータセットのPSNR値は、SIDDデータセットのPSNR値よりもはるかに低い。これは、ELDデータセットとSIDデータセットが、ノイズレベルが高く、シーンがSIDDデータセットよりもはるかに複雑な、極端に暗い環境で撮影されたためである。