本論文は、低照度画像の強化に関する新しい手法を提案している。主な内容は以下の通り:
CLIPの視覚言語情報と周波数領域のウェーブレット拡散を組み合わせることで、低照度画像の質と視覚的な印象を大幅に改善する。
多段階の視覚言語ガイダンスネットワークを設計し、画像特徴と言語特徴の整合性を段階的に高めることで、効果的な特徴整合を実現する。
ウェーブレット変換とフーリエ変換を組み合わせた高周波知覚モジュールを提案し、拡散モデルの多様性を抑制しながら、画像の詳細情報を効果的に復元する。
定量的・定性的な実験結果から、提案手法が既存の最先端手法を大きく上回る性能を示すことが確認された。特に、視覚的な印象の改善が顕著である。
To Another Language
from source content
arxiv.org
Principais Insights Extraídos De
by Minglong Xue... às arxiv.org 04-18-2024
https://arxiv.org/pdf/2401.03788.pdfPerguntas Mais Profundas