Core Concepts
事前学習済みのディフュージョンモデルを活用し、入力画像にクロームボールを挿入することで、効果的かつ一般化性の高いライト推定を実現する。
Abstract
本論文は、事前学習済みのディフュージョンモデルを活用し、入力画像にクロームボールを挿入することで、効果的かつ一般化性の高いライト推定を実現する手法を提案している。
主な手順は以下の通り:
入力画像からの深度マップを予測し、ControlNetを用いてStable Diffusion XLモデルにより、クロームボールを挿入する。
初期ノイズマップと生成されたクロームボールの外観の関係性を利用した反復的なインペインティングアルゴリズムを提案し、高品質で一貫性のあるクロームボールの生成を実現する。
LoRAを用いた微調整により、露出値の異なる複数のLDRクロームボールを生成し、HDRの環境マップを推定する。
提案手法は、既存手法と比較して、ベンチマークデータセットでの性能が高く、野生の画像に対しても優れた一般化性を示す。特に、クロームボールの高品質な生成と、HDR環境マップの推定が可能となっている。
Stats
入力画像から深度マップを予測し、ControlNetを用いて活用する。
反復的なインペインティングアルゴリズムにより、初期ノイズマップと生成されたクロームボールの外観の関係性を利用する。
LoRAを用いた微調整により、露出値の異なる複数のLDRクロームボールを生成し、HDRの環境マップを推定する。