Core Concepts
潜在的拡散モデルを利用してネラーフ補完を行う際の課題を解決し、高品質な補完結果を生成する。
Abstract
本研究では、ネラーフ補完の問題に取り組んでいる。ネラーフ補完とは、入力画像に対してマスクを適用し、マスク領域を高品質に補完したネラーフを推定する課題である。
具体的には以下の2つの課題に取り組んでいる:
2Dの潜在的拡散モデルを用いて入力画像を補完すると、3D的な不整合が生じ、ブラーや霧のような不自然な外観が生じる。
潜在的拡散モデルによる補完結果と元の画像の間にテクスチャのずれが生じ、最終的なネラーフ補完結果にアーティファクトが現れる。
これらの課題に対して以下の手法を提案している:
マスク付きの敵対的学習を導入し、ネラーフ描画結果と潜在的拡散モデルによる補完結果の整合性を高める。
1つのシーンに特化した潜在的拡散モデルのファインチューニングを行い、シーン依存の高品質な補完結果を生成する。
提案手法は、既存手法と比較して定量的・定性的に優れた補完結果を生成できることを示している。
Stats
入力画像とマスクを用いて高品質な補完ネラーフを生成できる。
補完領域の高周波成分を保持し、元の領域との違和感のない結果が得られる。